Configurare set di dati esterni
Questa pagina descrive un passaggio facoltativo per configurare set di dati esterni per il deployment di Data Foundation di Cortex Framework. Alcuni casi d'uso avanzati potrebbero richiedere set di dati esterni per integrare un sistema di record aziendale. Oltre alle piattaforme di scambio esterne utilizzate da Analytics Hub, alcuni set di dati potrebbero richiedere metodi personalizzati o personalizzati per importare i dati e unirli ai modelli di generazione di report.
Per attivare i seguenti set di dati esterni, imposta k9.deployDataset
su True
se vuoi che il set di dati venga disegnato.
Configura i grafici diretti aciclici (DAG) per i set di dati esterni supportati volgendo i seguenti passaggi:
Calendario delle festività: questo DAG recupera le date speciali da PyPi Holidays.
- Modifica l'elenco dei paesi, l'elenco degli anni e altri parametri DAG per recuperare le festività in
holiday_calendar.ini
.
- Modifica l'elenco dei paesi, l'elenco degli anni e altri parametri DAG per recuperare le festività in
Tendenze: questo DAG recupera l'interesse nel tempo per un insieme specifico di termini da Tendenze della Ricerca Google. I termini possono essere configurati in
trends.ini
.- Dopo un primo passaggio, modifica
start_date
in'today 7-d'
intrends.ini
. - Acquisisci familiarità con i risultati provenienti dai diversi termini per regolare i parametri.
- Consigliamo di suddividere gli elenchi di grandi dimensioni in più copie di questo DAG in esecuzione in momenti diversi.
- Per ulteriori informazioni sulla libreria di base utilizzata, consulta Pytrends.
- Dopo un primo passaggio, modifica
Meteo: per impostazione predefinita, questo DAG utilizza il set di dati di test
BigQuery-public-data.geo_openstreetmap.planet_layers
disponibile pubblicamente. La query si basa anche su un set di dati NOAA disponibile solo tramite Analytics Hub:noaa_global_forecast_system
.Questo set di dati deve essere creato nella stessa regione degli altri set di dati prima di eseguire il deployment. Se i set di dati non sono disponibili nella tua regione, puoi continuare con le seguenti istruzioni per trasferire i dati nella regione scelta:
- Vai a BigQuery Analytics Hub.
- Fai clic su Ricerca schede.
- Cerca NOAA Global Forecast System.
- Fai clic su Aggiungi set di dati al progetto.
- Quando richiesto, mantieni
noaa_global_forecast_system
come nome del set di dati. Se necessario, modifica il nome del set di dati e della tabella nelle clausole FROM inweather_daily.sql
. - Ripeti la ricerca della scheda per il set di dati
OpenStreetMap Public Dataset
. - Modifica le clausole
FROM
contenenti:BigQuery-public-data.geo_openstreetmap.planet_layers
inpostcode.sql
.
Approfondimenti su sostenibilità ed ESG: Cortex Framework combina i dati sul rendimento dei fornitori SAP con approfondimenti ESG avanzati per confrontare in modo più olistico il rendimento, la sostenibilità e i rischi di esecuzione delle operazioni globali. Per saperne di più, consulta l'origine dati Dun & Bradstreet.
Considerazioni generali
Analytics Hub è supportato solo nelle sedi dell'UE e degli Stati Uniti e alcuni set di dati, come la previsione globale del NOAA, sono offerti solo in una singola località multipla.
Se scegli come target una località diversa da quella disponibile per il set di dati richiesto, ti consigliamo di creare una query pianificata per copiare i nuovi record dal set di dati collegato di Analytics Hub, seguita da un servizio di trasferimento per copiare i nuovi record in un set di dati situato nella stessa località o regione del resto del deployment. Poi devi modificare i file SQL.
Prima di copiare questi DAG in Cloud Composer, aggiungi i moduli Python richiesti come dipendenze:
Required modules: pytrends~=4.9.2 holidays