Configurar conjuntos de dados externos
Esta página descreve uma etapa opcional para configurar conjuntos de dados externos para a implantação da Fundação de Dados do Cortex Framework. Alguns casos de uso avançados podem exigir conjuntos de dados externos para complementar um sistema empresarial de registro. Além das trocas externas consumidas pelo Analytics Hub, alguns conjuntos de dados podem precisar de métodos personalizados ou adaptados para consumir dados e combiná-los com os modelos de relatórios.
Para ativar os seguintes conjuntos de dados externos, defina k9.deployDataset
como True
se quiser que o conjunto de dados seja implantado.
Configure os grafos acíclicos dirigidos (DAGs, na sigla em inglês) para os conjuntos de dados externos compatíveis seguindo estas etapas:
Calendário de feriados:este DAG recupera as datas especiais do PyPi Holidays.
- Ajuste a lista de países, a lista de anos e outros parâmetros de DAG
para extrair feriados em
holiday_calendar.ini
.
- Ajuste a lista de países, a lista de anos e outros parâmetros de DAG
para extrair feriados em
Tendências: esse DAG recupera o interesse ao longo do tempo para um conjunto específico de termos das tendências da Pesquisa Google. Os termos podem ser configurados em
trends.ini
.- Após uma execução inicial, ajuste o
start_date
para'today 7-d'
emtrends.ini
. - Familiarize-se com os resultados provenientes dos diferentes termos para ajustar os parâmetros.
- Recomendamos particionar listas grandes em várias cópias desse DAG executadas em momentos diferentes.
- Para mais informações sobre a biblioteca usada, consulte Pytrends.
- Após uma execução inicial, ajuste o
Clima: por padrão, esse DAG usa o conjunto de dados de teste
BigQuery-public-data.geo_openstreetmap.planet_layers
, disponível publicamente. A consulta também depende de um conjunto de dados da NOAA disponível apenas pelo Analytics Hub:noaa_global_forecast_system
.Esse conjunto de dados precisa ser criado na mesma região que os outros conjuntos de dados antes da execução da implantação. Se os conjuntos de dados não estiverem disponíveis na sua região, siga as instruções abaixo para transferir os dados para a região escolhida:
- Acesse o Analytics Hub do BigQuery.
- Clique em Pesquisar fichas.
- Pesquise NOAA Global Forecast System.
- Clique em Adicionar conjunto de dados ao projeto.
- Quando solicitado, mantenha
noaa_global_forecast_system
como o nome do conjunto de dados. Se necessário, ajuste o nome do conjunto de dados e da tabela nas cláusulas FROM emweather_daily.sql
. - Repita a pesquisa de listagem para o conjunto de dados
OpenStreetMap Public Dataset
. - Ajuste as cláusulas
FROM
que contêm:BigQuery-public-data.geo_openstreetmap.planet_layers
empostcode.sql
.
Insights de sustentabilidade e ESG: o Cortex Framework combina dados de desempenho do fornecedor SAP com insights avançados de ESG para comparar desempenho de entrega, sustentabilidade e riscos de forma mais holística em operações globais. Para mais informações, consulte a fonte de dados da Dun & Bradstreet.
Considerações gerais
O Analytics Hub só é aceito em locais da UE e dos EUA, e alguns conjuntos de dados, como a previsão global da NOAA, só são oferecidos em um único local.
Se você estiver segmentando um local diferente do disponível para o conjunto de dados necessário, recomendamos criar uma consulta programada para copiar os novos registros do conjunto de dados vinculado ao Analytics Hub, seguido de um serviço de transferência para copiar esses novos registros para um conjunto de dados localizado no mesmo local ou região que o restante da sua implantação. Em seguida, ajuste os arquivos SQL.
Antes de copiar esses DAGs para o Cloud Composer, adicione os módulos Python necessários como dependências:
Required modules: pytrends~=4.9.2 holidays