Corrigir problemas de dependência

Sempre que possível, as mudanças feitas em um conjunto de dados ou receita se propagam para os conjuntos que o consomem. Os conjuntos de dados que se agregam, unem ou fazem pesquisa no seu conjunto de dados provavelmente serão afetados se você excluir colunas ou linhas ou modificar os dados. Em alguns casos, as receitas desses conjuntos de dados dependentes podem deixar de funcionar.

Nesta seção, descrevemos como identificar esses problemas de dependência e incluímos etapas gerais para corrigi-los.

Como identificar

Conjuntos de dados dependentes

Ao fazer edições em uma receita, verifique se as alterações podem afetar outras receitas ou conjuntos de dados de referência que dependem dela. Na página "Transformer", clique na lista suspensa ao lado do nome do conjunto de dados atual para abrir o Navegador de receitas. Selecione a guia "Visualização de fluxo".

Dica: se o conjunto de dados atual estiver conectado aos exibidos à direita, esses conjuntos de dados dependerão do atual. Depois de fazer alterações no atual, use o navegador de roteiros para abrir roteiros e conjuntos de dados que estejam conectados a ele e à direita dele, na visualização de fluxo.

Consulte Navegador de roteiros.

Integrações de dados inválidos

Quando você faz algumas mudanças em uma receita ou um conjunto de dados upstream, as receitas de qualquer conjunto de dados downstream podem deixar de funcionar, impedindo que você consiga resultados satisfatórios. Na receita downstream, você pode ver erros no painel "Receita", conforme mostrado a seguir:

Figura: erro de dependência no painel "Receita"

Na figura acima, a coluna Day não existe no conjunto de dados atual, o que está causando problemas nas últimas duas etapas do roteiro. Esses tipos de erros podem ser gerados quando uma coluna no conjunto de dados upstream é descartada ou renomeada.

Etapas:

  1. Abra o objeto em que a coluna foi descartada:
    1. Se a receita ou o conjunto de dados for do mesmo fluxo, será possível usar o "Navegador de Receitas" na página "Transformer". Veja Navegador de receitas.
    2. Se a receita ou o conjunto de dados estiver em um fluxo diferente, use a página Fluxos para localizá-los (REF_CAL.txt no exemplo acima). Veja a página Fluxos.
  2. Na guia "Exibição de fluxo", abra o conjunto de dados referenciado na mensagem de erro.
  3. No painel "Receita", localize a etapa em que a coluna foi removida.

  4. Corrija o problema. Os detalhes são mostrados a seguir.

Interrupções ocultas

Se você fizer alterações em valores específicos em um conjunto de dados, as etapas da receita em conjuntos de dados downstream poderão deixar de funcionar se dependerem da detecção de valores específicos. Dependendo do uso, a etapa pode não deixar de funcionar, mas os resultados gerados podem ser incorretos.

Por exemplo, uma receita de conjunto de dados downstream inclui a seguinte etapa:

Nome da transformação Filter rows when value is exactly
Parâmetro: condição Is exactly
Parâmetro: coluna company_name
Parâmetro: valor 'My Co.'
Parâmetro: ação Delete matching rows

Se a coluna company_name for recebida de outro conjunto de dados e o valor My Co. for alterado para My Company, o conjunto de dados downstream que inclui essa transformação não será invalidado de maneira facilmente perceptível. Os dados simplesmente não serão removidos do conjunto de dados e de quaisquer resultados gerados.

Como corrigir dependências

Quando você localiza um problema de dependência no conjunto de dados upstream, pode corrigi-lo realizando um dos seguintes métodos:

  1. Corrija o problema no conjunto de dados de origem. Verifique se a mudança não afeta outros conjuntos de dados.

    OBSERVAÇÃO: se você corrigir o problema no conjunto de dados de origem, é importante verificar se qualquer outro conjunto de dados downstream será afetado por essa alteração.

  2. Altere o conjunto de dados de entrada para usar um que não seja inválido.

    Dica: se for necessário congelar os dados no conjunto de dados que você está usando como entrada, você poderá criar uma cópia do conjunto de dados como um instantâneo. Consulte a Página de detalhes do conjunto de dados.

    Para usar a cópia, repare ou recrie a integração usando a versão copiada.

  3. Corrija o problema no conjunto de dados que depende dele. Nesse caso, é necessário redefinir a transformação que captura os dados.
Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.