Página "Detalhes do job"

No Cloud Dataprep by TRIFACTA® INC., você usa a página "Detalhes do job" para explorar detalhes sobre jobs bem-sucedidos ou com falha, incluindo saídas, dependências e outros metadados. Faça o download dos resultados para o computador local ou, se estiver ativado, explore um perfil visual dos dados nos resultados para ter mais iteração em sua receita.

  • Visualizar job de fluxo de dados: visualize o job que foi executado no Cloud Dataflow.

  • Exportar dependências como um fluxo: faça o download da receita de execução e todas as dependências dela como um fluxo autossuficiente.

Guia Visão geral

Na guia "Visão geral", é possível revisar o status, as origens e os detalhes da execução do job.

OBSERVAÇÃO: se o job falhou, uma mensagem de erro pode ser exibida indicando um código do job diferente do listado. Esse código se refere ao subjob que faz parte do job listado no Resumo do job.

Figura: guia Visão geral

É possível analisar um instantâneo dos resultados de seu job.

  • Para revisar a receita e as dependências em seu job, clique em Ir para etapas e dependências. Veja a guia Dependências abaixo.
  • Se você optou por criar um perfil dos resultados do job, clique em Ir para perfil para analisar. Consulte a guia Perfil abaixo.
    • Um perfil visual fornece um instantâneo gráfico dos resultados de um job de transformação bem-sucedido para todo o conjunto de dados e colunas individuais no conjunto de dados.
    • Para mais informações sobre a ativação de um job de perfil visual, consulte a página Executar job.
    • Para mais informações, consulte Visão geral do perfil dos "Recursos Visuais".
  • Para visualizar o job que foi executado, clique em Visualizar job de fluxo de dados.

Também é possível analisar as saídas geradas como resultado de seu job.

    • Para analisar e exportar qualquer um dos resultados gerados, clique em Visualizar resultados. Consulte a guia Destinos de saídas abaixo.

Resumo do job:

  • Código do job: identificador exclusivo do job

  • Status do job: status atual do job:
    • Queued:: o job foi colocado na fila para execução.
    • Running:: o job está em andamento.
    • Completed: o job foi executado com sucesso.

      OBSERVAÇÃO: as etapas inválidas em um roteiro são ignoradas, e mesmo assim é possível executar o job com sucesso.

    • Canceled:: o job foi cancelado pelo usuário.

      Failed: o job não foi concluído.

      OBSERVAÇÃO: é possível executar novamente um job com falha na página Transformer. Se você modificou a receita desde então, essas alterações são aplicadas durante a segunda execução. Consulte a página Transformer.

  • Fluxo: nome do fluxo que deu origem à execução do job. Clique no link para abrir o fluxo. Consulte a página Visualização do fluxo.
  • Saída: nome do objeto de saída que foi usado para definir os resultados gerados. Clique no link para abrir a saída. Consulte a página Visualização do fluxo.
  • Modelo do Dataflow: clique em Procurar para revisar o trabalho no Cloud Dataflow.

    Conforme necessário, é possível executar o job novamente no Cloud Dataflow. Clique em Copiar para a área de transferência. Para mais informações, consulte Executar o job no Cloud Dataflow.

Resumo da execução:

  • Tipo de job: o método de execução do job:
  • Usuário: o usuário que iniciou o trabalho
  • Ambiente: onde aplicável, é exibido o ambiente em execução o trabalho foi executado
  • Hora de início: carimbo de data/hora de quando o processamento começou no job. Esse valor pode não corresponder a quando o job foi colocado em fila para execução
  • Hora de conclusão: o carimbo de data/hora de quando o processamento terminou no job, de maneira bem-sucedida ou não
  • Última atualização: o carimbo de data/hora de quando o job foi atualizado pela última vez
  • Duração: tempo decorrido da execução do job

Guia Destinos de saída

Se o trabalho foi concluído com sucesso, é possível revisar o conjunto de saídas geradas e exportar os resultados.

Figura: guia Destinos de saída

Ações:

Para cada saída, é possível:

  • Visualizar detalhes: veja os detalhes sobre a saída gerada na barra lateral.
  • Visualizar no Google Cloud Storage: veja os resultados no Google Cloud Storage. Consulte Navegador do Google Cloud Storage.


  • Fazer o download do resultado: faça o download da saída gerada para o computador local.

    OBSERVAÇÃO: pode não ser possível fazer o download de alguns formatos de arquivo para o computador. Veja abaixo.

  • Criar conjunto de dados importado: use a saída gerada para criar um novo conjunto de dados importado para usar nos seus fluxos. Veja abaixo.

Download direto de arquivos

Clique em um dos links fornecidos para fazer o download do arquivo por meio do navegador para o computador local.

OBSERVAÇÃO: se essas opções não estiverem disponíveis, o download dos dados pode ter sido desativado por um administrador.

Criar um conjunto de dados importado

Como opção, você pode transformar os resultados gerados em novos conjuntos de dados para uso imediato no Cloud Dataprep by TRIFACTA INC.. Para o resultado gerado, selecione Criar um conjunto de dados importado no menu de contexto.

OBSERVAÇÃO: quando você cria um novo conjunto de dados dos resultados do seu job, o arquivo ou os arquivos gravados no local de saída designado são usados como origem. Dependendo das permissões de armazenamento de dados de back-end configuradas, esse local pode não estar acessível a outros usuários.

Após a gravação do novo resultado, é possível criar novas receitas a partir dele. Consulte Criar sequência de conjuntos de dados.

Guia Perfil

Revise o perfil visual de seus resultados gerados na guia "Perfil". O perfil visual pode auxiliar na identificação de problemas em seu conjunto de dados que exijam mais atenção, incluindo valores discrepantes.

OBSERVAÇÃO: esta guia é exibida somente se você optou por criar um perfil dos resultados na definição do job. Veja a página Executar job.

Figura: guia Perfil

Especificamente, preste atenção aos valores incompatíveis e a contagens de valores ausentes, que identificam a porcentagem aproximada dos valores afetados em todo o conjunto de dados. Para mais informações, consulte Visão geral do perfil dos "Recursos Visuais".

OBSERVAÇÃO: o custo de cálculo para gerar as medições exatas dos perfis visuais em grandes conjuntos de dados em perfis visuais interativos afeta o desempenho gravemente. Como resultado, os perfis visuais de um conjunto inteiro de dados representam aproximações estatisticamente significativas.

OBSERVAÇÃO: o Cloud Dataprep by TRIFACTA® trata os valores nulos como valores ausentes. Os valores importados nulos são gerados como ausentes nos resultados do job (representados na barra cinza). Consulte Gerenciar valores nulos.

Dica: passe o mouse sobre as barras coloridas para ver as contagens de valores na categoria.

Dica: use a barra de rolagem horizontal para ver os perfis de todas as colunas em conjuntos de dados amplos.

Na seção inferior, explore os detalhes das transformações nas colunas individuais. Use esta área para explorar elementos de dados incompatíveis ou ausentes nas colunas individuais.

Dependendo do tipo de dados da coluna, as informações exibidas variam. Para mais informações, consulte Referência de estatísticas de coluna.

Dica: revise as informações de tipo de cada coluna, que são indicadas pelo ícone à esquerda da coluna.

Guia Dependências

Nessa guia, revise uma representação simplificada do fluxo que originou a execução do job. Essa exibição de fluxo mostra apenas as receitas e os conjuntos de dados que contribuíram para os resultados gerados.

Dica: para abrir o fluxo completo, é possível clicar no nome dele no canto superior esquerdo.

Figura: guia Dependências

Ações de receita:

Fazer o download da receita: faça o download do texto da receita em Wrangle.

Exibir Wrangle/linguagem natural: alternar a exibição entre linguagem bruta e linguagem legível.

Guia Fontes de dados

Na guia "Fontes de dados", é possível revisar todas as fontes de dados da receita em execução.

Figura: guia Fontes de dados

Guia Parâmetros

Se o conjunto de dados importado for um conjunto de dados com parâmetros, o estado dos parâmetros no momento da execução do job poderá ser revisado.

OBSERVAÇÃO: essa guia será exibida somente se o job for originado de um conjunto de dados com parâmetros. Para mais informações, consulte Criar conjunto de dados com parâmetros.

Um conjunto de dados com parâmetros permite parametrizar as fontes de entrada em um único conjunto de dados importado. Para mais informações, consulte Visão geral da parametrização.

Figura: guia "Parâmetros"

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.