Página "Exibição de fluxo"

Na página "Flow View", você pode acessar e gerenciar todos os objetos no fluxo. Para cada conjunto de dados importado, receita ou conjunto de dados escrito em Wrangle no fluxo, você pode executar uma variedade de ações para gerenciar eficazmente o desenvolvimento de fluxo e a execução do trabalho em uma única página.

Figura: página "Flow View"

Os conjuntos de dados importados no fluxo ou conjuntos de dados escritos em Wrangle adicionados ao fluxo estão listados no lado esquerdo da tela. Uma ou mais receitas podem ser associadas a cada conjunto de dados importado. Elas são usadas para transformar os dados de origem em conjuntos de dados escritos em Wrangle.

  • Para começar a trabalhar com uma receita importada, selecione-a e clique em Adicionar nova receita. Uma nova receita vazia será associada ao banco de dados. Para abrir na página "Transformer", clique no ícone da receita e selecione Editar receita. Consulte a página "Transformer".
  • Quando criados, esses objetos estão conectados entre si por linhas que fluem entre eles e que mostram as relações entre os objetos do fluxo.
  • Para qualquer conjunto de dados, os objetos dos quais ele depende são exibidos à esquerda do objeto em uma das linhas que fluem a partir do conjunto de dados.

    Dica: quando você executa um trabalho de um conjunto de dados escrito em Wrangle, todas as etapas das receitas dos conjuntos de dados anteriores são executadas como parte do job, e apenas os resultados por terminal do conjunto de dados escrito em Wrangle são gerados.

    • No exemplo acima, o conjunto de dados POS-01 é dependente de todos os objetos no fluxo, enquanto o conjunto de dados REF_CAL depende apenas da receita e do conjunto de dados importado REF_CAL.txt.

    • Os outros conjuntos de dados foram integrados ao conjunto de dados POS-01 e ainda não tiveram uma receita ou conjunto de dados escrito em Wrangle criado para eles.

  • Para mais informações sobre estes objetos, consulte Visão geral do objeto.

Selecione um objeto do fluxo para abrir o painel específico do objeto no lado direito da tela.

Dica: você pode clicar com o botão direito do mouse em qualquer objeto na Visualização de fluxo para ver a lista de ações disponíveis que aparecem ao selecioná-lo e escolher no painel à direita.

Dica: clique duas vezes em qualquer receita para abri-la juntamente com o conjunto de dados escrito em Wrangle associado. Consulte a página "Transformer".


Ações:

Adicionar conjuntos de dados: adicione novos conjuntos de dados ao fluxo. Veja os detalhes abaixo.

Adicionar programação: para adicionar uma execução programada das receitas no fluxo, basta seguir estas etapas:

  1. Defina o horário programado e o intervalo de execução no nível do fluxo. Consulte a Caixa de diálogo "Adicionar programação".
    1. Depois de criar a programação, você pode revisá-la, editá-la ou exclui-la por meio do ícone de relógio.
  2. Defina as configurações de publicação para cada conjunto de dados escrito em Wrangle que você deseja executar no horário programado. Consulte Visualização para conjuntos de dados escritos em Wrangle abaixo.

Fazer uma cópia: crie uma cópia do fluxo para outro usuário.

OBSERVAÇÃO: o fluxo copiado é independente do fluxo de origem, mas os conjuntos de dados de origem originais estão conectados.

Editar nome e descrição: altere o nome e a descrição do fluxo. Disponível apenas para o proprietário do fluxo.

Excluir: exclua o fluxo. Disponível apenas para o proprietário do fluxo.

A exclusão de um fluxo remove todos os conjuntos de dados escritos em Wrangle contidos nele. Se as cópias desses conjuntos de dados existem em outros fluxos, elas não são tocadas. Os conjuntos de dados importados não são excluídos por esta ação.

Adicionar conjuntos de dados ao fluxo

Na página "Flow View", você pode adicionar ao fluxo conjuntos de dados importados ou escritos em Wrangle. Esses conjuntos de dados são adicionados como objetos independentes no fluxo e podem ser juntados, unidos ou referenciados por outros conjuntos de dados no fluxo.

Figura: adicionar conjuntos de dados ao fluxo atual

  1. Procure ou selecione o conjunto de dados a adicionar.
    1. Use os controles de exibição de página para navegar por outros conjuntos de dados ou selecione a guia apropriada para filtrar a lista para conjuntos de dados escritos em Wrangle ou importados.
    2. Para importar novos conjuntos de dados de origens externas, clique em Import Datasets. Consulte a página "Import Dataset".
  2. Quando tiver feito suas seleções, clique em Add.
  3. O conjunto de dados é adicionado como um novo objeto na visualização de fluxo.

Visualização para conjuntos de dados importados

Ao selecionar um conjunto de dados importado, você pode visualizar os dados contidos nele, substituir o objeto de origem e muito mais usando o painel do lado direito.

Figura: visualização do conjunto de dados importado

Campos-chave:

CampoDescrição
Data Preview

Na janela "Data Preview", você pode ver uma pequena seção dos dados contidos no conjunto de dados importado. Esta janela pode ser útil para verificar se você está vendo os dados apropriados.

Dica: clique na visualização para abrir uma caixa de diálogo maior, em que você pode selecionar e copiar dados.

TipoIndica onde os dados são obtidos ou o tipo de arquivo.
Tamanho do arquivoTamanho do arquivo. As unidades podem variar.
LocalCaminho para a localização do conjunto de dados importado.

Ações:

AçãoDescrição
Substituir

Substitua a origem atual por uma nova para o conjunto de dados importado. Você pode alternar qualquer conjunto de dados no fluxo, desde que tenha outra receita que apareça após ele no fluxo.

OBSERVAÇÃO: essa ação remove o conjunto de dados importado e todas as conexões (extremidades) dele. O substituto precisa ser reconectado com qualquer objeto downstream.

OBSERVAÇÃO: se a origem trocada não tiver o mesmo esquema que a original, as etapas da receita no fluxo atual e qualquer fluxo que use o conjunto de dados importado poderão ser quebrados.

Para mais informações, consulte Caixa de diálogo Alterar conjunto de dados.

Adicionar nova receitaCrie uma nova receita e um conjunto de dados escrito em Wrangle a partir do conjunto de dados importado. Esta combinação de receita e conjunto de dados é independente da original.
Editar nome e descrição…Altere o nome e a descrição do conjunto de dados importado.
Remover a estrutura...Se etapas de estruturação tiverem sido aplicadas ao conjunto de dados importado durante a importação, você poderá optar por remover essas etapas. O conjunto de dados é convertido em um conjunto de dados bruto. Não são aplicadas etapas de estruturação.
Remover

Remova o conjunto de dados importado do fluxo.

OBSERVAÇÃO: qualquer receita e conjunto de dados escrito em Wrangle que usam o conjunto de dados importado também são removidos. Na caixa de diálogo "Remove Dataset", clique em Details para revisar o conjunto de dados importado.

Mais detalhesConsulte a página "Dataset Details".

Visualização para receitas

Para cada receita, você pode revisar ou editar suas etapas ou criar novas receitas completamente.

Figura: visualização da receita

Campos-chave:

CampoDescrição
Steps PreviewVisualize as primeiros etapas na receita.
StepsContagem total das etapas na receita.

Ações:

AçãoDescrição
Editar receitaAbra a receita e comece a editar. Consulte a página "Transformer".
Alterar entrada

Altere o conjunto de dados de entrada associado à receita.

OBSERVAÇÃO: essa ação substitui apenas a entrada principal de uma receita, o que não inclui conjuntos de dados integrados a partir de junções, uniões, pesquisas ou outras opções de conjuntos de dados múltiplos.

Fazer uma cópia

Crie uma cópia da receita e um novo conjunto de dados escrito em Wrangle. Você pode criar a cópia com as mesmas entradas ou sem entradas.

A receita copiada é de propriedade do usuário que a copiou.

Mover…Mova a receita para um fluxo diferente ou crie um novo fluxo para contê-la.
Excluir

Exclua a receita.

Esta etapa não pode ser desfeita.

Visualização para conjuntos de dados escritos em Wrangle

Figura: visualização do conjunto de dados escrito em Wrangle

Campos-chave:

CampoDescrição
Visualização de dados

Na janela "Data Preview", você pode ver uma pequena seção dos dados contidos no conjunto de dados escrito em Wrangle. Esta janela pode ser útil para verificar se você está vendo os dados apropriados.

Dica: clique na visualização para abrir uma caixa de diálogo maior, em que você pode selecionar e copiar dados.

TamanhoContagem de colunas e tipos de dados no conjunto de dados escrito em Wrangle.
ExecutadoContagem de jobs em que o conjunto de dados escrito em Wrangle foi usado. Clique no link para verificar detalhes. Consulte a Página "Detalhes do conjunto de dados".

Ações:

AçãoDescrição
Editar receitaEdite a receita do conjunto de dados escrito em Wrangle. Consulte a página "Transformer".
Executar job

Inicie um job para o conjunto de dados escrito em Wrangle, suas receitas e todos os conjuntos de dados precedentes.

Consulte a página "Executar job".

Adicionar nova receitaCrie uma nova receita e um conjunto de dados escrito em Wrangle a partir do conjunto de dados escrito em Wrangle. Esta combinação de receita e conjunto de dados é independente da original.
Editar nome e descrição…Altere o nome e a descrição do conjunto de dados escrito em Wrangle. Disponível apenas para o proprietário do fluxo.
Mais detalhesRevise os detalhes sobre os fluxos em que o conjunto de dados é usado.

Guia "Configurações de publicação"

Figura: guia "Configurações de publicação"

Destinos:

Quando você clica no botão Executar job, esses destinos são preenchidos por padrão na especificação do trabalho.

Destinos programados:

Quando uma execução agendada do fluxo é acionada, esses destinos são preenchidos com os resultados. Se algum conjunto de dados escrito em Wrangle de entrada estiver ausente, o job não será executado.

OBSERVAÇÃO: colaboradores de fluxo não podem modificar destinos de publicação.

Para mais informações sobre como especificar esses destinos, consulte Página "Executar job".

Visualização para conjuntos de dados referenciados

Um conjunto de dados referenciado é um conjunto de dados escrito em Wrangle que é adicionado a um fluxo a partir de outro fluxo.

OBSERVAÇÃO: um conjunto de dados referenciado é um objeto somente leitura no fluxo onde ele é referenciado.

Para adicionar um conjunto de dados referenciado, clique em Add Datasets a partir da página "Flow View" e selecione um conjunto de um fluxo diferente.

Figura: visualização do conjunto de dados referenciado

Campos-chave:

CampoDescrição
Fluxo de origemFluxo que contém o conjunto de dados. Clique no link para abrir a página "Flow View" para esse conjunto de dados.

Ações:

AçãoDescrição
Adicionar nova receitaCrie uma nova receita e um conjunto de dados escrito em Wrangle a partir do conjunto de dados referenciado. Esta combinação de receita e conjunto de dados é independente da original.
Remover…Remova o conjunto de dados referenciado do fluxo. O conjunto de dados de origem no outro fluxo está intacto.
Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Google Cloud Dataprep
Precisa de ajuda? Acesse nossa página de suporte.