Este documento ajuda você a entender o conceito de espaços de trabalho no Dataform e os recursos deles.
No Dataform, você interage com o código do fluxo de trabalho SQL em um espaço de trabalho de desenvolvimento. Um espaço de trabalho de desenvolvimento é sua própria cópia editável de um repositório. Em um espaço de trabalho, você cria, edita ou exclui o conteúdo do repositório sem afetar outras pessoas que trabalham no mesmo repositório e, em seguida, confirma e envia as alterações para o repositório.
É possível desenvolver seu fluxo de trabalho SQL com o núcleo do Dataform ou o JavaScript. O Dataform compila seu código em consultas SQL em tempo real.
Em um espaço de trabalho de desenvolvimento, é possível realizar as seguintes tarefas:
- Configurar as configurações do Dataform
- Criar tabelas de todos os tipos com suporte
- Tabelas de documento
- Tabelas de particionamento
- Adicionar rótulos do BigQuery e tags de política às tabelas
- Configurar configurações adicionais da tabela
- Declarar origens de dados para seu fluxo de trabalho SQL
- Adicionar operações SQL personalizadas e tags ao fluxo de trabalho SQL
- Gatilho de execução do fluxo de trabalho SQL ou das ações selecionadas
- Monitorar registros de execução
Componentes de um espaço de trabalho de desenvolvimento
Um espaço de trabalho de desenvolvimento do Dataform consiste nas seguintes guias:
- Código
- Contém um ambiente de desenvolvimento em que é possível analisar arquivos, desenvolver consultas, controlar a versão das mudanças e acionar a execução no BigQuery.
- Gráfico compilado
- Exibe o fluxo de trabalho SQL compilado definido no seu espaço de trabalho como um gráfico acíclico dirigido (DAG) interativo. Se houver erros de compilação no fluxo de trabalho SQL, a guia vai mostrar uma mensagem de erro em vez do gráfico.
- Execuções
- Exibe os registros de todas as execuções acionadas no espaço de trabalho. Também é possível ver as ações e os detalhes delas para uma execução selecionada. Para mais informações, consulte Monitorar registros de execução.
Componentes da guia "Código"
A guia Code de um espaço de trabalho de desenvolvimento contém os seguintes componentes que permitem desenvolver fluxos de trabalho SQL:
- Painel de arquivos
- Exibe a estrutura de arquivos do seu espaço de trabalho. Salva automaticamente suas edições na estrutura de arquivos. Os arquivos selecionados são abertos em guias no painel de desenvolvimento. No campo Type to search, você pode pesquisar arquivos ou diretórios no seu espaço de trabalho pelo caminho.
- Painel de controle de versões
- Exibe o status do controle de versões do seu espaço de trabalho e as opções de controle de versões.
- Painel de desenvolvimento
- Mostra os arquivos abertos em guias. Salva automaticamente as alterações nos arquivos editados.
- Botão "Executar"
- Executa uma visualização da consulta SQL compilada.
- Botão de formatação
- Formata o núcleo do Dataform ou o código JavaScript.
- Status da compilação
- Exibe o status de compilação do código no seu espaço de trabalho.
- Painel de metadados
- Mostra os metadados do arquivo editado no momento.
- Painel de consultas compiladas
- Compila as consultas no arquivo editado para SQL. Se a compilação da consulta falhar, os erros de compilação serão exibidos. Se a compilação da consulta for bem-sucedida, as consultas compiladas serão exibidas e validadas em testes simulados no BigQuery. Se a validação da consulta falhar, os erros de validação serão mostrados. Se a validação da consulta for bem-sucedida, será mostrado quantos bytes a execução das consultas ao BigQuery usaria.
- Menu suspenso "Start execution"
- Exibe opções para acionar a execução de todo o fluxo de trabalho no seu espaço de trabalho ou nos elementos selecionados.
Componentes da guia "Gráfico compilado"
A guia "Gráfico compilado" mostra um gráfico interativo do fluxo de trabalho SQL compilado. O gráfico mostra todas as ações no fluxo de trabalho SQL e as relações entre elas.
Você pode aumentar e diminuir o zoom e usar o arrastar para navegar pelo gráfico.
É possível filtrar o gráfico pelas seguintes propriedades:
- Nome
- Tag
- Tipo
- Declaração
- Declaração
- Tabela incremental
- Visualização materializada
- Operações
- Tabela
- Desconhecido
- Ver
É possível selecionar vários filtros de uma vez.
O Dataform vai aplicá-los com a condição OR
.
Clique em uma ação no gráfico para conferir os detalhes nos seguintes painéis:
- Painel de metadados
- Exibe o nome completo, o tipo, as dependências e os dependentes da ação selecionada.
- Painel de consulta
- Mostra a consulta SQL compilada da ação selecionada.
Controle de versão em um espaço de trabalho
Em um espaço de trabalho, você interage com o repositório usando o controle de versão baseado no Git. As edições feitas em arquivos no seu espaço de trabalho começam como mudanças locais não confirmadas que podem ser confirmadas e, em seguida, enviadas para o repositório para que fiquem disponíveis para todos os usuários.
Se o repositório estiver conectado a um provedor Git remoto, você vai enviar as mudanças do espaço de trabalho para a ramificação de desenvolvimento principal. Você seleciona a ramificação principal ao conectar seu repositório ao provedor Git remoto. Em um repositório de formulário de dados não conectado, você envia as mudanças para a ramificação padrão.
Também é possível extrair qualquer mudança do repositório do Dataform ou do repositório remoto e mesclar com as mudanças locais no espaço de trabalho de desenvolvimento. Para mais informações sobre o controle de versões no Dataform, consulte Controle de versões do código.
A seguir
- Para saber como criar e inicializar um espaço de trabalho, consulte Criar um espaço de trabalho.
- Para saber como controlar as versões do código do Dataform, consulte Controle de versões do código.
- Para saber como executar uma prévia para testar uma consulta SQL, consulte Prévia de consultas SQL.