Como executar um DAG do Apache Airflow no Cloud Composer 2
Cloud Composer 1 | Cloud Composer 2 | Cloud Composer 3
Neste guia de início rápido, mostramos como criar um ambiente do Cloud Composer e execute um DAG do Apache Airflow no Cloud Composer 2.
Se você é novo no Airflow, consulte a Tutorial de conceitos do Airflow no Apache Airflow documentação para mais informações sobre conceitos, objetos e e como usá-los.
Se você quiser usar a CLI do Google Cloud, consulte Executar um DAG do Apache Airflow no Cloud Composer (CLI do Google Cloud).
Se você quiser criar um ambiente usando o Terraform, consulte Criar ambientes (Terraform).
Antes de começar
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
Enable the Cloud Composer API.
-
Para conseguir as permissões necessárias a fim de concluir o guia de início rápido, peça ao administrador para conceder a você os seguintes papéis do IAM no projeto:
-
Para conferir, criar e gerenciar o ambiente do Cloud Composer:
-
Administrador de ambiente e de objetos do Storage (
roles/composer.environmentAndStorageObjectAdmin
) -
Usuário da conta de serviço (
roles/iam.serviceAccountUser
)
-
Administrador de ambiente e de objetos do Storage (
-
Para ver os registros:
Visualizador de registros (
roles/logging.viewer
)
Para mais informações sobre a concessão de papéis, consulte Gerenciar o acesso a projetos, pastas e organizações.
Também é possível conseguir as permissões necessárias por meio de papéis personalizados ou de outros papéis predefinidos.
-
Para conferir, criar e gerenciar o ambiente do Cloud Composer:
Criar um ambiente
No console do Google Cloud, acesse a página Criar ambiente.
Se este for o primeiro ambiente no seu projeto, a seção Conceder as permissões necessárias à conta de serviço do Cloud Composer vai aparecer.
Você adiciona a conta de agente de serviço do Cloud Composer como um novo principal na conta de serviço do seu ambiente e concede a ela o papel de extensão do agente de serviço da API Cloud Composer v2.
Confirme se você usa a conta de serviço pretendida para seu ambiente. e clique em Conceder.
No campo Nome, use
example-environment
.Na lista suspensa Local, selecione uma região para o ambiente do Cloud Composer. Este guia usa a região
us-central1
.Para outras opções de configuração do ambiente, use os padrões fornecidos.
Clique em Criar e aguarde até que o ambiente seja criado.
Quando terminar, uma marca de seleção verde vai aparecer ao lado do nome do ambiente.
Criar um arquivo DAG
Um DAG do Airflow é uma coleção de tarefas organizadas que você quer programar e executar. Os DAGs são definidos em arquivos Python padrão.
Neste guia, usamos um exemplo de DAG do Airflow definido no arquivo quickstart.py
.
O código Python neste arquivo faz o seguinte:
- Cria um DAG,
composer_sample_dag
. Esse DAG é executado todos os dias. - Executa uma tarefa,
print_dag_run_conf
. A tarefa imprime a configuração da execução do DAG usando o operador bash.
Salve uma cópia do arquivo quickstart.py
na sua máquina local:
Faça upload do arquivo DAG para o bucket do ambiente
Todo ambiente do Cloud Composer tem uma Cloud Storage
em um bucket associado a ela. O Airflow no Cloud Composer programa apenas
os DAGs que estão na pasta /dags
neste bucket.
Para programar seu DAG, faça upload do arquivo quickstart.py
da máquina local para o
pasta /dags
do ambiente:
No console do Google Cloud, acesse a página Ambientes.
Na lista de ambientes, clique no nome do ambiente.
example-environment
: A página Detalhes do ambiente é aberta.Clique em Abrir pasta de DAGs. A página Detalhes do bucket é aberta.
Clique em Fazer upload de arquivos e selecione a cópia de
quickstart.py
.Para fazer upload do arquivo, clique em Abrir.
Conferir o DAG
Depois de fazer upload do arquivo DAG, o Airflow faz o seguinte:
- Analisa o arquivo DAG enviado por upload. Pode levar alguns minutos para que o DAG fique disponível para o Airflow.
- Adiciona o DAG à lista de DAGs disponíveis.
- Executa o DAG de acordo com a programação que você forneceu no arquivo DAG.
Verifique se o DAG foi processado sem erros e está disponível no Airflow na interface do DAG. A interface do DAG é a interface do Cloud Composer para visualização Informações do DAG no console do Google Cloud. O Cloud Composer também oferece Acesso à IU do Airflow, que é uma interface nativa da plataforma interface gráfica do usuário.
Aguarde cerca de cinco minutos para que o Airflow tenha tempo de processar o arquivo DAG que você enviou anteriormente e concluir a primeira execução do DAG (explicado mais tarde).
No console do Google Cloud, acesse a página Ambientes.
Na lista de ambientes, clique no nome do ambiente,
example-environment
. A página Detalhes do ambiente é aberta.Acesse a guia DAGs.
Verificar se o DAG
composer_quickstart
está presente na lista de DAGs.
Conferir os detalhes da execução do DAG
Uma única execução de um DAG é chamada de execução de DAG. Airflow imediatamente executa um DAG para o DAG de exemplo porque a data de início no arquivo DAG é definido como ontem. Assim, o Airflow alcança os DAGs especificados cronograma.
O DAG de exemplo contém uma tarefa, print_dag_run_conf
, que executa o comando echo
no console. Esse comando exibe metainformações sobre o DAG
(identificador numérico da execução do DAG).
Na guia DAGs, clique em
composer_quickstart
. Na guia Execuções do O DAG é aberto.Na lista de execuções do DAG, clique na primeira entrada.
Os detalhes da execução do DAG são mostrados, detalhando as informações sobre as tarefas individuais do DAG de exemplo.
A seção Registros da execução do DAG lista os registros de todas as tarefas na execução do DAG. É possível conferir a saída do comando
echo
nos registros.
Limpar
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
Exclua os recursos usados neste tutorial:
Exclua o ambiente do Cloud Composer:
No console do Google Cloud, acesse a página Ambientes.
Selecione
example-environment
e clique em Excluir.Aguarde até o ambiente ser excluído.
Exclua o bucket do ambiente. A exclusão do ambiente do Cloud Composer não exclui o bucket.
No console do Google Cloud, acesse Armazenamento > Navegador.
Selecione o bucket do ambiente e clique em Excluir. Por exemplo, ele pode ter o nome
us-central1-example-environ-c1616fe8-bucket
.
Exclua o disco permanente da fila do Redis do seu ambiente. A exclusão do ambiente do Cloud Composer não remove o disco permanente.
No console do Google Cloud, acesse Compute Engine > Discos.
Selecione o disco permanente da fila do Redis do ambiente e clique em Excluir.
Por exemplo, ele pode ser chamado de
pvc-02bc4842-2312-4347-8519-d87bdcd31115
. Os discos do Cloud Composer 2 sempre têm o tipoBalanced persistent disk
e o tamanho de 2 GB.
A seguir