Ir para
Serviço gerenciado para Apache Airflow

Serviço gerenciado para Apache Airflow (antigo Cloud Composer)

Um serviço de orquestração do fluxo de trabalho totalmente gerenciado criado no Apache Airflow.

Clientes novos ganham US $300 em créditos para gastar no Serviço Gerenciado para Apache Airflow ou em outros produtos do Google Cloud.

  • Crie, programe e monitore pipelines que abrangem ambientes de nuvem híbrida e multicloud.

  • Criado no projeto de código aberto Apache Airflow e operado com Python.

  • Libera você da dependência de fornecedores e é fácil de usar

  • Novo suporte para Apache Airflow 3 (em pré-lançamento)

Vantagens

Orquestração de fluxos de trabalho totalmente gerenciada

Por ser gerenciado e compatível com o Airflow, o Serviço Gerenciado para Apache Airflow permite que você se concentre na criação, na programação e no monitoramento dos fluxos de trabalho sem precisar focar no provisionamento de recursos.

Integração com outros produtos do Google Cloud

A integração de ponta a ponta com os produtos do Google Cloud, incluindo o BigQuery, Dataflow, Serviço Gerenciado para Apache Spark, Datastore, Cloud Storage e Pub/Sub, dá liberdade aos usuários para orquestrar por completo o pipeline deles.

Compatibilidade com nuvem híbrida e multicloud

Crie, programe e monitore os fluxos de trabalho por meio de apenas uma ferramenta de orquestração, independentemente do pipeline estar no local, em várias nuvens ou totalmente inserido no Google Cloud.

Principais recursos

Principais recursos

Híbrido e várias nuvens

Facilite a transição para a nuvem ou mantenha um ambiente de dados híbrido orquestrando fluxos de trabalho que se cruzam entre a nuvem local e a pública. Crie fluxos de trabalho que conectam dados, processamentos e serviços entre nuvens, garantindo um ambiente de dados unificado.

Código aberto

O serviço gerenciado para Apache Airflow oferece aos usuários liberdade de escolha e portabilidade. O Google contribui com esse projeto, que oferece liberdade para os clientes e integração a uma grande quantidade de plataformas. A tendência é esse número só aumentar com o crescimento da comunidade do Airflow.

Orquestração facilitada

Os pipelines do serviço gerenciado para Apache Airflow são configurados como gráficos acíclicos dirigidos (DAGs, na sigla em inglês) usando Python, facilitando o uso para todos os usuários. A implantação com um clique proporciona acesso instantâneo a uma biblioteca avançada de conectores e várias representações gráficas do fluxo de trabalho em ação, facilitando a solução de problemas. A sincronização automática dos gráficos acíclicos direcionados garante que os jobs sigam o cronograma.

Melhore a forma como os fluxos de trabalho de dados são criados, gerenciados e monitorados

As principais melhorias incluem o controle de versões de DAG para auditoria e rollbacks confiantes, além de backfills gerenciados pelo programador para um reprocessamento mais simples de dados históricos. Uma nova API e SDK de execução de tarefas abrem caminho para o futuro suporte a vários idiomas e ambientes de tarefas isolados. Os usuários se beneficiam de uma interface mais rápida e moderna baseada em React com navegação aprimorada. O agendamento planejado baseado em eventos visa pipelines mais reativos e quase em tempo real. O Edge Executor otimiza a execução remota de tarefas, e uma CLI dividida (airflow/airflowctl) oferece uma experiência de linha de comando mais clara para desenvolvimento e operações.

Documentação

Documentação

Google Cloud Basics

Informações gerais do serviço gerenciado para Apache Airflow

Confira uma visão geral de um ambiente do Serviço Gerenciado para Apache Airflow e dos produtos do Google Cloud usados para uma implantação do Apache Airflow.

Architecture

Usar um pipeline de CI/CD para seu fluxo de trabalho de processamento de dados

Descubra como configurar um pipeline de implantação/integração contínuas (CI/CD) para o processamento de dados com produtos gerenciados no Google Cloud.

Pattern

Ambiente do Serviço Gerenciado para Apache Airflow com IP particular

Encontre informações sobre o uso de um ambiente de IP privado do Serviço gerenciado para Apache Airflow.

Tutorial

Como escrever DAGs (fluxos de trabalho)

Saiba como fazer um gráfico acíclico dirigido (DAG, na sigla em inglês) do Apache Airflow que é executado em um ambiente do Serviço gerenciado para Apache Airflow.

Tutorial

Google Cloud Ensina: engenharia de dados no Google Cloud

Este curso de quatro dias com professor oferece aos participantes uma introdução prática sobre como projetar e criar pipelines de dados no Google Cloud.

Não encontrou o que procura?

Casos de uso

Casos de uso

Caso de uso
Conhecer os casos de uso do Serviço gerenciado para Apache Airflow
  • Orquestração de pipeline de dados (ETL/ELT) : automatizar fluxos de trabalho de dados complexos, incluindo jobs de extração, transformação e carregamento (ETL/ELT), e gerenciar dependências entre tarefas.
  • MLOps e fluxos de trabalho de machine learning: orquestração do ciclo de vida completo de ML, desde a preparação de dados e o treinamento/avaliação de modelos até a implantação e o monitoramento.
  • Automação de business intelligence (BI): programação de extrações de dados para ferramentas de BI, automação da geração de relatórios e atualização de painéis.
  • Automação de infraestrutura e DevOps: automatizar tarefas de infraestrutura em nuvem, como provisionamento e desativação de clusters, envio de jobs e gerenciamento de processos de lançamento de CI/CD.
  • Integração de dados híbrida e multicloud: coordenação de fluxos de dados em diversas fontes, incluindo outros provedores de nuvem e data centers no local, para criar conjuntos de dados unificados.

Todos os recursos

Todos os recursos

Várias nuvens

Crie fluxos de trabalho que conectam dados, processamentos e serviços entre nuvens, garantindo um ambiente de dados unificado.

Código aberto

O serviço gerenciado para Apache Airflow oferece aos usuários liberdade de escolha e portabilidade.

Híbrido

Facilite a transição para a nuvem ou mantenha um ambiente de dados híbrido orquestrando fluxos de trabalho que se cruzam entre a nuvem local e a pública.

Integrado

Integração padrão com BigQuery, Dataflow, Serviço Gerenciado para Apache Spark, Datastore, Cloud Storage, Pub/Sub e muito mais, garantindo a você a capacidade de orquestrar cargas de trabalho completas do Google Cloud.

Linguagem de programação Python

Aproveite suas habilidades em Python para criar e agendar fluxos de trabalho dinamicamente no Serviço Gerenciado para Apache Airflow.

Confiabilidade

Aumente a confiabilidade de fluxos de trabalho usando gráficos práticos para monitorar e solucionar problemas indo direto até a causa do problema.

Totalmente gerenciado

A natureza gerenciada do Serviço Gerenciado para Apache Airflow permite que você se concentre na criação, no agendamento e no monitoramento de fluxos de trabalho, em vez de recursos de provisionamento.

Rede e segurança

Durante a criação do ambiente, o serviço gerenciado para Apache Airflow oferece as seguintes opções de configuração: IP particular, VPC compartilhada, VPC Service Controls, suporte à criptografia CMEK e muito mais.

Preços

Preços

Os preços do serviço gerenciado para Apache Airflow são baseados no consumo, ou seja, você paga o que usa de acordo com as proporções vCPU/hora, GB/mês e GB transferidos/mês. Oferecemos vários níveis de preços porque o serviço gerenciado para Apache Airflow usa diversos produtos do Google Cloud como elementos básicos.

Os preços são uniformes em todos os níveis de consumo e uso prolongado. Para mais informações, consulte a página de preços.

Vá além

Comece a criar no Google Cloud com US$ 300 em créditos e mais de 20 produtos, tudo isso sem custo financeiro.

Google Cloud