Ir a
Managed Service for Apache Airflow

Managed Service for Apache Airflow (anteriormente, Cloud Composer)

Servicio totalmente gestionado de orquestación de flujos de trabajo, integrado en Apache Airflow.

Los nuevos clientes reciben 300 USD en crédito sin coste para invertirlos en Managed Service for Apache Airflow u otros productos de Google Cloud.

  • Crea, programa y monitoriza flujos de procesamiento en entornos híbridos y multinube

  • Solución que utiliza Python y se basa en el proyecto de código abierto Apache Airflow.

  • Sin dependencias y fácil de usar.

  • Nueva compatibilidad con Apache Airflow 3 (en versión preliminar)

Ventajas

Orquestación de flujos de trabajo totalmente gestionada

Managed Service for Apache Airflow es un servicio totalmente gestionado y compatible con Airflow que te permite centrarte en crear, programar y monitorizar tus flujos de trabajo en lugar de en aprovisionar recursos.

Integración con otros productos de Google Cloud

Al integrarse completamente con otros productos de Google Cloud, como BigQuery, Dataflow, Managed Service for Apache Spark, Datastore, Cloud Storage y Pub/Sub, permite a los usuarios orquestar todo el flujo de procesamiento.

Compatibilidad con entornos híbridos y multinube

Crea, programa y monitoriza flujos de trabajo mediante una única herramienta de orquestación, independientemente de si el flujo de procesamiento reside on‑premise, en varias nubes o solo en Google Cloud.

Características principales

Características principales

Entornos híbridos y multinube

Facilita la transición a la nube o el mantenimiento de un entorno híbrido de datos, ya que orquesta los flujos de trabajo que trascienden los límites del entorno on‑premise y de la nube pública. Crea flujos de trabajo que conectan los datos, el procesamiento y los servicios de todas las nubes para que disfrutes de un entorno de datos unificado.

Código abierto

Managed Service for Apache Airflow ofrece a los usuarios portabilidad sin dependencias de ningún tipo. Gracias a este proyecto, en el que también contribuye Google, los clientes se libran de cualquier dependencia. Además, facilita la integración con un elevado número de plataformas, que no dejará de aumentar a medida que crezca la comunidad de Airflow.

Orquestación sencilla

Los flujos de procesamiento de Managed Service for Apache Airflow se configuran como grafos acíclicos dirigidos (DAGs) que utilizan Python, lo que facilita su uso a cualquier usuario. Basta un clic para realizar el despliegue y acceder al instante a una extensa biblioteca de conectores y varias representaciones gráficas del flujo de trabajo en funcionamiento. Así, resolver problemas es más sencillo. La sincronización automática de los DAG asegura que las tareas se atengan a la programación.

Mejora la forma en que se crean, gestionan y monitorizan los flujos de trabajo de datos

Entre las mejoras clave se incluyen la gestión de versiones de DAG para la auditabilidad y las restauraciones seguras, junto con los rellenos gestionados por el programador para un reprocesamiento más sencillo de los datos históricos. Una nueva API y SDK de ejecución de tareas allanan el camino para la futura compatibilidad con varios idiomas y entornos de tareas aislados. Los usuarios se benefician de una interfaz de usuario más rápida y moderna basada en React con una navegación mejorada. La programación basada en eventos planificada tiene como objetivo crear flujos de procesamiento más reactivos y casi en tiempo real. Edge Executor optimiza la ejecución de tareas remotas y una CLI dividida (airflow/airflowctl) ofrece una experiencia de línea de comandos más clara para el desarrollo y las operaciones.

Documentación

Documentación

Google Cloud Basics

Descripción general de Managed Service for Apache Airflow

Te ofrecemos una descripción general del entorno de Managed Service for Apache Airflow y los productos de Google Cloud que se utilizan para el despliegue de Apache Airflow.

Architecture

Usar un flujo de procesamiento de CI/CD en un flujo de trabajo de tratamiento de datos

Descubre cómo configurar un flujo de procesamiento de integración continua y despliegue continuo (CI/CD) para procesar datos con los productos gestionados en Google Cloud.

Pattern

Entorno de Managed Service for Apache Airflow con IP privada

Consulta información sobre cómo usar entornos de IP privada de Managed Service for Apache Airflow en la nube.

Tutorial

Escribir DAG (flujos de trabajo)

Descubre cómo escribir grafos acíclicos dirigidos (DAGs) de Apache Airflow que se ejecutan en un entorno de Managed Service for Apache Airflow.

Tutorial

Google Cloud Skills Boost: Ingeniería de datos en Google Cloud

En este curso de cuatro días, impartido por un profesor, puedes familiarizarte de una forma práctica con los conceptos básicos para diseñar y crear flujos de procesamiento de datos en Google Cloud.

¿No encuentras lo que buscas?

Casos prácticos

Casos prácticos

Caso práctico
Consulta casos prácticos de Managed Service for Apache Airflow
  • Orquestación de flujos de procesamiento de datos (ETL/ELT): automatizar flujos de trabajo de datos complejos, incluidas las tareas de extracción, transformación y carga (ETL/ELT), y gestionar las dependencias entre tareas.
  • MLOps y flujos de trabajo de aprendizaje automático: orquestación de todo el ciclo de vida del aprendizaje automático, desde la preparación de los datos y el entrenamiento o la evaluación de los modelos hasta el despliegue y la monitorización.
  • Automatización de la inteligencia empresarial (BI): programar extracciones de datos para herramientas de BI, automatizar la generación de informes y actualizar paneles de control.
  • Automatización de la infraestructura y de DevOps: automatización de tareas de infraestructura en la nube, como el aprovisionamiento y la retirada de clústeres, el envío de tareas y la gestión de procesos de lanzamiento de CI/CD.
  • Integración de datos híbrida y multinube: coordinación de flujos de datos en diversas fuentes, incluidos otros proveedores de servicios en la nube y centros de datos on-premise, para crear conjuntos de datos unificados.

Todas las características

Todas las características

Multinube

Crea flujos de trabajo que conectan los datos, el procesamiento y los servicios de todas las nubes para que disfrutes de un entorno de datos unificado.

Código abierto

Managed Service for Apache Airflow ofrece a los usuarios portabilidad sin dependencias de ningún tipo.

Híbrido

Facilita la transición a la nube o el mantenimiento de un entorno híbrido de datos, ya que orquesta los flujos de trabajo que trascienden los límites del entorno on‑premise y de la nube pública.

Integrado

Al integrarse con BigQuery, Dataflow, Managed Service for Apache Spark, Datastore, Cloud Storage y Pub/Sub, entre otros, te permite orquestar integralmente las cargas de trabajo de Google Cloud.

Lenguaje de programación Python

Aprovecha tus habilidades con Python para crear y programar dinámicamente flujos de trabajo en Managed Service for Apache Airflow.

Fiabilidad

Aumenta la fiabilidad de los flujos de trabajo gracias a los sencillos gráficos para supervisar problemas y solucionar sus causas.

Totalmente gestionado

El enfoque de Managed Service for Apache Airflow te permite centrarte en crear, programar y monitorizar tus flujos de trabajo, más que en aprovisionarte de recursos.

Redes y seguridad

Durante la creación del entorno, Managed Service for Apache Airflow ofrece las siguientes opciones de configuración: IP privada, VPC compartida, Controles de Servicio de VPC, compatibilidad con el cifrado de CMEK y más.

Precios

Precios

Los precios de Managed Service for Apache Airflow se basan en el consumo de vCPU por hora, GB al mes y GB transferidos al mes, así que solo pagarás por lo que utilizas. Se aplican distintas unidades de precio porque Managed Service for Apache Airflow usa varios productos de Google Cloud como componentes.

El precio es idéntico en todos los niveles de consumo y uso continuado. Si quieres obtener más información, consulta la página de precios.

Ve un paso más allá

Empieza a crear en Google Cloud con 300 USD en crédito de regalo y más de 20 productos que siempre se ofrecen sin coste económico.

Google Cloud