Comienza a usar Dataflow

El servicio de Dataflow ejecuta canalizaciones definidas por el SDK de Apache Beam. Sin embargo, para muchos casos de uso, no es necesario escribir código con el SDK, ya que Dataflow proporciona varias opciones sin código y con poco código.

  • Plantillas. Dataflow proporciona plantillas prediseñadas para transferir datos de un producto a otro. Por ejemplo, puedes usar una plantilla para transferir datos de Pub/Sub a BigQuery.

  • Compilador de trabajos El compilador de trabajos es una IU visual para compilar canalizaciones de Dataflow en la consola deGoogle Cloud . Admite un subconjunto de fuentes y receptores de Apache Beam, así como transformaciones como uniones, funciones de Python y consultas SQL. Recomendamos el compilador de trabajos para casos de uso simples, como el movimiento de datos.

  • Transformaciones listas para usar para el AA. Para las canalizaciones de aprendizaje automático (AA), Dataflow proporciona transformaciones listas para usar que requieren una cantidad mínima de código para configurarse. Como punto de partida, ejecuta un notebook de ejemplo de AA en Google Colab. Para obtener más información, consulta la descripción general de Dataflow ML.

  • SDK de Apache Beam Para aprovechar al máximo Apache Beam, usa el SDK para escribir una canalización personalizada en Python, Java o Go.

Para ayudarte a tomar una decisión, en la siguiente tabla, se enumeran algunos ejemplos comunes.

Quiero… Enfoque recomendado
Mueve datos de una fuente a un receptor, sin lógica personalizada.

Creador de trabajos o plantilla

Te recomendamos que comiences con el compilador de trabajos. Si el compilador de trabajos no admite tu caso de uso, consulta si hay una plantilla para él.

Mueve datos de una fuente a un receptor y aplica lógica personalizada con funciones de Python o SQL. Creador de trabajos
Usar un modelo de AA en mi canalización o preparar mis datos para el entrenamiento o la inferencia Transformaciones llave en mano de Dataflow ML
Escribir una canalización que requiera funciones más avanzadas de Apache Beam SDK de Apache Beam para Java, Python o Go

¿Qué sigue?