Usar Apache Beam para crear flujos de trabajo

Dataflow se basa en el proyecto de código abierto Apache Beam. Puedes usar el SDK de Apache Beam para crear flujos de procesamiento para Dataflow. En este documento se enumeran algunos recursos para empezar a programar con Apache Beam.

Empezar

Aprender a usar Apache Beam

Puedes consultar las siguientes páginas del sitio web de Apache Beam para obtener información sobre la programación de Apache Beam.

  • Guía de programación de Apache Beam: proporciona directrices para usar las clases del SDK de Apache Beam con el fin de crear y probar tu flujo de procesamiento.

  • Recorrido por Apache Beam: una guía de aprendizaje que puedes usar para familiarizarte con Apache Beam. Las unidades de aprendizaje incluyen ejemplos de código que puedes ejecutar y modificar.

  • Playground de Apache Beam: un entorno interactivo para probar transformaciones y ejemplos de Apache Beam sin tener que instalar Apache Beam en tu entorno.

  • Crea tu flujo de procesamiento: se explica cómo usar las clases de los SDKs de Apache Beam y los pasos necesarios para crear un flujo de procesamiento.

Desarrollar flujos de procesamiento

Ejemplos de código

Puedes usar los siguientes ejemplos de Apache Beam en GitHub para empezar a crear una canalización de streaming:

Siguientes pasos