Apache Beam es un modelo unificado de código abierto que se utiliza para definir los flujos de procesamiento en paralelo de los datos por lotes y en streaming. Antes de empezar a usar Dataflow, debes saber cómo diseñar, crear y probar las canalizaciones de Apache Beam.
Recursos de Apache Beam
En el sitio web de Apache Beam, puede encontrar documentación sobre lo siguiente:
Cómo diseñar tu canalización: muestra cómo determinar la estructura de tu canalización, cómo elegir las transformaciones que se aplicarán a tus datos y cómo determinar tus métodos de entrada y salida.
Cómo crear una canalización: explica cómo usar las clases de los SDKs de Beam y los pasos necesarios para crear una canalización.
Cómo probar un flujo de procesamiento: presenta las prácticas recomendadas para probar tus flujos de procesamiento.