Apache Beam es un modelo unificado de código abierto para definir canalizaciones por lotes y de procesamiento paralelo de datos de transmisión. Antes de comenzar a usar Dataflow, comprende cómo diseñar, crear y probar canalizaciones de Apache Beam.
Recursos de Apache Beam
En el sitio web de Apache Beam, puedes encontrar documentación sobre lo siguiente:
Cómo diseñar tu canalización: Se muestra cómo determinar la estructura de tu canalización, cómo elegir cuál se transforma para aplicarse a tus datos y cómo definir tus métodos de entrada y salida.
Cómo crear tu canalización: Se explica la mecánica de usar clases en el SDK de Beam y los pasos necesarios para compilar una canalización.
Cómo probar tu canalización: Se presentan las recomendaciones para probar las canalizaciones.