Aspectos principales de la canalización para los SDK de Apache Beam

Apache Beam es un modelo unificado de código abierto para definir canalizaciones por lotes y de procesamiento paralelo de datos de transmisión. Antes de comenzar a usar Dataflow, comprende cómo diseñar, crear y probar canalizaciones de Apache Beam.

Recursos de Apache Beam

En el sitio web de Apache Beam, puedes encontrar documentación sobre lo siguiente:

  • Cómo diseñar tu canalización: Se muestra cómo determinar la estructura de tu canalización, cómo elegir cuál se transforma para aplicarse a tus datos y cómo definir tus métodos de entrada y salida.

  • Cómo crear tu canalización: Se explica la mecánica de usar clases en el SDK de Beam y los pasos necesarios para compilar una canalización.

  • Cómo probar tu canalización: Se presentan las recomendaciones para probar las canalizaciones.