Documentación de Dataflow
Dataflow es un servicio administrado que ejecuta una amplia variedad de patrones de procesamiento de datos. La documentación que se ofrece en este sitio muestra cómo implementar las canalizaciones de procesamiento de datos por lotes y de transmisión mediante Dataflow, y también incluyen instrucciones sobre el uso de las características del servicio.
El SDK de Apache Beam es un modelo de programación de código abierto que te permite desarrollar canalizaciones de transmisión y por lotes. Puedes crear tus canalizaciones con un programa de Apache Beam y, luego, ejecutarlas en el servicio de Dataflow. La documentación de Apache Beam proporciona información conceptual detallada y material de referencia sobre el modelo de programación de Apache Beam, los SDK y otros ejecutores.
Para conocer los conceptos básicos de Apache Beam, consulta el Recorrido de Beam y Beam Playground. El repositorio de guía de soluciones de Dataflow también proporciona canalizaciones listas para usar e independientes, y los casos de uso más comunes de Dataflow.
Recursos de documentación
Guías
-
Crea una canalización de Dataflow con Java
-
Crea una canalización de Dataflow con Python
-
Crea una canalización de Dataflow con Go
-
Crea una canalización de transmisión con una plantilla de Dataflow
-
Compila y ejecuta una plantilla de Flex
-
Implementa canalizaciones de Dataflow
-
Desarrolla con notebooks
-
Solución de problemas y depuración
-