Aspectos principales de la canalización para los SDK de Apache Beam
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Apache Beam es un modelo unificado de código abierto para definir canalizaciones por lotes y de procesamiento paralelo de datos de transmisión. Antes de comenzar a usar Dataflow, comprende cómo diseñar, crear y probar canalizaciones de Apache Beam.
Recursos de Apache Beam
En el sitio web de Apache Beam, puedes encontrar documentación sobre lo siguiente:
Cómo diseñar tu canalización: Se muestra cómo determinar la estructura de tu canalización, cómo elegir cuál se transforma para aplicarse a tus datos y cómo definir tus métodos de entrada y salida.
Cómo crear tu canalización: Se explica la mecánica de usar clases en el SDK de Beam y los pasos necesarios para compilar una canalización.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-04 (UTC)"],[[["\u003cp\u003eApache Beam is a unified, open-source model for defining batch and streaming data processing pipelines.\u003c/p\u003e\n"],["\u003cp\u003eDesigning an Apache Beam pipeline involves determining its structure, choosing data transforms, and specifying input/output methods.\u003c/p\u003e\n"],["\u003cp\u003eCreating a pipeline involves using the classes in the Beam SDKs and building the pipeline itself.\u003c/p\u003e\n"],["\u003cp\u003eThe Apache Beam website provides documentation on designing, creating, and testing your data processing pipelines.\u003c/p\u003e\n"]]],[],null,["# Pipeline fundamentals for the Apache Beam SDKs\n\nApache Beam is an open source, unified model for defining both batch and\nstreaming-data parallel-processing pipelines. Before you get started with\nDataflow, understand how to design, create and test Apache Beam pipelines.\n\nApache Beam resources\n---------------------\n\nOn the Apache Beam website, you can find documentation on:\n\n- [How to design your pipeline](https://beam.apache.org/documentation/pipelines/design-your-pipeline/):\n shows how to determine your pipeline's structure, how to choose which\n transforms to apply to your data, and how to determine your input and output\n methods.\n\n- [How to create your pipeline](https://beam.apache.org/documentation/pipelines/create-your-pipeline/):\n explains the mechanics of using the classes in the Beam SDKs and the\n necessary steps needed to build a pipeline.\n\n- [How to test your pipeline](https://beam.apache.org/documentation/pipelines/test-your-pipeline/):\n presents best practices for testing your pipelines."]]