Principes de base des pipelines avec les SDK Apache Beam
Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Apache Beam est un modèle unifié Open Source permettant de définir des pipelines de traitement parallèle des données par lots et en streaming. Avant de commencer à utiliser Dataflow, découvrez comment concevoir, créer et tester des pipelines Apache Beam.
Ressources Apache Beam
Sur le site Web d'Apache Beam, vous pouvez trouver de la documentation (en anglais) sur :
Comment concevoir votre pipeline : cette documentation vous montre comment déterminer la structure de votre pipeline, comment choisir les transformations à appliquer à vos données et comment déterminer vos méthodes d'entrée et de sortie.
Comment créer votre pipeline : cette documentation explique comment utiliser les classes du SDK Beam et les étapes nécessaires pour créer un pipeline.
Comment tester votre pipeline : cette documentation présente les bonnes pratiques à adopter pour tester vos pipelines.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[[["\u003cp\u003eApache Beam is a unified, open-source model for defining batch and streaming data processing pipelines.\u003c/p\u003e\n"],["\u003cp\u003eDesigning an Apache Beam pipeline involves determining its structure, choosing data transforms, and specifying input/output methods.\u003c/p\u003e\n"],["\u003cp\u003eCreating a pipeline involves using the classes in the Beam SDKs and building the pipeline itself.\u003c/p\u003e\n"],["\u003cp\u003eThe Apache Beam website provides documentation on designing, creating, and testing your data processing pipelines.\u003c/p\u003e\n"]]],[],null,["# Pipeline fundamentals for the Apache Beam SDKs\n\nApache Beam is an open source, unified model for defining both batch and\nstreaming-data parallel-processing pipelines. Before you get started with\nDataflow, understand how to design, create and test Apache Beam pipelines.\n\nApache Beam resources\n---------------------\n\nOn the Apache Beam website, you can find documentation on:\n\n- [How to design your pipeline](https://beam.apache.org/documentation/pipelines/design-your-pipeline/):\n shows how to determine your pipeline's structure, how to choose which\n transforms to apply to your data, and how to determine your input and output\n methods.\n\n- [How to create your pipeline](https://beam.apache.org/documentation/pipelines/create-your-pipeline/):\n explains the mechanics of using the classes in the Beam SDKs and the\n necessary steps needed to build a pipeline.\n\n- [How to test your pipeline](https://beam.apache.org/documentation/pipelines/test-your-pipeline/):\n presents best practices for testing your pipelines."]]