Présentation (API du SDK Google Cloud Dataflow 1.9.1)

SDK Google Cloud Dataflow pour Java, version 1.9.1

Le SDK Google Cloud Dataflow pour Java fournit un modèle de programmation simple et élégant pour représenter vos pipelines de traitement des données. Pour plus d'informations et les instructions de démarrage, consultez notre page produit.

Voir la description

Packages 
Package Description
com.google.cloud.dataflow.sdk
Offre un modèle simple et efficace pour la création de Pipelines de traitement parallèle des données par lots et par flux.
com.google.cloud.dataflow.sdk.annotations
Définit les annotations utilisées dans le SDK.
com.google.cloud.dataflow.sdk.coders
Définit les Coders qui permettent de spécifier la manière dont les données sont codées vers des chaînes d'octets ou décodées à partir de celles-ci.
com.google.cloud.dataflow.sdk.coders.protobuf
Définit un Coder pour les messages Protocol Buffers, ProtoCoder.
com.google.cloud.dataflow.sdk.io
Définit les transformations pour la lecture et l'écriture des formats de stockage courants, y compris AvroIO, BigQueryIO et TextIO.
com.google.cloud.dataflow.sdk.io.bigtable
Définit les transformations pour les lectures et les écritures dans Google Cloud Bigtable.
com.google.cloud.dataflow.sdk.io.datastore
Fournit une API pour les lectures et les écritures dans Google Cloud Datastore avec différentes versions des bibliothèques clientes Cloud Datastore.
com.google.cloud.dataflow.sdk.io.range
Fournit des assistants sécurisés pour la mise en œuvre d'un rééquilibrage dynamique des tâches dans des sources limitées et basées sur la position.
com.google.cloud.dataflow.sdk.options
Définit les PipelineOptions pour configurer l'exécution des pipelines.
com.google.cloud.dataflow.sdk.runners
Définit les exécuteurs de pipelines dans différents modes, y compris DirectPipelineRunner et DataflowPipelineRunner.
com.google.cloud.dataflow.sdk.runners.inprocess
Définit le InProcessPipelineRunner qui exécute des Pipelines limités et non limités sur la machine locale.
com.google.cloud.dataflow.sdk.testing
Définit les utilitaires nécessaires aux tests unitaires des pipelines Dataflow.
com.google.cloud.dataflow.sdk.transforms
Définit les PTransforms pour la transformation des données dans un pipeline.
com.google.cloud.dataflow.sdk.transforms.display
Définit les HasDisplayData pour l'annotation des composants qui fournissent les display data utilisées dans les interfaces utilisateur et les outils de diagnostic.
com.google.cloud.dataflow.sdk.transforms.join
Définit la transformation CoGroupByKey permettant de joindre plusieurs PCollections.
com.google.cloud.dataflow.sdk.transforms.windowing
Définit la transformation Window permettant de diviser les éléments d'une PCollection en plusieurs fenêtres. Il définit également le Trigger permettant de contrôler le moment où ces éléments sont générés.
com.google.cloud.dataflow.sdk.values
Définit la PCollection et d'autres classes servant à représenter les données dans un Pipeline.

Le SDK Google Cloud Dataflow pour Java fournit un modèle de programmation simple et élégant pour représenter vos pipelines de traitement des données. Pour plus d'informations et les instructions de démarrage, consultez notre page produit.

Le moyen le plus simple d'exploiter le SDK Google Cloud Dataflow pour Java consiste à utiliser l'un des artefacts disponibles dans le dépôt central Maven. Pour en savoir plus sur chaque version disponible, consultez nos notes de version.

Les numéros de version respectent le format major.minor.incremental et sont incrémentés comme suit :

  • Version majeure pour les modifications incompatibles de l'API
  • Version mineure pour les fonctionnalités rétrocompatibles ajoutées
  • Version incrémentielle pour les corrections de bugs à compatibilité ascendante

Remarque : Les API comportant la mention @Experimental sont susceptibles d'être modifiées à tout moment. Leur compatibilité à travers les versions n'est donc pas garantie.