Concetti fondamentali della pipeline per gli SDK Apache Beam

Apache Beam è un modello unificato open source per la definizione di pipeline di elaborazione parallela di elaborazione in parallelo dei dati in modalità batch e flusso. Prima di iniziare a utilizzare Dataflow, scopri come progettare, creare e testare le pipeline Apache Beam.

Risorse Apache Beam

Nel sito web di Apache Beam puoi trovare la documentazione su:

  • Come progettare la pipeline: mostra come determinare la struttura della pipeline, come scegliere le trasformazioni da applicare ai dati e come determinare i metodi di input e output.

  • Come creare una pipeline: illustra i meccanismi per utilizzare le classi negli SDK Beam e i passaggi necessari per creare una pipeline.

  • Come testare la pipeline: illustra le best practice per testare le pipeline.