Dasar-dasar pipeline untuk Apache Beam SDK

Apache Beam adalah model open source terpadu untuk menentukan pipeline pemrosesan paralel data batch dan streaming. Sebelum memulai Dataflow, pahami cara mendesain, membuat, dan menguji pipeline Apache Beam.

Referensi Apache Beam

Di situs Apache Beam, Anda dapat menemukan dokumentasi tentang:

  • Cara mendesain pipeline: menunjukkan cara menentukan struktur pipeline, cara memilih transformasi yang akan diterapkan ke data, dan cara menentukan metode input dan output.

  • Cara membuat pipeline: menjelaskan mekanisme penggunaan class di Beam SDK dan langkah-langkah yang diperlukan untuk membuat pipeline.

  • Cara menguji pipeline: menjelaskan praktik terbaik untuk menguji pipeline Anda.