Dasar-dasar pipeline untuk Apache Beam SDK

Apache Beam adalah model open source terpadu untuk menentukan pipeline pemrosesan paralel data batch dan streaming. Sebelum Anda mulai menggunakan Dataflow, pahami cara mendesain, membuat, dan menguji pipeline Apache Beam.

Resource Apache Beam

Di situs web Apache Beam, Anda dapat menemukan dokumentasi tentang:

  • Cara mendesain pipeline: menunjukkan cara menentukan struktur pipeline, cara memilih transformasi mana yang akan diterapkan pada data Anda, serta cara menentukan metode input dan output Anda.

  • Cara membuat pipeline: menjelaskan mekanisme penggunaan class di Beam SDK dan langkah-langkah yang diperlukan untuk membangun pipeline.

  • Cara menguji pipeline Anda: menunjukkan praktik terbaik untuk menguji pipeline Anda.