Dasar-dasar pipeline untuk Apache Beam SDK

Apache Beam adalah model open source terpadu untuk menentukan pipeline pemrosesan paralel data batch dan streaming. Sebelum Anda mulai menggunakan Dataflow, pahami cara mendesain, membuat, dan menguji pipeline Apache Beam.

Resource Apache Beam

Di situs web Apache Beam, Anda dapat menemukan dokumentasi tentang:

Cara mendesain pipeline: menunjukkan cara menentukan struktur pipeline, cara memilih transformasi mana yang akan diterapkan pada data Anda, serta cara menentukan metode input dan output Anda.
Cara membuat pipeline: menjelaskan mekanisme penggunaan class di Beam SDK dan langkah-langkah yang diperlukan untuk membangun pipeline.
Cara menguji pipeline Anda: menunjukkan praktik terbaik untuk menguji pipeline Anda.

Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.

Terakhir diperbarui pada 2024-01-10 UTC.