Untuk menulis dari Dataflow ke Apache Iceberg, gunakan konektor I/O terkelola.
Dependensi
Tambahkan dependensi berikut ke project Anda:
Java
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-managed</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-io-iceberg</artifactId>
<version>${beam.version}</version>
</dependency>
Konfigurasi
Untuk Apache Iceberg, Managed I/O menggunakan parameter konfigurasi:
Nama | Jenis data | Deskripsi |
---|---|---|
table |
string | ID tabel Apache Iceberg. Contoh:
"db.table1" . |
catalog_name |
string | Nama katalog. Contoh: "local" . |
catalog_properties |
map | Peta properti konfigurasi untuk Apache Iceberg
katalog. Properti yang diperlukan bergantung pada katalog. Untuk informasi
selengkapnya, lihat
CatalogUtil dalam dokumentasi Apache Iceberg. |
config_properties |
map | Kumpulan opsional properti konfigurasi Hadoop. Untuk informasi
selengkapnya, lihat
CatalogUtil dalam dokumentasi Apache Iceberg. |
Contoh
Contoh berikut menulis data JSON dalam memori ke tabel Apache Iceberg.
Java
Untuk melakukan autentikasi ke Dataflow, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.