Untuk membaca dari Apache Iceberg ke Dataflow, gunakan konektor I/O terkelola.
Dependensi
Tambahkan dependensi berikut ke project Anda:
Java
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-managed</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-io-iceberg</artifactId>
<version>${beam.version}</version>
</dependency>
Konfigurasi
Untuk Apache Iceberg, I/O Terkelola menggunakan parameter konfigurasi berikut:
Nama | Jenis data | Deskripsi |
---|---|---|
table |
string | ID tabel Apache Iceberg. Contoh:
"db.table1" . |
catalog_name |
string | Nama katalog. Contoh: "local" . |
catalog_properties |
map | Peta properti konfigurasi untuk katalog Apache Iceberg. Properti yang diperlukan bergantung pada katalog. Untuk informasi
selengkapnya, lihat
CatalogUtil dalam dokumentasi Apache Iceberg. |
config_properties |
map | Kumpulan properti konfigurasi Hadoop opsional. Untuk selengkapnya
informasi, lihat
CatalogUtil dalam dokumentasi Apache Iceberg. |
Contoh
Contoh berikut membaca dari tabel Apache Iceberg dan menulis data ke file teks.
Java
Untuk melakukan autentikasi ke Dataflow, siapkan Kredensial Default Aplikasi. Untuk mengetahui informasi selengkapnya, baca Menyiapkan autentikasi untuk lingkungan pengembangan lokal.