Apache Iceberg から Dataflow に読み込むには、マネージド I/O コネクタを使用します。
マネージド I/O は、Apache Iceberg の次の機能をサポートしています。
カタログ |
|
---|---|
読み取り機能 | バッチ読み取り |
書き込み機能 |
|
Apache Iceberg 用の BigQuery テーブルの場合は、BigQuery Storage API で BigQueryIO
コネクタを使用します。このテーブルはすでに存在している必要があります。動的テーブルの作成はサポートされていません。
依存関係
プロジェクトに次の依存関係を追加します。
Java
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-managed</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-io-iceberg</artifactId>
<version>${beam.version}</version>
</dependency>
例
次の例では、Apache Iceberg テーブルからデータを読み取り、テキストファイルに書き込みます。
Java
Dataflow への認証を行うには、アプリケーションのデフォルト認証情報を設定します。詳細については、ローカル開発環境の認証を設定するをご覧ください。
次のステップ
- Apache Iceberg に書き込む。
- マネージド I/O の詳細を確認する。