Verwenden Sie den verwalteten E/A-Connector, um Daten von Apache Iceberg in Dataflow zu lesen.
Abhängigkeiten
Fügen Sie Ihrem Projekt die folgenden Abhängigkeiten hinzu:
Java
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-managed</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-io-iceberg</artifactId>
<version>${beam.version}</version>
</dependency>
Konfiguration
Für Apache Iceberg verwendet die verwaltete E/A die folgenden Konfigurationsparameter:
Name | Datentyp | Beschreibung |
---|---|---|
table |
String | Die Kennung der Apache Iceberg-Tabelle. Beispiel:
"db.table1" . |
catalog_name |
String | Der Name des Katalogs. Beispiel: "local" . |
catalog_properties |
Karte | Eine Zuordnung von Konfigurationseigenschaften für den Apache Iceberg-Katalog. Welche Properties erforderlich sind, hängt vom Katalog ab. Weitere Informationen finden Sie in der Apache Iceberg-Dokumentation unter
CatalogUtil . |
config_properties |
Karte | Optionale Hadoop-Konfigurationseigenschaften. Weitere Informationen finden Sie in der Apache Iceberg-Dokumentation unter
CatalogUtil . |
Beispiel
Im folgenden Beispiel werden Daten aus einer Apache Iceberg-Tabelle gelesen und in Textdateien geschrieben.
Java
Richten Sie die Standardanmeldedaten für Anwendungen ein, um sich bei Dataflow zu authentifizieren. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.