Per scrivere da Dataflow in Apache Iceberg, utilizza il metodo connettore I/O gestito.
Dipendenze
Aggiungi le seguenti dipendenze al progetto:
Java
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-managed</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-io-iceberg</artifactId>
<version>${beam.version}</version>
</dependency>
Configurazione
Per Apache Iceberg, l'I/O gestita utilizza i seguenti parametri di configurazione:Nome | Tipo di dati | Descrizione |
---|---|---|
table |
string | L'identificatore della tabella Apache Iceberg. Esempio:
"db.table1" . |
catalog_name |
string | Il nome del catalogo. Esempio: "local" . |
catalog_properties |
mappa | Una mappa delle proprietà di configurazione per il catalogo Apache Iceberg. Le proprietà obbligatorie dipendono dal catalogo. Per maggiori informazioni
le informazioni, vedi
CatalogUtil nella documentazione di Apache Iceberg. |
config_properties |
mappa | Un insieme facoltativo di proprietà di configurazione di Hadoop. Per maggiori informazioni
le informazioni, vedi
CatalogUtil nella documentazione di Apache Iceberg. |
triggering_frequency_seconds |
integer | Per le pipeline di scrittura in streaming, la frequenza con cui il sink tenta di produrre snapshot, in secondi. |
Esempio
L'esempio seguente scrive dati JSON in memoria in una tabella Apache Iceberg.
Java
Per autenticarti a Dataflow, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.