Para escribir desde Dataflow en Apache Iceberg, usa el conector de E/S administrado.
Dependencias
Agrega las siguientes dependencias a tu proyecto:
Java
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-managed</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-io-iceberg</artifactId>
<version>${beam.version}</version>
</dependency>
Configuración
En el caso de Apache Iceberg, la E/S administrada usa los siguientes parámetros de configuración:
Nombre | Tipo de datos | Descripción |
---|---|---|
table |
string | Es el identificador de la tabla de Apache Iceberg. Examplo:
"db.table1" . |
catalog_name |
string | Es el nombre del catálogo. Ejemplo: "local" . |
catalog_properties |
mapa | Un mapa de las propiedades de configuración para el catálogo de Apache Iceberg. Las propiedades obligatorias dependen del catálogo. Para obtener más información, consulta CatalogUtil en la documentación de Apache Iceberg. |
config_properties |
mapa | Un conjunto opcional de propiedades de configuración de Hadoop. Para obtener más información, consulta CatalogUtil en la documentación de Apache Iceberg. |
Ejemplo
En el siguiente ejemplo, se escriben datos JSON en la memoria en una tabla de Apache Iceberg.
Java
Para autenticarte en Dataflow, configura las credenciales predeterminadas de la aplicación. Si deseas obtener más información, consulta Configura la autenticación para un entorno de desarrollo local.