Para ler do Apache Iceberg para o Dataflow, use a conector de E/S gerenciado.
Dependências
Adicione estas dependências ao projeto:
Java
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-managed</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-io-iceberg</artifactId>
<version>2.56.0</version>
</dependency>
Configuração
O conector do Apache Iceberg usa os seguintes parâmetros de configuração:
table
(string). É o nome do Apache Iceberg. Exemplo:"db.table1"
.catalog_config
(mapeamento). A configuração do catálogo. Contém os seguintes campos:catalog_name
(string). O nome do catálogo. Exemplo:"local"
.catalog_type
(string). O tipo de catálogo. Valores aceitos:"hadoop"
,"hive"
e"rest"
.warehouse_location
(string). A localização do warehouse. Por exemplo:file://path/to/warehouse
.
Exemplo
O exemplo a seguir lê uma tabela do Apache Iceberg e grava os dados no arquivos de texto.
Java
Para autenticar no Dataflow, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.