Apache Iceberg에서 Dataflow로 읽으려면 관리형 I/O 커넥터를 사용합니다.
종속 항목
다음 종속 항목을 프로젝트에 추가합니다.
자바
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-managed</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-io-iceberg</artifactId>
<version>${beam.version}</version>
</dependency>
구성
Apache Iceberg의 경우 관리형 I/O는 다음 구성 매개변수를 사용합니다.
이름 | 데이터 유형 | 설명 |
---|---|---|
table |
문자열 | Apache Iceberg 테이블의 식별자입니다. 예: "db.table1" |
catalog_name |
문자열 | 카탈로그의 이름입니다. 예: "local" |
catalog_properties |
지도 | Apache Iceberg 카탈로그의 구성 속성 맵입니다. 필요한 속성은 카탈로그에 따라 달라집니다. 자세한 내용은 Apache Iceberg 문서의 CatalogUtil 을 참조하세요. |
config_properties |
지도 | Hadoop 구성 속성의 선택적 집합입니다. 자세한 내용은 Apache Iceberg 문서의 CatalogUtil 을 참조하세요. |
예
다음 예시에서는 Apache Iceberg 테이블에서 읽고 데이터를 텍스트 파일에 씁니다.
Java
Dataflow에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.