Apache Iceberg에서 Dataflow로 읽으려면 관리형 I/O 커넥터를 사용합니다.
관리형 I/O는 Apache Iceberg의 다음 기능을 지원합니다.
카탈로그 |
|
---|---|
읽기 기능 | 일괄 읽기 |
쓰기 기능 |
|
Apache Iceberg용 BigQuery 테이블의 경우 BigQuery Storage API와 함께 BigQueryIO
커넥터를 사용합니다. 테이블이 이미 있어야 합니다. 동적 테이블 생성은 지원되지 않습니다.
종속 항목
다음 종속 항목을 프로젝트에 추가합니다.
자바
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-managed</artifactId>
<version>${beam.version}</version>
</dependency>
<dependency>
<groupId>org.apache.beam</groupId>
<artifactId>beam-sdks-java-io-iceberg</artifactId>
<version>${beam.version}</version>
</dependency>
예
다음 예에서는 Apache Iceberg 테이블에서 읽고 데이터를 텍스트 파일에 씁니다.
Java
Dataflow에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 로컬 개발 환경의 인증 설정을 참조하세요.
다음 단계
- Apache Iceberg에 쓰기
- 관리형 I/O에 대해 자세히 알아보세요.