쿼리 결과를 Amazon S3로 내보내기
이 문서에서는 BigLake 테이블을 대상으로 실행되는 쿼리 결과를 Amazon Simple Storage Service(Amazon S3) 버킷으로 내보내는 방법을 설명합니다.
BigQuery와 Amazon S3 간의 데이터 흐름 방식에 대한 자세한 내용은 데이터 내보내기 시 데이터 흐름을 참조하세요.
시작하기 전에
다음 리소스가 있는지 확인합니다.
- Amazon S3 버킷에 액세스하기 위한 연결
- Amazon S3 BigLake 테이블
- 올바른 Amazon Web Services(AWS) Identity and Access Management(IAM) 정책:
- Amazon S3 버킷에 데이터를 쓸 수 있는
PutObject
권한이 필요합니다. 자세한 내용은 Amazon S3에 연결을 참조하세요.
- Amazon S3 버킷에 데이터를 쓸 수 있는
- 용량 기반 가격 책정 모델을 사용하는 경우 프로젝트에 BigQuery Reservation API를 사용 설정했는지 확인합니다. 가격 책정에 대한 자세한 내용은 BigQuery Omni 가격 책정을 참조하세요.
쿼리 결과 내보내기
BigQuery Omni는 기존 콘텐츠와 관계없이 지정된 Amazon S3 위치에 씁니다. 내보내기 쿼리에서 기존 데이터를 덮어쓰거나 쿼리 결과를 기존 데이터와 혼합할 수 있습니다. 쿼리 결과를 비어 있는 Amazon S3 버킷으로 내보내는 것이 좋습니다.
쿼리를 실행하려면 다음 옵션 중 하나를 선택합니다.
SQL
쿼리 편집기 필드에 GoogleSQL 내보내기 쿼리를 입력합니다. GoogleSQL은 Google Cloud 콘솔의 기본 문법입니다.
Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.
쿼리 편집기에서 다음 문을 입력합니다.
EXPORT DATA WITH CONNECTION `CONNECTION_REGION.CONNECTION_NAME` OPTIONS(uri="s3://BUCKET_NAME/PATH", format="FORMAT", ...) AS QUERY
다음을 바꿉니다.
CONNECTION_REGION
: 연결이 생성된 리전CONNECTION_NAME
: Amazon S3 버킷에 쓰는 데 필요한 권한으로 만든 연결 이름BUCKET_NAME
: 데이터를 쓰려는 Amazon S3 버킷PATH
: 내보낸 파일을 쓰려는 경로. 경로 문자열의 리프 디렉터리에 정확히 와일드 카드(*
) 하나가 포함되어야 합니다(예:../aa/*
,../aa/b*c
,../aa/*bc
,../aa/bc*
). BigQuery는 내보낸 파일 수에 따라*
를0000..N
으로 바꿉니다. BigQuery에서 파일 수와 크기를 결정합니다. BigQuery에서 파일 2개를 내보내려는 경우 첫 번째 파일의 파일 이름에 있는*
가000000000000
으로 바뀌고 두 번째 파일의 파일 이름에 있는*
가000000000001
로 바뀝니다.FORMAT
: 지원되는 형식은JSON
,AVRO
,CSV
,PARQUET
입니다.QUERY
: BigLake 테이블에 저장된 데이터를 분석하는 쿼리입니다.실행을 클릭합니다.
쿼리를 실행하는 방법에 대한 자세한 내용은 대화형 쿼리 실행을 참조하세요.
자바
이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용의 Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.
BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.
문제 해결
quota failure
관련 오류가 발생하면 쿼리에 용량을 예약했는지 확인합니다. 슬롯 예약에 대한 자세한 내용은 이 문서의 시작하기 전에를 참조하세요.
제한사항
Amazon S3 및 Blob Storage를 기반으로 BigLake 테이블에 적용되는 전체 제한사항 목록은 제한사항을 참조하세요.
다음 단계
- BigQuery Omni 알아보기
- 테이블 데이터 내보내기 방법 알아보기
- Amazon S3에 저장된 데이터 쿼리 방법 알아보기
- BigQuery Omni의 VPC 서비스 제어 설정 방법 알아보기