데이터 준비 관리
이 문서에서는 데이터 준비를 배포하고 예약하는 방법을 비롯하여 BigQuery에서 데이터 준비를 관리하는 방법을 설명합니다. 데이터 준비는 Dataform으로 구동되는 BigQuery 리소스입니다.
시작하기 전에
- Google Cloud를 위한 Gemini API를 사용 설정했는지 확인합니다.
필요한 역할
Dataform 서비스 계정에 BigQuery에서 데이터를 준비하는 데 필요한 권한이 있는지 확인하려면 Dataform 서비스 계정에 필요한 역할을 참고하세요.
BigQuery에서 데이터를 준비하는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 다음 IAM 역할을 부여해 달라고 요청하세요.
-
BigQuery 데이터 편집자(
roles/bigquery.dataEditor
) -
서비스 사용량 소비자(
roles/serviceusage.serviceUsageConsumer
)
역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.
커스텀 역할이나 다른 사전 정의된 역할을 통해 필요한 권한을 얻을 수도 있습니다.
기존 데이터 준비 보기
기존 데이터 준비 목록을 보려면 다음 단계를 따르세요.
- BigQuery Studio 페이지에서 탐색기 창으로 이동합니다.
- 프로젝트를 펼칩니다.
- 데이터 준비 목록을 펼칩니다.
데이터 준비 예약
데이터 준비 편집기에서 일정을 만들고 BigQuery Orchestration 페이지에서 일정을 관리할 수 있습니다.
일정 만들기
데이터 준비 단계를 실행하고 준비된 데이터를 대상 테이블에 로드하는 일정을 만들려면 일회성 또는 반복적인 데이터 준비 실행을 예약합니다.
- 데이터 준비 툴바에서 일정을 클릭합니다.
- 일정 이름을 입력합니다.
- 실행과 연결된 서비스 계정 이름을 입력합니다.
- 빈도를 예약합니다.
- 일정 만들기를 클릭합니다.
일정 보기
프로젝트의 모든 데이터 준비 일정을 보려면 다음 단계를 따르세요.
Google Cloud 콘솔에서 조정 페이지로 이동합니다.
선택사항: 선택한 일정 및 이전 실행에 대한 세부정보를 보려면 일정의 이름을 클릭합니다.
일정 삭제
선택한 데이터 준비의 일정을 영구적으로 삭제하려면 다음 단계를 따르세요.
Google Cloud 콘솔에서 조정 페이지로 이동합니다.
일정이 포함된 행에서 > 삭제를 클릭합니다.
작업
데이터를 점진적으로 처리하여 데이터 준비 최적화
준비된 데이터가 대상 테이블에 쓰이는 방식을 구성하려면 다음 단계를 따르세요.
Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.
활동 창에서 데이터 준비를 선택합니다.
데이터 준비 툴바에서 더보기 > 쓰기 모드를 선택합니다.
옵션 중 하나를 선택합니다. 자세한 내용은 쓰기 모드를 참고하세요.
저장을 클릭합니다.
추천 개선 도움말
프리뷰의 기능에 제출한 프롬프트 데이터를 Google과 공유하여 Gemini 추천을 개선할 수 있습니다. 프롬프트 데이터를 공유하려면 다음 단계를 수행합니다.
- BigQuery에서 데이터 준비 편집기를 엽니다.
- 데이터 준비 툴바에서 설정 더보기를 클릭합니다.
- BigQuery의 Gemini 개선을 위해 데이터 공유를 선택합니다.
데이터 공유 설정은 전체 프로젝트에 적용되며 serviceusage.services.enable
및 serviceusage.services.list
IAM 권한이 있는 프로젝트 관리자만 이 설정을 설정할 수 있습니다. 신뢰할 수 있는 테스터 프로그램에서 데이터 사용에 대한 자세한 내용은 Google Cloud 신뢰할 수 있는 테스터 프로그램의 Gemini를 참고하세요.
데이터 준비 버전
BigQuery 데이터 준비는 데이터 준비 버전의 보기, 비교, 복원을 지원하지 않습니다.
데이터 준비 버전 목록을 시간순으로 보려면 다음 단계를 따르세요.
- BigQuery Studio 페이지에서 탐색기 창으로 이동합니다.
- 데이터 준비를 선택합니다. 버전은 탐색기 창의 활동 탭에 나열됩니다.
데이터 준비 다운로드
YAML 파일로 데이터 준비를 다운로드하려면 다음 단계를 따르세요.
Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.
탐색기 창에서 프로젝트와 데이터 준비 폴더를 펼칩니다. 다운로드하려는 데이터 준비의 이름을 클릭합니다.
다운로드를 클릭합니다. 데이터 준비는 YAML 파일 형식(예:
NAME data preparation.dp.yaml
)으로 저장됩니다.
데이터 준비 업로드
YAML 파일에서 데이터 준비를 업로드하려면 다음 단계를 따르세요.
Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.
탐색기 창에서 내 프로젝트 ID를 펼칩니다.
데이터 준비 폴더로 이동하여 more_vert 메뉴 > 데이터 준비에 업로드를 클릭합니다.
데이터 준비 업로드 대화상자에서 업로드할 파일을 선택하거나 데이터 준비의 URL을 입력합니다.
데이터 준비의 이름을 입력합니다.
리소스가 관리되고 저장되는 데이터 준비 위치를 선택합니다.
업로드를 클릭합니다.
다음 단계
- BigQuery에서 데이터 준비에 대해 자세히 알아보세요.
- 데이터 준비를 만드는 방법을 알아보세요.