Gemini 지원을 받아 쿼리 작성
이 문서에서는 Gemini in BigQuery에서 AI 기반 지원을 사용하여 SQL 쿼리와 Python 코드로 데이터를 쿼리하는 방법을 설명합니다. BigQuery의 Gemini는 쿼리와 코드를 생성하고, 입력하는 동안 쿼리와 코드를 완성하고, 쿼리를 설명할 수 있습니다.
Google Cloud 콘솔에서 이 태스크에 대한 단계별 안내를 직접 수행하려면 둘러보기를 클릭합니다.
Google Cloud를 위한 Gemini는 사용자의 명시적 허가 없이 사용자의 프롬프트나 프롬프트에 대한 응답을 모델을 학습시키기 위한 데이터로 사용하지 않습니다. Google에서 사용자 데이터를 사용하는 방법에 관한 자세한 내용은 Google Cloud용 Gemini에서 데이터를 사용하는 방법을 참고하세요.
BigQuery에서는 Gemini에 영어 프롬프트만 지원됩니다.
이 문서는 SQL 쿼리와 BigQuery의 Colab Enterprise 노트북을 사용하는 데이터 분석가, 데이터 과학자, 데이터 개발자를 대상으로 합니다. 여기서는 BigQuery Studio 환경에서 데이터를 쿼리하는 방법이나 Python 노트북을 사용하여 BigQuery 데이터를 분석하는 방법을 알고 있다고 가정합니다.
시작하기 전에
- Google Cloud 프로젝트에 BigQuery의 Gemini가 설정되어 있는지 확인합니다. 이 단계는 일반적으로 관리자가 실행합니다. 이 섹션의 나머지 단계를 완료할 때까지 BigQuery의 Gemini 기능이 사용 중지되거나 사용할 수 없을 수 있습니다.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.
BigQuery 툴바에서 pen_spark Gemini를 클릭합니다.
기능 목록에서 다음 기능이 선택되어 있는지 확인합니다.
SQL 쿼리의 Gemini 목록:
- 자동 완성 (미리보기) 쿼리 편집기에서 입력하는 동안 Gemini는 현재 쿼리의 컨텍스트와 관련된 논리적인 다음 단계를 제안하거나 쿼리를 반복하는 데 도움을 줄 수 있습니다.
- 자동 생성 BigQuery 쿼리 편집기에서 자연어 주석을 사용하여 BigQuery의 Gemini에 프롬프트를 입력하여 SQL 쿼리를 생성할 수 있습니다.
- SQL 생성 도구 도구에 자연어 텍스트를 입력하여 쿼리 결과를 미세 조정하고, 테이블 소스를 선택하고, 결과를 비교하는 옵션이 있는 SQL 쿼리를 생성할 수 있습니다.
- 설명 BigQuery에서 Gemini에 자연어를 사용하여 SQL 쿼리를 설명하도록 프롬프트를 입력할 수 있습니다.
Python 노트북의 Gemini 목록:
- 코드 완성 (미리보기) Gemini는 노트북의 콘텐츠를 기반으로 상황에 따라 적절한 추천을 제공합니다.
- 코드 생성 자연어 문이나 Python 코드 생성에 대한 질문으로 Gemini에 프롬프트를 입력할 수 있습니다.
이 문서의 태스크를 완료하려면 필요한 Identity and Access Management (IAM) 권한이 있는지 확인합니다.
필요한 역할
Gemini 지원을 사용하여 쿼리를 작성하는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 Google Cloud용 Gemini 사용자 (roles/cloudaicompanion.user
) IAM 역할을 부여해 달라고 요청하세요.
역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.
이 사전 정의된 역할에는 Gemini 지원을 사용하여 쿼리를 작성하는 데 필요한 권한이 포함되어 있습니다. 필요한 정확한 권한을 보려면 필수 권한 섹션을 펼치세요.
필수 권한
Gemini 지원을 사용하여 쿼리를 작성하려면 다음 권한이 필요합니다.
-
cloudaicompanion.entitlements.get
-
cloudaicompanion.instances.completeTask
-
SQL 쿼리 설명하기:
cloudaicompanion.companions.generateChat
-
SQL 또는 Python 코드 완성하기:
cloudaicompanion.instances.completeCode
-
SQL 또는 Python 코드 생성하기:
cloudaicompanion.instances.generateCode
커스텀 역할이나 다른 사전 정의된 역할을 사용하여 이 권한을 부여받을 수도 있습니다.
BigQuery에서 IAM 역할 및 권한에 대한 자세한 내용은 IAM 소개를 참조하세요.
SQL 쿼리 생성
데이터의 스키마를 기반으로 SQL 쿼리를 생성하려면 BigQuery의 Gemini에 자연어 문구 또는 질문(프롬프트라고도 함)을 제공하면 됩니다. 코드 없이 시작하거나 데이터 스키마에 대한 지식이 부족하거나 Google SQL 문법에 대한 기본 지식만 있더라도 BigQuery의 Gemini는 데이터를 탐색하는 데 도움이 되는 SQL을 생성할 수 있습니다.
SQL 생성 도구 사용
SQL 생성 도구를 사용하면 자연어를 사용하여 최근에 보거나 쿼리한 테이블에 관한 SQL 쿼리를 생성할 수 있습니다. 이 도구를 사용하여 기존 쿼리를 수정하고 SQL을 생성할 테이블을 수동으로 지정할 수도 있습니다.
SQL 생성 도구를 사용하려면 다음 단계를 따르세요.
Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.
쿼리 편집기 옆에 있는 SQL 생성 도구 pen_spark를 클릭합니다.
Gemini로 SQL 생성하기 대화상자에서 최근에 보거나 쿼리한 테이블에 관한 자연어 프롬프트를 입력합니다. 예를 들어 최근에
bigquery-public-data.austin_bikeshare.bikeshare_trips
표를 본 경우 다음을 입력할 수 있습니다.Show me the duration and subscriber type for the ten longest trips.
생성을 클릭합니다.
생성된 SQL 쿼리는 다음과 유사합니다.
SELECT subscriber_type, duration_sec FROM `bigquery-public-data.san_francisco_bikeshare.bikeshare_trips` ORDER BY duration_sec DESC LIMIT 10;
생성된 SQL 쿼리를 검토하고 다음 작업 중 하나를 수행합니다.
- 생성된 SQL 쿼리를 수락하려면 삽입을 클릭하여 문을 쿼리 편집기에 삽입합니다. 그런 다음 실행을 클릭하여 추천 SQL 쿼리를 실행할 수 있습니다.
- 프롬프트를 수정하려면 수정을 클릭한 다음 초기 프롬프트를 수정하거나 대체합니다. 프롬프트를 수정한 후 업데이트를 클릭하여 새 쿼리를 생성합니다.
- 추천 SQL 쿼리를 생성하는 컨텍스트로 사용된 테이블 소스를 업데이트하려면 테이블 소스 수정을 클릭하고 적절한 체크박스를 선택한 다음 적용을 클릭합니다.
- 생성된 쿼리의 자연어 요약을 보려면 쿼리 요약을 클릭합니다.
- 추천 SQL 쿼리를 세분화하려면 세분화 필드에 세분화 내용을 입력한 다음
limit to 1000
을 입력하여 쿼리 결과 수를 제한합니다. 쿼리의 변경사항을 비교하려면 비교 표시 체크박스를 선택합니다.
세분화를 클릭합니다. 예를 들어 - 추천 쿼리를 닫으려면 SQL 생성 도구를 닫습니다.
SQL 생성 도구 사용 중지
SQL 생성 도구를 사용 중지하는 방법을 알아보려면 Gemini 쿼리 어시스턴트 기능 사용 중지를 참고하세요.
주석에서 SQL 생성
주석에서 원하는 쿼리를 설명하여 쿼리 편집기에서 SQL을 생성할 수 있습니다.
Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.
쿼리 편집기에서
를 클릭합니다. SQL 쿼리 쿼리 편집기에서 최근에 보거나 쿼리한 테이블에 관한 SQL 주석을 작성합니다. 예를 들어 최근에
bigquery-public-data.austin_bikeshare.bikeshare_trips
테이블을 본 경우 다음과 같은 주석을 작성할 수 있습니다.# Show me the duration and subscriber type for the ten longest trips.
Enter(macOS에서는 Return) 키를 누릅니다.
추천 SQL 쿼리는 다음과 유사합니다.
# Show me the duration and subscriber type for the ten longest trips SELECT duration_sec, subscriber_type AVG(duration_minutes) AS average_trip_length FROM `bigquery-public-data.austin_bikeshare.bikeshare_trips` ORDER BY duration_sec LIMIT 10;
제안된 내용을 사용하려면 Tab 키를 누르세요.
SQL 생성 팁
다음 팁은 BigQuery의 Gemini에서 제공하는 추천을 개선할 수 있습니다.
- 사용할 테이블을 수동으로 지정하려면 정규화된 테이블 이름을 백틱(
`
)으로 묶어 포함합니다(예:`PROJECT.DATASET.TABLE`
). - 열 이름 또는 시맨틱스 관계가 명확하지 않거나 복잡한 경우 프롬프트에 컨텍스트를 제공하여 Gemini가 개발자가 원하는 답변을 제공하도록 안내할 수 있습니다. 예를 들어 생성된 쿼리가 열 이름을 참조하도록 하려면 열 이름과 원하는 답변과의 관련성을 설명합니다. 평생 가치 또는 총이익과 같이 복잡한 용어를 참조하는 답변을 유도하려면 개념 및 데이터와의 관련성을 설명하여 SQL 생성 결과를 향상시킵니다.
- 주석에서 SQL을 생성할 때 각 줄 앞에
#
문자를 붙여 여러 줄에 걸쳐 프롬프트 형식을 지정할 수 있습니다. - 열 설명은 SQL 쿼리를 생성할 때 고려됩니다. 정확성을 개선하려면 스키마에 열 설명을 추가하세요. 열 설명에 관한 자세한 내용은 '스키마 지정'의 열 설명을 참고하세요.
Gemini 및 BigQuery 데이터
BigQuery의 Gemini는 개발자에게 액세스 권한이 있는 테이블의 메타데이터에 액세스할 수 있습니다. 이 메타데이터에는 테이블 이름, 열 이름, 데이터 유형, 열 설명이 포함될 수 있습니다. BigQuery의 Gemini는 테이블, 뷰 또는 모델의 데이터에 액세스할 수 없습니다. Gemini에서 데이터를 사용하는 방법에 대한 자세한 내용은 Google Cloud용 Gemini가 데이터를 사용하는 방법을 참조하세요.
SQL 쿼리 작성
SQL 작성은 쿼리 편집기의 콘텐츠를 기반으로 상황에 따라 적절한 권장사항을 제공하려고 시도합니다. 입력하는 동안 Gemini는 현재 쿼리의 컨텍스트와 관련된 논리적인 다음 단계를 제안하거나 쿼리를 반복하는 데 도움을 줄 수 있습니다.
BigQuery에서 Gemini를 사용하여 SQL 완성을 사용해 보려면 다음 단계를 따르세요.
Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.
쿼리 편집기에서 다음을 복사합니다.
SELECT subscriber_type , EXTRACT(HOUR FROM start_time) AS hour_of_day , AVG(duration_minutes) AS avg_trip_length FROM `bigquery-public-data.austin_bikeshare.bikeshare_trips`
subscriber_type
이 그룹화되거나 집계되지 않았다는 오류 메시지가 표시됩니다. 올바른 쿼리를 위해 도움이 필요한 경우가 많습니다.subscriber_type
의 줄 끝에서 스페이스 키를 누릅니다.제안된 쿼리 상세검색은 다음과 유사한 텍스트로 끝날 수 있습니다.
GROUP BY subscriber_type, hour_of_day;
Enter (macOS에서는 Return) 키를 눌러 추천을 생성할 수도 있습니다.
제안을 수락하려면 Tab 키를 누르거나 추천 텍스트 위에 마우스 포인터를 올려놓고 각 추천 대안을 클릭하세요. 추천 항목을 닫으려면 Esc 키를 누르거나 계속 입력합니다.
SQL 쿼리 설명
BigQuery에서 SQL 쿼리를 자연어로 설명하도록 Gemini에 프롬프트를 입력할 수 있습니다. 이러한 설명은 쿼리의 길이 또는 복잡성으로 인해 문법, 기본 스키마, 비즈니스 컨텍스트를 평가하기 어려울 수 있는 쿼리를 이해하는 데 도움이 될 수 있습니다.
SQL 쿼리에 대한 설명을 보려면 다음 단계를 따르세요.
Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.
쿼리 편집기에서 설명이 필요한 쿼리를 열거나 붙여넣습니다.
BigQuery의 Gemini에서 설명할 쿼리를 강조 표시합니다.
astrophotography_mode Gemini를 클릭한 다음 이 쿼리 설명을 클릭합니다.
SQL 설명이 Gemini 창에 표시됩니다.
Python 코드 생성
프롬프트 (자연어 문 또는 질문)를 사용하여 BigQuery의 Gemini에 Python 코드를 생성하도록 요청할 수 있습니다. BigQuery의 Gemini는 Python 코드 추천 하나 이상으로 응답합니다.
다음 예시에서는 BigQuery 공개 데이터 세트 bigquery-public-data.ml_datasets.penguins
의 코드를 생성합니다.
BigQuery Studio 페이지로 이동합니다.
쿼리 편집기의 탭 표시줄에서
SQL 쿼리 옆에 있는 드롭다운 화살표를 클릭한 다음 Python 노트북을 클릭합니다.bigquery-public-data.ml_datasets.penguins
공개 데이터 세트에 대한 쿼리 예시를 보여주는 셀이 포함된 새 노트북이 열립니다.새 코드 셀을 삽입하려면 툴바에서
코드를 클릭합니다. 새 코드 셀에는 코딩 시작 또는 AI로 생성이라는 메시지가 포함되어 있습니다.새 코드 셀에서 생성을 클릭합니다.
생성 편집기에서 다음 자연어 프롬프트를 입력합니다.
Using bigquery magics, query the `bigquery-public-data.ml_datasets.penguins` table
Enter(macOS에서는 Return) 키를 누릅니다.
제안된 Python 코드는 다음과 유사합니다.
%%bigquery SELECT * FROM `bigquery-public-data.ml_datasets.penguins` LIMIT 10
코드를 실행하려면
셀 실행을 누릅니다.
전체 Python 코드
Python 코드 완성은 쿼리 편집기의 콘텐츠를 기반으로 상황에 따라 적절한 추천을 제공하려고 합니다. 입력하는 동안 BigQuery의 Gemini는 현재 코드 컨텍스트와 관련된 논리적인 다음 단계를 제안하거나 코드를 반복하는 데 도움을 줄 수 있습니다.
BigQuery에서 Gemini를 사용하여 Python 코드 완성을 사용해 보려면 다음 단계를 따르세요.
BigQuery Studio 페이지로 이동합니다.
쿼리 편집기의 탭 표시줄에서
SQL 쿼리 옆에 있는 드롭다운 화살표를 클릭한 다음 Python 노트북을 클릭합니다.bigquery-public-data.ml_datasets.penguins
공개 데이터 세트에 대한 쿼리 예시를 보여주는 셀이 포함된 새 노트북이 열립니다.편집기에서 Python 코드를 입력합니다. 예를 들면
%%bigquery
입니다. BigQuery의 Gemini는 입력하는 동안 코드 인라인을 제안합니다.제안된 내용을 사용하려면 Tab 키를 누르세요.
Gemini 쿼리 어시스턴트 기능 사용 중지
BigQuery의 Gemini에서 특정 기능을 사용 중지하려면 다음 단계를 따르세요.
Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.
BigQuery 툴바에서
pen_spark Gemini 를 클릭합니다.목록에서 사용 중지하려는 쿼리 어시스턴트 기능을 선택 해제합니다.
BigQuery에서 Gemini를 사용 중지하는 방법을 알아보려면 BigQuery에서 Gemini 사용 중지를 참고하세요.
의견 보내기
Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.
BigQuery 툴바에서
pen_spark Gemini 를 클릭합니다.의견 보내기를 클릭합니다.
추천 개선 도움말
프리뷰의 기능에 제출한 프롬프트 데이터를 Google과 공유하여 Gemini 추천을 개선할 수 있습니다.
프롬프트 데이터를 공유하려면 다음 단계를 수행합니다.
Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.
BigQuery 툴바에서
pen_spark Gemini 를 클릭합니다.BigQuery의 Gemini 개선을 위해 데이터 공유를 선택합니다.
데이터 사용 설정 대화상자에서 데이터 사용 설정을 업데이트합니다.
데이터 공유 설정은 전체 프로젝트에 적용되며 serviceusage.services.enable
및 serviceusage.services.list
IAM 권한이 있는 프로젝트 관리자만 이 설정을 설정할 수 있습니다. 신뢰할 수 있는 테스터 프로그램에서의 데이터 사용에 대한 자세한 내용은 Google Cloud 신뢰할 수 있는 테스터 프로그램의 Gemini를 참조하세요.
가격 책정
이 기능의 가격 책정에 관한 자세한 내용은 BigQuery의 Gemini 가격 책정 개요를 참고하세요.
할당량 및 한도
이 기능의 할당량 및 한도에 대한 자세한 내용은 BigQuery의 Gemini 할당량을 참조하세요.