Gemini CLI로 개발
이 페이지에서는 Gemini CLI를 사용하여 터미널에서 자연어 프롬프트로 BigQuery 데이터와 상호작용하는 방법을 설명합니다. Gemini CLI와 함께 전용 BigQuery 확장 프로그램을 사용하면 명령줄 내에서 직접 AI 기반 데이터 분석 및 통계를 얻을 수 있습니다. BigQuery 테이블 또는 BigQuery 공개 데이터 세트의 테이블에서 데이터를 분석할 수 있습니다.
이러한 퍼스트 파티 확장 프로그램은 데이터 분석 및 통계를 위한 몇 가지 일반적인 도구를 제공합니다. 자체 도구를 빌드하려면 MCP, Gemini CLI 및 기타 에이전트와 함께 BigQuery 사용을 참고하세요.
Gemini CLI 및 확장 프로그램 정보
Gemini CLI는 개발 워크플로를 가속화하고 코딩, 디버깅, 데이터 탐색, 콘텐츠 제작을 지원하는 Google의 오픈소스 대화형 AI 에이전트입니다. BigQuery와 같은 Data Cloud 서비스 및 기타 인기 있는 Google Cloud 데이터베이스와 오픈소스 데이터베이스와 상호작용할 수 있는 에이전트 기반 환경을 제공합니다.
Gemini CLI에 대한 자세한 내용은 Gemini CLI 문서를 참고하세요.
확장 프로그램 작동 방식
확장 프로그램은 Gemini CLI의 기능을 확장하므로 특정 Google Cloud 서비스와 기타 도구에 연결하고 이를 제어할 수 있습니다. 확장 프로그램은 Gemini에 컨텍스트와 API 이해를 제공하여 대화형 상호작용을 지원합니다. GitHub URL, 로컬 디렉터리 또는 레지스트리에서 확장 프로그램을 로드할 수 있습니다. 이러한 확장 프로그램은 도구, 슬래시 명령어, 프롬프트를 제공합니다. 이는 MCP 도구 상자를 통해 통합되는 Gemini Code Assist와 같은 IDE 확장 프로그램과는 별개입니다.
BigQuery 확장 프로그램 정보
BigQuery는 Gemini CLI를 통해 BigQuery 데이터로 작업할 수 있는 다음과 같은 확장 프로그램을 제공합니다.
- BigQuery 데이터 분석 확장 프로그램
- 이 확장 프로그램을 사용하여 데이터를 탐색하고, BigQuery 테이블 및 데이터 세트에 대해 자세히 알아보고, 데이터 세트에 관해 자연어로 질문하세요. 기본 제공 고급 도구를 사용하여 예측을 생성하거나 기여도 분석을 실행할 수도 있습니다. 이 확장 프로그램의 도구를 사용하면 Gemini CLI가 자연어 질문을 기반으로 SQL 쿼리를 작성한 다음 쿼리를 실행하여 질문에 대한 답변을 제공할 수 있습니다.
- BigQuery 대화형 분석 확장 프로그램
- 이 확장 프로그램을 사용하여 사전 호스팅된 서버 측 분석 에이전트를 통해 BigQuery 데이터에서 고급 통계를 얻으세요. 이 확장 프로그램의 도구를 사용하면 Gemini CLI가 자연어 질문을 호스팅된 기본 제공 에이전트에 전송하고 데이터에서 더 깊은 인사이트로 응답할 수 있습니다.
BigQuery 데이터 분석 도구
BigQuery 데이터 분석 확장 프로그램은 다음과 같은 도구를 제공합니다.
카테고리 | 도구 | 자연어 프롬프트 예시 |
---|---|---|
데이터 세트 및 테이블 정보 | get_dataset_info |
my_dataset 데이터 세트에 관한 정보 가져오기 |
get_table_info |
my_dataset.my_table 테이블에 대한 정보 가져오기 | |
list_dataset_ids |
my_project 프로젝트의 모든 데이터 세트 나열 | |
list_table_ids |
my_dataset 데이터 세트의 모든 테이블 나열 | |
검색 | search_catalog |
PyPi 다운로드와 관련된 테이블 찾기 |
SQL 실행 | execute_sql |
bigquery-public-data.pypi.file_downloads를 사용하여 이번 달에 가장 많이 다운로드된 상위 10개 pypi 패키지를 보여줘. |
시계열 예측 | bigquery_forecast |
my_table 테이블에서 10기간의 판매 예측 |
기여 분석 | analyze_contribution |
my_table 테이블에서 국가별 수익 기여도 분석 |
대화형 분석 도구
대화형 분석 확장 프로그램은 다음 도구를 제공합니다.
카테고리 | 도구 | 자연어 프롬프트 예시 |
---|---|---|
검색 | search_catalog |
PyPi 다운로드와 관련된 테이블 찾기 |
대화형 분석 | ask_data_insights |
ask_data_insights를 사용하고 bigquery-public-data.google_analytics_sample 아래의 테이블을 사용하여 집중해야 하는 채널과 그 이유를 알려줘. |
시작하기 전에
시작하기 전에 다음이 필요합니다.
- 하나 이상의 Google Cloud 프로젝트에 대한 액세스 권한
데이터 분석 확장 프로그램의 경우 다음 API를 사용 설정합니다.
- BigQuery
search_catalog
도구 사용: Dataplex 범용 카탈로그
Conversational Analytics 확장 프로그램의 경우 다음 API를 사용 설정합니다.
- BigQuery
- Dataplex Universal Catalog
ask_data_insights
도구: Google Cloud를 위한 Gemini API, Gemini, Gemini 기반 데이터 분석 API
필요한 역할
Gemini CLI로 BigQuery 확장 프로그램을 사용하는 데 필요한 권한을 얻으려면 관리자에게 리소스 관리자 리소스 (프로젝트, 폴더, 조직) 또는 데이터 세트와 같은 하위 수준 리소스에 다음 IAM 역할을 부여해 달라고 요청하세요.
-
Google Cloud 프로젝트에서 BigQuery 쿼리 실행:
BigQuery 사용자 (
roles/bigquery.user
) -
기본 메타데이터 도구를 사용하여 BigQuery 데이터 세트 및 테이블 메타데이터를 가져옵니다.
BigQuery 메타데이터 뷰어 (
roles/bigquery.metadataViewer
) -
Conversational Analytics 확장 프로그램 사용: Google Cloud를 위한 Gemini 사용자 (
roles/cloudaicompanion.user
)
역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.
커스텀 역할이나 다른 사전 정의된 역할을 통해 필요한 권한을 얻을 수도 있습니다.
BigQuery 확장 프로그램 설치
BigQuery 확장 프로그램을 설치한 다음 이를 사용하여 데이터를 탐색하고 분석합니다.
Gemini CLI를 설치합니다.
환경 변수를 설정하여 BigQuery 프로젝트에 연결합니다.
export BIGQUERY_PROJECT="PROJECT_ID"
PROJECT_ID
를 Google Cloud프로젝트 ID로 바꿉니다.다음 선택적 환경 변수를 설정할 수도 있습니다.
BIGQUERY_LOCATION
: 데이터 세트 위치(예:export BIGQUERY_LOCATION="us"
)BIGQUERY_USE_CLIENT_OAUTH
: 클라이언트 측 OAuth를 사용할지 여부입니다(예:export BIGQUERY_USE_CLIENT_OAUTH=true
).
gemini extension install
명령어를 사용하여 BigQuery 데이터 분석 또는 대화형 분석 확장 프로그램을 설치합니다.선택사항: BigQuery 데이터 분석 확장 프로그램 설치
gemini extensions install https://github.com/gemini-cli-extensions/bigquery-data-analytics
선택사항: BigQuery 대화형 분석 확장 프로그램을 설치합니다.
gemini extensions install https://github.com/gemini-cli-extensions/bigquery-conversational-analytics
대화형 모드에서 Gemini CLI를 시작하여 데이터를 탐색하고 분석합니다.
gemini
CLI는 BigQuery 확장 프로그램과 도구를 자동으로 로드하므로 이를 사용하여 데이터와 상호작용할 수 있습니다.
데이터를 탐색하고 분석하기 위한 프롬프트 예시
Gemini CLI에 프롬프트를 입력합니다. 다음 예시를 사용하여 시작할 수 있습니다.
표 탐색 및 분석
다음 예시 프롬프트를 사용하면 테이블을 탐색하고 분석할 수 있습니다.
PyPi 다운로드와 관련된 테이블을 찾는 프롬프트 예시:
Find tables related to PyPi downloads
응답 예시
Gemini CLI는 관련 테이블 목록을 반환합니다.
✦ I found the following tables related to PyPi downloads: * file_downloads: projects/bigquery-public-data/datasets/pypi/tables/file_downloads * distribution_metadata: projects/bigquery-public-data/datasets/pypi/tables/distribution_metadata
이번 달에 가장 많이 다운로드된 상위 10개 PyPI 패키지를 보여주는 프롬프트 예시:
Using bigquery-public-data.pypi.file_downloads show me top 10 downloaded pypi packages this month
응답 예시
Gemini CLI는 상위 10개 패키지를 반환합니다.
✦ Here are the top 10 most downloaded PyPI packages this month: 1. boto3: 685,007,866 downloads 2. botocore: 531,034,851 downloads 3. urllib3: 512,611,825 downloads 4. requests: 464,595,806 downloads 5. typing-extensions: 459,505,780 downloads 6. certifi: 451,929,759 downloads 7. charset-normalizer: 428,716,731 downloads 8. idna: 409,262,986 downloads 9. grpcio-status: 402,535,938 downloads 10. aiobotocore: 399,650,559 downloads
ask_data_insights
도구를 사용하여 더 심층적인 인사이트 실행
ask_data_insights
도구는 BigQuery Conversational Analytics API에서 에이전트를 트리거하여 질문에 대한 답을 얻습니다. 서버 측 에이전트는 데이터에 대한 추가 컨텍스트를 수집하고 더 많은 인사이트를 제공합니다.
집중해야 할 채널에 대한 유용한 정보를 얻기 위한 프롬프트 예시:
Using ask_data_insights and using the tables under bigquery-public-data.google_analytics_sample, tell me the channels I should focus on and why
응답 예시
Gemini CLI는 분석을 기반으로 추천을 반환합니다.
Based on the analysis of the Google Analytics sample data, here are the channels you should focus on and why: ┌─────────────────┬──────────────┬─────────────────┬────────────────────┬───────────────┐ │ Channel │ Total Visits │ Total Pageviews │ Total Transactions │ Total Revenue │ ├─────────────────┼──────────────┼─────────────────┼────────────────────┼───────────────┤ │ Referral │ 104,838 │ 707,597 │ 5,543 │ $651,429.91 │ │ Direct │ 143,026 │ 584,840 │ 2,219 │ $434,840.55 │ │ Organic Search │ 381,561 │ 1,569,218 │ 3,581 │ $326,380.51 │ │ Display │ 6,262 │ 34,202 │ 152 │ $78,337.46 │ │ Paid Search │ 25,326 │ 136,060 │ 479 │ $43,558.90 │ │ Social │ 226,117 │ 398,690 │ 131 │ $4,916.54 │ │ Affiliates │ 16,403 │ 47,417 │ 9 │ $597.38 │ │ (Other) │ 120 │ 442 │ 1 │ $9.99 │ └─────────────────┴──────────────┴─────────────────┴────────────────────┴───────────────┘ Recommendations: 1. Prioritize referral traffic: * Why: This is a highly valuable channel. It brings in the most revenue and has a high number of transactions, despite not having the highest number of visits. This indicates that traffic from referrals is highly qualified and converts well. * Action: Identify your top referring websites and build stronger relationships with them. Look for similar websites to partner with. 2. Nurture your direct traffic: * Why: Direct traffic is your second-highest revenue source. These are likely returning customers or people who know your brand well.
가격 책정
메타데이터 도구 (예: get_dataset_info
, get_table_info
, list_dataset_ids
, list_table_ids
) 또는 search_catalog
도구를 사용하는 데 추가 비용이 들지 않습니다.
execute_sql
, bigquery_forecast
, analyze_contribution
를 비롯한 쿼리를 실행하는 도구는 프로젝트 구성에 따라 BigQuery 주문형 가격 또는 BigQuery 용량 가격에 따라 요금이 청구됩니다.
베타 (v1.0 이전) 기간에는 ask_data_insights
도구가 추가 비용 없이 제공되지만 이 도구로 트리거되는 BigQuery 쿼리에는 표준 BigQuery 가격 책정이 적용됩니다.
다음 단계
- MCP, Gemini CLI 및 기타 에이전트와 함께 BigQuery 사용에 대해 자세히 알아보세요.
- BigQuery의 Gemini 자세히 알아보기
- GitHub의 데이터 분석 확장 프로그램을 참고하세요.
- GitHub에서 Conversational Analytics 확장 프로그램을 참고하세요.