Gemini 지원을 활용해 데이터 분석하기
이 튜토리얼에서는 BigQuery의 Gemini에서 AI 기반 지원을 사용하여 데이터를 분석하는 방법을 설명합니다.
이 튜토리얼의 예시에서는 여러분이 데이터 세트에서 제품 판매를 분석하고 예측해야 하는 데이터 분석가라고 가정합니다.
이 튜토리얼에서는 사용자가 SQL 및 기본 데이터 분석 태스크에 익숙하다고 가정합니다. Google Cloud 제품에 대한 지식이 있다고 가정하지 않습니다. BigQuery를 처음 사용하는 경우 BigQuery 빠른 시작을 참조하세요.
목표
- BigQuery의 Gemini를 사용하여 BigQuery가 특정 데이터 분석 태스크를 처리하는 방법에 대한 질문에 답합니다.
- BigQuery의 Gemini에 데이터 세트를 찾고 SQL 쿼리를 설명하고 생성하도록 요청합니다.
- 미래를 예측하는 머신러닝(ML) 모델을 빌드합니다.
비용
이 튜토리얼에서는 다음과 같은 요금이 청구되는 Google Cloud 제품을 사용합니다.
예상 사용량을 토대로 비용을 추정하려면 가격 계산기를 사용하세요.
시작하기 전에
- 
  
   
   
     
   
  
   
   
     
   
  
 
   
 
 
  
    
    
      In the Google Cloud console, on the project selector page, select or create a Google Cloud project. Roles required to select or create a project - Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
- 
      Create a project: To create a project, you need the Project Creator
      (roles/resourcemanager.projectCreator), which contains theresourcemanager.projects.createpermission. Learn how to grant roles.
 
- BigQuery의 Gemini가 Google Cloud 프로젝트에 설정되어 있는지 확인합니다.
- Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다. 
- 이름이 - bqml_tutorial인 데이터 세트를 만듭니다. 데이터 세트를 사용하여 테이블 및 모델을 포함한 데이터베이스 객체를 저장합니다.
- 이 튜토리얼을 완료하는 데 필요한 BigQuery의 Gemini 기능을 사용 설정하려면 BigQuery 툴바에서 pen_spark Gemini를 클릭한 후 다음 옵션을 선택합니다. - 자동 완성
- 자동 생성
- 설명
 
BigQuery 기능 알아보기
시작하기 전에 BigQuery에서 데이터 쿼리를 처리하는 방법을 자세히 알아보려고 한다고 가정해 보겠습니다. 지원을 받으려면 BigQuery의 Gemini에 다음과 같은 자연어 문(또는 프롬프트)을 작성하면 됩니다.
- 'BigQuery를 시작하려면 어떻게 해야 해'
- '데이터 분석에 BigQuery를 사용하면 어떤 이점이 있어?'
- 'BigQuery에서는 쿼리의 자동 확장을 어떻게 처리해?'
BigQuery의 Gemini는 데이터 분석 방법에 대한 정보도 제공할 수 있습니다. 이러한 유형의 도움말을 위해 다음과 같은 프롬프트를 전송할 수 있습니다.
- "BigQuery에서 시계열 예측 모델을 만들려면 어떻게 해야 하나요?"
- "BigQuery에 다른 유형의 데이터를 로드하려면 어떻게 해야 하나요?"
데이터 액세스 및 분석
BigQuery의 Gemini를 사용하면 분석을 위해 액세스할 수 있는 대상 데이터와 해당 데이터를 분석하는 방법을 파악할 수 있습니다.
이 예시에서는 다음과 관련하여 도움이 필요하다고 가정해 보겠습니다.
- 분석할 판매 데이터 세트 및 테이블 찾기
- 데이터 테이블 및 쿼리가 판매 데이터 세트와 어떻게 관련되어 있는지 알아보기
- 복잡한 쿼리를 이해하고 데이터 세트를 사용하는 쿼리 작성
데이터 찾기
데이터를 쿼리하려면 먼저 어떤 데이터에 액세스할 수 있는지 알아야 합니다. 모든 데이터 제품은 데이터를 다르게 구성하고 저장합니다.
지원을 받으려면 BigQuery의 Gemini에 "BigQuery에서 사용할 수 있는 데이터 세트 및 테이블을 알아보려면 어떻게 해야 하나요?"와 같은 프롬프트를 작성하면 됩니다.
- Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다. 
- Google Cloud 콘솔 툴바에서 spark Gemini Cloud Assist 채팅 열기 또는 닫기를 클릭합니다. 
- Cloud Assist 패널에 - How do I learn which datasets and tables are available to me in BigQuery?프롬프트를 입력합니다.
- 프롬프트 전송(send)을 클릭합니다. - Google Cloud 를 위한 Gemini에서 사용자 데이터를 사용하는 방법과 시점을 알아보세요. - 응답에는 프로젝트, 데이터 세트 또는 데이터 세트 내의 테이블을 나열하는 여러 가지 방법이 포함되어 있습니다. 
- 선택사항: 채팅 기록을 재설정하려면 Cloud Assist 패널에서 delete 채팅 지우기를 클릭한 다음 채팅 재설정을 클릭합니다. 
BigQuery에서 SQL 이해 및 작성
이 예시에서는 분석할 데이터를 선택했으며 이제 해당 데이터를 쿼리하려고 한다고 가정합니다. BigQuery의 Gemini는 복잡하고 파싱하기 어려운 쿼리를 이해하거나 새로운 SQL 쿼리를 생성하는 등 SQL을 사용하는 데 도움을 줄 수 있습니다.
Gemini에 SQL 쿼리 설명 지원을 요청하는 프롬프트 입력하기
다른 사람이 작성한 복잡한 쿼리를 이해하고 싶다고 가정해 보겠습니다. BigQuery의 Gemini는 쿼리 구문, 기본 스키마, 비즈니스 컨텍스트와 같은 평이한 언어로 쿼리를 설명할 수 있습니다.
- Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다. 
- 쿼리 편집기에서 설명이 필요한 쿼리를 열거나 붙여넣습니다. 예를 들면 다음과 같습니다. - SELECT u.id AS user_id, u.first_name, u.last_name, avg(oi.sale_price) AS avg_sale_price FROM `bigquery-public-data.thelook_ecommerce.users` AS u JOIN `bigquery-public-data.thelook_ecommerce.order_items` AS oi ON u.id = oi.user_id GROUP BY 1, 2, 3 ORDER BY avg_sale_price DESC LIMIT 10
- 쿼리를 강조 표시한 다음 auto_awesome 이 선택한 쿼리 설명을 클릭합니다. - Cloud Assist 패널에 다음과 비슷한 응답이 반환됩니다. - The intent of this query is to find the top 10 users by average sale price. The query first joins the users and order_items tables on the user_id column. It then groups the results by user_id, first_name, and last_name, and calculates the average sale price for each group. The results are then ordered by average sale price in descending order, and the top 10 results are returned.
일별 및 제품별로 판매를 그룹화하는 SQL 쿼리 생성하기
이 예에서는 매일 인기 제품을 나열하는 쿼리를 생성하려고 합니다. 그런 다음 thelook_ecommerce 데이터 세트의 테이블을 사용하고 BigQuery의 Gemini가 주문된 상품 및 제품 이름별로 매출을 계산하는 쿼리를 생성하도록 요청합니다.
이러한 유형의 쿼리는 복잡할 수 있지만 BigQuery의 Gemini를 사용하면 문을 자동으로 만들 수 있습니다. 데이터 스키마를 기반으로 SQL 쿼리를 생성하라는 프롬프트를 제공할 수 있습니다. 데이터 스키마에 대해 잘 모르거나, SQL 문법에 대한 기본 지식만 있거나 노 코드로 시작하더라도 Gemini 지원은 하나 이상의 SQL 문을 추천합니다.
BigQuery의 Gemini가 인기 제품이 나열된 쿼리를 생성하도록 프롬프트를 입력하려면 다음 단계를 따릅니다.
- Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다. 
- 탐색 메뉴에서 Studio를 클릭합니다. 
- SQL 쿼리를 클릭합니다. Explorer 창에 선택한 데이터베이스가 자동으로 로드됩니다. 
- 쿼리 편집기에서 다음 프롬프트를 입력한 다음 Enter 키를 누릅니다. - # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products- 우물 정자( - #)는 BigQuery의 Gemini에 SQL을 생성하도록 요청합니다. BigQuery의 Gemini는 다음과 유사한 SQL 쿼리를 제안합니다.- SELECT sum(sale_price), DATE(created_at), product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3
- 추천된 코드를 수락하려면 Tab 키를 누른 다음 실행을 클릭하여 SQL 문을 실행합니다. 제안된 SQL을 스크롤하고 문에서 제안된 특정 단어를 수락할 수도 있습니다. 
- 쿼리 결과 창에서 쿼리 결과를 확인합니다. 
예측 모델을 빌드하고 결과 보기
이 예시에서는 BigQuery ML을 사용하여 다음을 수행합니다.
- 추세 쿼리를 사용하여 예측 모델을 빌드합니다.
- BigQuery의 Gemini를 사용하여 예측 모델의 결과를 확인하는 쿼리를 이해하고 작성해 봅니다.
다음은 모델에 대한 입력으로 사용되는 실제 판매와 함께 다음 쿼리 예시를 사용합니다. 이 쿼리는 ML 모델을 생성할 때 사용됩니다.
- 예측 ML 모델을 만들려면 쿼리 편집기에서 다음 SQL 쿼리를 실행합니다. - CREATE MODEL bqml_tutorial.sales_forecasting_model OPTIONS ( MODEL_TYPE = 'ARIMA_PLUS', time_series_timestamp_col = 'date_col', time_series_data_col = 'total_sales', time_series_id_col = 'product_id') AS SELECT sum(sale_price) AS total_sales, DATE(created_at) AS date_col, product_id FROM `bigquery-public-data.thelook_ecommerce.order_items` AS t1 INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2 ON t1.product_id = t2.id GROUP BY 2, 3;- BigQuery의 Gemini를 사용하여 이 쿼리를 이해하는 데 도움이 될 수 있습니다. - 모델이 생성되면 쿼리 결과 창의 결과 탭에 다음과 유사한 메시지가 표시됩니다. - Successfully created model named sales_forecasting_model.
- Cloud Assist 패널에 작업이 완료되면 모델이 예측한 값을 가져오기 위한 쿼리 작성을 도와달라는 프롬프트를 BigQuery의 Gemini에 입력합니다(예: - How can I get a forecast in SQL from the model?입력).- 프롬프트의 컨텍스트에 따라 대답에는 판매를 예측하는 ML 모델의 예시가 포함됩니다. - SELECT * FROM ML.FORECAST( MODEL `PROJECT_ID.bqml_tutorial.sales_forecasting_model`, STRUCT( 7 AS horizon, 0.95 AS confidence_level))- 이 응답에서 - PROJECT_ID는Google Cloud 프로젝트입니다.
- Cloud Assist 패널에서 SQL 쿼리를 복사합니다. 
- 쿼리 편집기에서 SQL 쿼리를 실행합니다. 
삭제
이 튜토리얼에서 사용된 리소스에 대한 비용이 Google Cloud 계정에 청구되지 않게 하려면 이 튜토리얼에서 만든 Google Cloud 프로젝트를 삭제하면 됩니다. 또는 개별 리소스를 삭제할 수 있습니다.
프로젝트 삭제
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
데이터 세트 삭제
프로젝트를 삭제하면 프로젝트의 데이터 세트와 테이블이 모두 삭제됩니다. 프로젝트를 다시 사용하려면 이 튜토리얼에서 만든 데이터 세트를 삭제할 수 있습니다.
- Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다. 
- 앞서 만든 - bqml_tutorial데이터 세트를 탐색 메뉴에서 선택합니다.
- 데이터 세트, 테이블, 모든 데이터를 삭제하려면 데이터 세트 삭제를 클릭합니다. 
- 삭제를 확인하려면 데이터 세트 삭제 대화상자에 데이터 세트 이름( - bqml_tutorial)을 입력한 후 삭제를 클릭합니다.
다음 단계
- Gemini Google Cloud 개요 읽어보기
- Gemini Google Cloud 할당량 및 한도 알아보기
- Gemini Google Cloud위치 알아보기
- 데이터 인사이트를 생성하여 데이터를 탐색하는 방법 알아보기
- BigQuery에서 Gemini 지원을 사용하여 쿼리를 작성하는 방법을 자세히 알아보세요.