데이터 캔버스로 분석

BigQuery 데이터 캔버스에 대한 의견을 제공하거나 지원을 요청하려면 datacanvas-feedback@google.com으로 이메일을 보내주세요.

BigQuery 데이터 캔버스를 사용하면 자연어를 사용하여 데이터를 검색, 변환, 쿼리, 시각화할 수 있습니다. BigQuery 데이터 캔버스는 방향성 비순환 그래프(DAG)의 데이터 소스, 쿼리, 시각화 작업에 사용할 수 있는 분석용 그래픽 인터페이스를 제공하므로 멘탈 모델에 매핑되는 분석 워크플로의 그래픽 뷰를 제공합니다. BigQuery 데이터 캔버스에서 쿼리 결과를 반복하고 한 곳에서 여러 문의 분기로 작업할 수 있습니다.

BigQuery 데이터 캔버스는 데이터에서 유용한 정보를 도출하는 데 도움이 되도록 설계되었습니다. 특정 도구 또는 제품에 대한 기술 지식이 없어도 데이터를 작업할 수 있습니다. BigQuery 데이터 캔버스는 Dataplex 메타데이터와 함께 작동하여 자연어를 기반으로 적절한 테이블을 식별합니다.

BigQuery 데이터 캔버스는 Gemini를 사용하여 데이터를 찾고, SQL을 만들고, 차트를 생성하고, 데이터 요약을 만듭니다.

기능

BigQuery 데이터 캔버스는 다음 기능을 지원합니다.

  • 테이블, 뷰 또는 구체화된 뷰와 같은 Dataplex 메타데이터와 함께 키워드 검색 문법을 사용하여 테이블 애셋을 찾습니다.

  • 다음과 같은 간단한 SQL 쿼리에 자연어를 사용합니다.

    • SELECT FROM, 수학 함수, 배열, 구조체가 포함된 쿼리
    • 두 테이블 간의 JOIN
  • 다음 차트 유형을 포함한 일반적인 시각화

    • 막대 그래프
    • 히트맵
    • 선 그래프
    • 원형 차트
    • 분산형 차트
  • 자연어를 사용하여 원하는 내용을 설명할 수 있는 커스텀 시각화

  • 자동화된 데이터 통계.

BigQuery 데이터 캔버스에는 다음과 같은 제한사항이 있습니다.

  • 자연어 명령어는 다음 작업 시 어려울 수 있습니다.

    • BigQuery ML
    • Apache Spark
    • 객체 테이블
    • BigLake
    • INFORMATION_SCHEMA
    • JSON
    • 중첩되고 반복되는 필드
    • 복잡한 함수 및 데이터 유형(예: DATETIME, TIMEZONE)
  • 데이터 시각화는 Geomap 차트에서 작동하지 않습니다.

시작하기 전에

BigQuery 기능에서 Gemini에 액세스하려면 관리자가 BigQuery에서 Gemini를 사용 설정해야 합니다. 자세한 내용은 BigQuery에서 Gemini 설정을 참조하세요.

BigQuery 데이터 캔버스를 사용하는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 다음 IAM 역할을 부여해 달라고 요청하세요.

역할 부여에 대한 자세한 내용은 액세스 관리를 참조하세요.

커스텀 역할이나 다른 사전 정의된 역할을 통해 필요한 권한을 얻을 수도 있습니다.

BigQuery 데이터 캔버스 작업

BigQuery 데이터 캔버스를 통해 자연어 전달 방식으로 데이터를 탐색, 변환, 쿼리, 시각화할 수 있습니다. 다음 예시에서는 데이터 탐색부터 시각화까지 샘플 워크플로를 포함하여 BigQuery 데이터 캔버스와 상호작용할 수 있는 몇 가지 방법을 보여줍니다.

BigQuery 데이터 캔버스 작업을 시작하려면 다음 안내를 따르세요.

  1. Google Cloud 콘솔로 이동합니다.

    BigQuery로 이동

  2. 탐색 메뉴에서 BigQuery Studio를 클릭합니다.

  3. 데이터 캔버스 만들기를 클릭합니다. 테이블 또는 쿼리에서 직접 BigQuery 데이터 캔버스를 시작할 수도 있습니다.

  4. 텍스트 필드에 자연어로 첫 번째 프롬프트를 입력합니다.

예시

다음 예시에서는 일반적인 BigQuery 데이터 캔버스 워크플로를 보여줍니다.

예시 1: 단일 테이블 작업

프롬프트 1: 데이터 찾기

Chicago taxi trips

잠재적 결과:

BigQuery 데이터 캔버스는 Dataplex 메타데이터를 기반으로 잠재적 테이블 목록을 생성합니다. 여러 테이블을 선택할 수 있습니다. 각 테이블에는 캔버스에 추가, 쿼리, 세부정보 옵션이 있습니다. 이 예시에서는 bigquery-public-data.chicago_taxi_trips.taxi_trips 테이블을 선택하고 캔버스에 추가를 클릭합니다.

taxi_trips의 테이블 셀이 BigQuery 데이터 캔버스에 추가됩니다. 테이블 셀의 탭을 순환하면서 스키마 정보, 테이블 세부정보, 데이터 미리보기를 확인할 수 있습니다.

쿼리를 클릭하여 자연어로 이 테이블을 쿼리합니다.

프롬프트 2: 선택한 테이블로 SQL 쿼리 만들기

Get me the 100 longest trips

잠재적 결과:

BigQuery 데이터 캔버스는 다음과 비슷한 SQL 쿼리를 생성합니다.

SELECT
  taxi_id,
  trip_start_timestamp,
  trip_end_timestamp,
  trip_miles
FROM
  `bigquery-public-data.chicago_taxi_trips.taxi_trips`
ORDER BY
  trip_miles DESC
LIMIT
  100;
  

또한 SQL 쿼리를 수동으로 수정하거나 자연어 프롬프트를 변경하고 쿼리를 다시 생성하여 쿼리를 수정할 수 있습니다. 이 예시에서는 자연어 프롬프트를 수정하여 고객이 현금으로 결제한 여행만 선택합니다.

프롬프트 3: 프롬프트를 변경하여 쿼리 수정

Get me the 100 longest trips where the payment type is cash

잠재적 결과

BigQuery 데이터 캔버스는 다음과 비슷한 SQL 쿼리를 생성합니다.

SELECT
  taxi_id,
  trip_start_timestamp,
  trip_end_timestamp,
  trip_miles
FROM
  `daui-storage.chicago_taxi_trips_123123.taxi_trips`
WHERE
  payment_type = 'Cash'
ORDER BY
  trip_miles DESC
LIMIT
  100;
  

실행을 클릭하여 쿼리 결과를 봅니다.

프롬프트 4: 차트 만들기

  1. 시각화를 클릭합니다.
  2. 막대 그래프 만들기를 클릭합니다.

잠재적 결과

BigQuery 데이터 캔버스는 이동 ID별 최대 이동 마일을 보여주는 막대 그래프를 만듭니다.

BigQuery 데이터 캔버스에는 차트와 함께 시각화를 지원하는 데이터의 주요 세부정보가 요약되어 있습니다. 시각화 세부정보를 클릭하고 측면 패널에서 차트를 수정하여 차트를 수정할 수 있습니다.

BigQuery 데이터 캔버스를 공유하려면 공유를 클릭한 다음 링크 공유를 클릭하여 BigQuery 데이터 캔버스 링크를 복사합니다.

BigQuery 데이터 캔버스를 삭제하려면 캔버스 지우기를 클릭합니다. 이렇게 하면 빈 캔버스가 남습니다.

예시 2: 여러 테이블 작업

프로프트 1:

Information about trees

잠재적 결과:

BigQuery 데이터 캔버스는 트리에 대한 정보가 포함된 여러 테이블을 제안합니다. 이 예시에서는 bigquery-public-data.new_york_trees.tree_census_1995bigquery-public-data.new_york_trees.tree_census_2015의 두 테이블을 사용합니다.

이러한 두 테이블을 모두 선택하면 캔버스에 표시됩니다.

이 예시에서는 bigquery-public-data.new_york_trees.tree_census_1995 테이블에서 조인을 클릭하여 두 테이블을 조인합니다. BigQuery 데이터 캔버스에서 조인할 테이블을 추천합니다. bigquery-public-data.new_york_trees.tree_census_2015를 선택합니다. 각 테이블에 연결된 새 창이 표시됩니다.

프롬프트 2:

Join these tables on their address

잠재적 결과

SELECT
  *
FROM
  `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015
JOIN
  `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995
ON
  t2015.address = t1995.address;

BigQuery 데이터 캔버스는 해당 주소에서 이 두 테이블을 조인할 수 있도록 SQL 쿼리를 제안합니다. 실행을 클릭하여 쿼리를 실행하고 결과를 봅니다.

BigQuery 데이터 캔버스를 사용하면 쿼리를 노트북으로 내보낼 수 있습니다. 노트북으로 내보내려면 다음 안내를 따르세요.

  1. 노트북으로 내보내기 탭을 클릭합니다.
  2. 노트북 저장 창에서 노트북을 저장할 이름과 리전을 입력합니다.
  3. 저장을 클릭합니다. 노트북이 생성되었습니다.
  4. BQ Studio에서 열기를 클릭하여 생성된 노트북을 확인합니다.

예시 3

프롬프트 1

Find data about USA names

잠재적 결과

BigQuery 데이터 캔버스는 테이블 목록을 생성합니다. 이 예시에서는 bigquery-public-data.usa_names.usa_1910_current 테이블을 선택합니다.

쿼리를 클릭하여 데이터를 쿼리합니다. 프롬프트를 입력하여 데이터를 쿼리합니다.

잠재적 결과

BigQuery 데이터 캔버스는 다음 쿼리를 생성합니다.

SELECT
  state,
  gender,
  year,
  name,
  number
FROM
  `bigquery-public-data.usa_names.usa_1910_current`

BigQuery 데이터 캔버스가 쿼리 결과를 생성합니다. 이 데이터를 필터링하기 위한 추가 쿼리를 살펴보겠습니다. 이 결과 쿼리를 클릭합니다.

프롬프트 2

Get me the top 10 most popular names in 1980

잠재적 결과

BigQuery 데이터 캔버스는 다음 쿼리를 생성합니다.

SELECT
  name,
  SUM(number) AS total_count
FROM
  `bigquery-public-data`.usa_names.usa_1910_current
WHERE
  year = 1980
GROUP BY
  name
ORDER BY
  total_count DESC
LIMIT
  10;

쿼리를 실행한 후 1980년에 태어난 아이의 가장 흔한 이름 10개가 포함된 테이블을 가져옵니다.

이 예시에서는 이러한 결과를 시각화해 보겠습니다. 시각화를 클릭합니다. BigQuery 데이터 캔버스는 막대 그래프, 원형 차트, 선 그래프, 커스텀 시각화를 비롯한 몇 가지 시각화 옵션을 제안합니다. 막대 그래프 만들기를 클릭합니다.

BigQuery 데이터 캔버스에서는 다음과 비슷한 막대 그래프를 만듭니다.

상위 10개 이름 막대 그래프

BigQuery 데이터 캔버스에는 차트와 함께 시각화를 지원하는 데이터의 주요 세부정보가 요약되어 있습니다. 시각화 세부정보를 클릭하고 측면 패널에서 차트를 수정하여 차트를 수정할 수 있습니다.

프롬프트 3

Create a bar chart sorted high to low, with a gradient

잠재적 결과

BigQuery 데이터 캔버스에서는 다음과 비슷한 막대 그래프를 만듭니다.

정렬된 상위 10개 이름 막대 그래프

추가로 변경하려면 시각화 세부정보를 클릭합니다. Vis 세부정보 사이드바가 표시됩니다. 차트 제목, x축 이름, y축 이름 등을 수정할 수 있습니다. 또한 JSON 탭을 클릭하면 JSON 값을 기반으로 차트를 직접 수정할 수 있습니다.

가격 책정

BigQuery 데이터 캔버스로 작업하는 동안 컴퓨팅 또는 스토리지 기반 가격 책정 모델에 따라 요금이 청구됩니다. 미리보기 중에는 BigQuery 데이터 캔버스와 함께 Gemini를 사용하는 데 추가 요금이 발생하지 않습니다.

의견 제공

Google에 의견을 제출하여 BigQuery 데이터 캔버스 추천을 개선하는 데 도움을 줄 수 있습니다. 의견을 제공하려면 다음 단계를 따르세요.

  1. Google Cloud 콘솔의 툴바에서 의견 제출을 클릭합니다.

  2. (선택사항) 복사를 클릭하여 DAG JSON 정보를 복사하여 의견에 추가 컨텍스트를 제공합니다.

  3. 양식을 클릭하고 양식을 작성하여 의견을 보내주세요.

데이터 공유 설정은 전체 프로젝트에 적용되며 serviceusage.services.enableserviceusage.services.list IAM 권한이 있는 프로젝트 관리자만 이 설정을 설정할 수 있습니다. 신뢰할 수 있는 테스터 프로그램에서 데이터 사용에 대한 자세한 내용은 Google Cloud 신뢰할 수 있는 테스터 프로그램의 Gemini를 참조하세요.

또한 datacanvas-feedback@google.com으로 연락하여 이 기능에 대한 직접 의견을 제공할 수 있습니다.

다음 단계