이 페이지는 Cloud Translation API를 통해 번역되었습니다.

Dataplex Universal Catalog에서 데이터 인사이트 액세스

데이터 분석가는 익숙하지 않은 새 테이블을 탐색할 때 쿼리 작성을 시작하는 방법에 관한 콜드 스타트 문제에 직면하는 경우가 많습니다. 이 문제에는 데이터 구조와 데이터의 주요 패턴에 대한 불확실성이 포함될 수 있습니다.

데이터 인사이트는 테이블의 메타데이터를 기반으로 자연어 쿼리와 이에 상응하는 SQL을 자동으로 생성하여 콜드 스타트 문제를 해결합니다. 빈 쿼리 편집기로 시작하는 대신 가치 있는 통계를 제공하는 의미 있는 쿼리로 데이터 탐색을 빠르게 시작할 수 있습니다. 자세히 조사하려면 데이터 캔버스에서 후속 질문을 할 수 있습니다.

Dataplex Universal Catalog 데이터 통계 기능은 데이터를 탐색하고 이해하기 위한 자동화된 방법을 제공합니다. 이를 통해 패턴을 파악하고, 데이터 품질을 평가하고, 통계 분석을 수행할 수 있습니다.

시작하기 전에

데이터 인사이트는 BigQuery의 Gemini를 사용하여 생성되며 BigQuery Studio에서만 생성할 수 있습니다. 먼저 BigQuery의 Gemini를 설정한 다음 BigQuery에서 통계를 생성합니다. Gemini는 us-central1 리전에서만 인사이트를 얻기 위해 메타데이터를 처리합니다. 자세한 내용은 Gemini 제공 위치를 참조하세요. 인사이트를 생성한 후에는 Dataplex Universal Catalog에서 확인할 수 있습니다.

필요한 역할

생성된 통계에 대한 읽기 전용 액세스 권한을 얻으려면 관리자에게 다음 IAM 역할을 부여해 달라고 요청하세요.

통계를 보려는 BigQuery 테이블이 포함된 프로젝트에 대한 Dataplex DataScan DataViewer(roles/dataplex.dataScanDataViewer)

역할 부여에 대한 상세 설명은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

커스텀 역할 또는 기타 사전 정의된 역할을 통해 필요한 권한을 얻을 수도 있습니다. 통계를 생성하는 데 필요한 정확한 권한을 보려면 필수 권한 섹션을 펼치세요.

필수 권한

dataplex.datascans.get
dataplex.datascans.getData

API 사용 설정

데이터 통계를 사용하려면 프로젝트에서 Dataplex API, BigQuery API, Google Cloud를 위한 Gemini API를 사용 설정하세요.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the APIs

Gemini for Google Cloud API 사용 설정에 대한 자세한 내용은 Google Cloud 프로젝트에서 Gemini for Google Cloud API 사용 설정을 참고하세요.

데이터 인사이트 정보

데이터 인사이트는 테이블의 메타데이터를 기반으로 자연어 쿼리와 이에 상응하는 SQL을 자동으로 생성합니다.

통계 실행의 예

다음 메타데이터가 포함된 telco_churn이라는 테이블이 있다고 가정해보겠습니다.

필드 이름	유형
CustomerID	`STRING`
성별	`STRING`
Tenure	`INT64`
InternetService	`STRING`
StreamingTV	`STRING`
OnlineBackup	`STRING`
계약	`STRING`
TechSupport	`STRING`
PaymentMethod	`STRING`
MonthlyCharges	`FLOAT`
Churn	`BOOLEAN`

다음은 데이터 인사이트가 이 테이블에 대해 생성하는 몇 가지 샘플 쿼리입니다.

모든 프리미엄 서비스를 구독하고 50개월 넘게 고객으로 등록된 이력이 있는 고객을 식별합니다.

SELECT
  CustomerID,
  Contract,
  Tenure
FROM
  agentville_datasets.telco_churn
WHERE
  OnlineBackup = 'Yes'
  AND TechSupport = 'Yes'
  AND StreamingTV = 'Yes'
  AND Tenure > 50;

고객 이탈이 가장 많은 인터넷 서비스를 파악합니다.

SELECT
  InternetService,
  COUNT(DISTINCT CustomerID) AS total_customers
FROM
  agentville_datasets.telco_churn
WHERE
  Churn = TRUE
GROUP BY
  InternetService
ORDER BY
  total_customers DESC
LIMIT 1;

가치가 높은 고객의 세그먼트별 이탈률을 파악합니다.

SELECT
  Contract,
  InternetService,
  Gender,
  PaymentMethod,
  COUNT(DISTINCT CustomerID) AS total_customers,
  SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) AS churned_customers,
  (SUM(CASE WHEN Churn = TRUE THEN 1 ELSE 0 END) / COUNT(DISTINCT CustomerID))
  * 100 AS churn_rate
FROM
  agentville_datasets.telco_churn
WHERE
  MonthlyCharges > 100
GROUP BY
  Contract,
  InternetService,
  Gender,
  PaymentMethod;

통계 보기

BigQuery 테이블의 인사이트를 보려면 Dataplex Universal Catalog 검색을 사용하세요.

Google Cloud 콘솔에서 Dataplex Universal Catalog 검색 페이지로 이동합니다.

검색 페이지로 이동
통계를 보려는 BigQuery 테이블을 검색합니다.
검색 결과에서 표를 클릭하여 항목 페이지를 엽니다.
통계 탭을 클릭합니다. 탭이 비어 있는 경우 이 표의 통계가 아직 생성되지 않았음을 의미합니다. BigQuery Studio에서 데이터 통계를 생성할 수 있습니다.

가격 책정

이 기능의 가격 책정에 관한 자세한 내용은 BigQuery의 Gemini 가격 책정 개요를 참고하세요.

할당량 및 한도

이 기능의 할당량 및 한도에 대한 자세한 내용은 BigQuery의 Gemini 할당량을 참조하세요.

위치

Gemini는 전역적으로 작동하므로 데이터 처리를 특정 리전으로 제한할 수 없습니다. BigQuery의 Gemini에서 데이터를 처리하는 위치에 대한 자세한 내용은 Gemini 제공 위치를 참조하세요.

제한사항

BigQuery 테이블, BigLake 테이블, 외부 테이블, 뷰에 대한 데이터 인사이트를 사용할 수 있습니다.
멀티 클라우드 고객은 다른 클라우드의 데이터를 사용할 수 없습니다.
데이터 인사이트는 Geo 또는 JSON 열 유형을 지원하지 않습니다.
통계를 실행할 때마다 매번 쿼리가 표시되는 것은 아닙니다. 보다 흥미로운 쿼리를 생성할 가능성을 높이려면 BigQuery Studio에서 인사이트를 다시 생성하세요.

다음 단계

BigQuery에서 통계를 생성하는 방법 알아보기
데이터 프로파일링 스캔을 생성하는 방법 알아보기
BigQuery에서 Gemini 지원을 사용하여 쿼리를 작성하는 방법 알아보기