승인된 뷰 만들기


이 튜토리얼에서는 데이터 분석가가 사용하는 승인된 뷰를 BigQuery에서 만듭니다. 승인된 뷰를 사용하면 기본 소스 데이터에 대한 액세스 권한을 부여하지 않고도 특정 사용자 및 그룹과 쿼리 결과를 공유할 수 있습니다. 뷰에는 사용자 또는 그룹이 아닌 소스 데이터에 대한 액세스 권한이 부여됩니다. 뷰의 SQL 쿼리를 사용하여 쿼리 결과에서 열과 필드를 제외할 수도 있습니다.

승인된 뷰를 사용하는 대신 소스 데이터에 열 수준 액세스 제어를 설정한 다음 사용자에게 액세스 제어된 데이터를 쿼리하는 뷰에 대한 액세스 권한을 부여하는 방법을 사용할 수 있습니다. 열 수준 액세스 제어에 관한 자세한 내용은 열 수준 액세스 제어 소개를 참고하세요.

동일한 소스 데이터 세트에 액세스하는 승인된 뷰가 여러 개인 경우 개별 뷰를 승인하는 대신 뷰가 포함된 데이터 세트를 승인할 수 있습니다.

목표

  • 소스 데이터를 포함할 데이터 세트를 만듭니다.
  • 쿼리를 실행하여 소스 데이터 세트의 대상 테이블에 데이터를 로드합니다.
  • 승인된 뷰를 포함할 데이터 세트를 만듭니다.
  • 데이터 분석가가 쿼리 결과에서 볼 수 있는 열을 제한하는 SQL 쿼리에서 승인된 뷰를 만듭니다.
  • 데이터 분석가에게 쿼리 작업을 실행할 권한을 부여합니다.
  • 데이터 분석가에게 승인된 뷰가 포함된 데이터 세트에 대한 액세스 권한을 부여합니다.
  • 승인된 뷰에 소스 데이터 세트에 대한 액세스 권한을 부여합니다.

비용

이 문서에서는 비용이 청구될 수 있는 다음과 같은 Google Cloud 구성요소를 사용합니다.

프로젝트 사용량을 기준으로 예상 비용을 산출하려면 가격 계산기를 사용하세요. Google Cloud를 처음 사용하는 사용자는 무료 체험판을 사용할 수 있습니다.

이 문서에 설명된 태스크를 완료했으면 만든 리소스를 삭제하여 청구가 계속되는 것을 방지할 수 있습니다. 자세한 내용은 삭제를 참조하세요.

시작하기 전에

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  4. Make sure that billing is enabled for your Google Cloud project.

  5. Enable the BigQuery API.

    Enable the API

  6. 이 문서의 태스크를 수행하는 데 필요한 권한이 있는지 확인합니다.

필요한 역할

새 프로젝트를 만드는 경우 프로젝트 소유자가 되며 이 튜토리얼을 완료하는 데 필요한 모든 필수 IAM 권한이 부여됩니다.

기존 프로젝트를 사용하는 경우 다음 역할이 필요합니다.

Make sure that you have the following role or roles on the project:

Check for the roles

  1. In the Google Cloud console, go to the IAM page.

    Go to IAM
  2. Select the project.
  3. In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.

  4. For all rows that specify or include you, check the Role column to see whether the list of roles includes the required roles.

Grant the roles

  1. In the Google Cloud console, go to the IAM page.

    IAM으로 이동
  2. 프로젝트를 선택합니다.
  3. 액세스 권한 부여를 클릭합니다.
  4. 새 주 구성원 필드에 사용자 식별자를 입력합니다. 일반적으로 Google 계정의 이메일 주소입니다.

  5. 역할 선택 목록에서 역할을 선택합니다.
  6. 역할을 추가로 부여하려면 다른 역할 추가를 클릭하고 각 역할을 추가합니다.
  7. 저장을 클릭합니다.
  8. BigQuery의 역할에 대한 자세한 내용은 사전 정의된 IAM 역할을 참고하세요.

    필수 권한

    이 튜토리얼에서 사용되는 리소스를 만들려면 다음 권한이 필요합니다. BigQuery Studio 관리자 사전 정의된 역할은 이러한 모든 권한을 부여합니다.

    • bigquery.datasets.create를 사용하여 소스 데이터 세트와 승인된 뷰가 포함된 데이터 세트를 만듭니다.
    • bigquery.tables.create를 사용하여 소스 데이터를 저장하는 테이블을 만들고 승인된 뷰를 만듭니다.
    • 소스 테이블에 데이터를 로드하는 쿼리 작업을 실행할 수 있는 bigquery.jobs.create 권한
    • bigquery.datasets.getIamPolicybigquery.datasets.get를 사용하여 소스 데이터 세트와 승인된 뷰가 포함된 데이터 세트에 대한 IAM 권한을 가져옵니다.
    • bigquery.datasets.setIamPolicybigquery.datasets.update: 소스 데이터 세트와 승인된 뷰가 포함된 데이터 세트의 IAM 권한을 업데이트합니다.

    BigQuery의 IAM 권한에 대한 자세한 내용은 BigQuery 권한을 참조하세요.

소스 데이터를 저장할 데이터 세트 만들기

먼저 소스 데이터를 저장할 데이터세트를 만듭니다.

소스 데이터 세트를 만들려면 다음 옵션 중 하나를 선택합니다.

콘솔

  1. BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 탐색기 창에서 데이터 세트를 만들 프로젝트 옆에 있는 작업 보기 > 데이터 세트 만들기를 클릭합니다.

  3. 데이터 세트 만들기 페이지에서 다음을 수행합니다.

    1. 데이터 세트 IDgithub_source_data를 입력합니다.

    2. 위치 유형에서 멀티 리전이 선택되어 있는지 확인합니다.

    3. 멀티 리전에서 미국 또는 유럽을 선택합니다. 이 튜토리얼에서 만드는 모든 리소스는 동일한 다중 리전 위치에 있어야 합니다.

    4. 데이터 세트 만들기를 클릭합니다.

SQL

CREATE SCHEMA DDL 문을 사용합니다.

  1. Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.

    BigQuery Studio로 이동

  2. 쿼리 편집기에서 다음 문을 입력합니다.

    CREATE SCHEMA github_source_data;

  3. 실행을 클릭합니다.

쿼리를 실행하는 방법에 대한 자세한 내용은 대화형 쿼리 실행을 참조하세요.

자바

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

// Create a source dataset to store your table.
Dataset sourceDataset = bigquery.create(DatasetInfo.of(sourceDatasetId));

Python

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

from google.cloud import bigquery

client = bigquery.Client()
source_dataset_id = "github_source_data"
source_dataset_id_full = "{}.{}".format(client.project, source_dataset_id)


source_dataset = bigquery.Dataset(source_dataset_id_full)
# Specify the geographic location where the dataset should reside.
source_dataset.location = "US"
source_dataset = client.create_dataset(source_dataset)  # API request

테이블 만들기 및 소스 데이터 로드

소스 데이터 세트를 만든 후 SQL 쿼리의 결과를 대상 테이블에 저장하여 테이블을 채웁니다. 이 쿼리는 GitHub 공개 데이터 세트에서 데이터를 검색합니다.

콘솔

  1. BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 쿼리 편집기에서 다음 쿼리를 입력합니다.

    SELECT
      commit,
      author,
      committer,
      repo_name
    FROM
      `bigquery-public-data.github_repos.commits`
    LIMIT
      1000;
    
  3. 더보기를 클릭하고 쿼리 설정을 선택합니다.

  4. 대상에서 쿼리 결과의 대상 테이블 설정을 선택합니다.

  5. 데이터 세트PROJECT_ID.github_source_data를 입력합니다.

    PROJECT_ID를 프로젝트 ID로 바꿉니다.

  6. 테이블 IDgithub_contributors을 입력합니다.

  7. 저장을 클릭합니다.

  8. 실행을 클릭합니다.

  9. 쿼리가 완료되면 탐색기 창에서 github_source_data를 펼친 다음 github_contributors를 클릭합니다.

  10. 데이터가 테이블에 기록되었는지 확인하려면 미리보기 탭을 클릭합니다.

자바

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

// Populate a source table
String tableQuery =
    "SELECT commit, author, committer, repo_name"
        + " FROM `bigquery-public-data.github_repos.commits`"
        + " LIMIT 1000";
QueryJobConfiguration queryConfig =
    QueryJobConfiguration.newBuilder(tableQuery)
        .setDestinationTable(TableId.of(sourceDatasetId, sourceTableId))
        .build();
bigquery.query(queryConfig);

Python

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

source_table_id = "github_contributors"
job_config = bigquery.QueryJobConfig()
job_config.destination = source_dataset.table(source_table_id)
sql = """
    SELECT commit, author, committer, repo_name
    FROM `bigquery-public-data.github_repos.commits`
    LIMIT 1000
"""
query_job = client.query(
    sql,
    # Location must match that of the dataset(s) referenced in the query
    # and of the destination table.
    location="US",
    job_config=job_config,
)  # API request - starts the query

query_job.result()  # Waits for the query to finish

승인된 뷰를 저장할 데이터 세트 만들기

소스 데이터 세트를 만든 다음 데이터 분석가에게 공유할 승인된 뷰를 저장할 별도의 새로운 개별 데이터 세트를 만듭니다. 이후 단계에서는 소스 데이터 세트의 데이터에 대해 승인된 뷰 액세스 권한을 부여합니다. 데이터 분석가는 승인된 뷰에 액세스할 수 있지만 소스 데이터에 직접 액세스할 수는 없습니다.

승인된 뷰는 소스 데이터와 다른 데이터 세트에 생성됩니다. 이렇게 하면 데이터 소유자가 데이터 기본 데이터 액세스 권한을 동시에 부여하지 않아도 승인된 뷰에 대한 액세스 권한을 사용자에게 부여할 수 있습니다. 소스 데이터 세트와 승인된 뷰 데이터 세트는 동일한 리전 위치에 있어야 합니다.

뷰를 저장할 데이터 세트를 만들려면 다음 옵션 중 하나를 선택합니다.

콘솔

  1. BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 탐색기 패널에서 데이터 세트를 만들 프로젝트를 선택합니다.

  3. 작업 보기 옵션을 펼치고 데이터 세트 만들기를 클릭합니다.

  4. 데이터 세트 만들기 페이지에서 다음을 수행합니다.

    1. 데이터 세트 IDshared_views를 입력합니다.

    2. 위치 유형에서 멀티 리전이 선택되어 있는지 확인합니다.

    3. 멀티 리전에서 미국 또는 유럽을 선택합니다. 이 튜토리얼에서 만드는 모든 리소스는 동일한 다중 리전 위치에 있어야 합니다.

    4. 데이터 세트 만들기를 클릭합니다.

SQL

CREATE SCHEMA DDL 문을 사용합니다.

  1. Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.

    BigQuery Studio로 이동

  2. 쿼리 편집기에서 다음 문을 입력합니다.

    CREATE SCHEMA shared_views;

  3. 실행을 클릭합니다.

쿼리를 실행하는 방법에 대한 자세한 내용은 대화형 쿼리 실행을 참조하세요.

자바

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

// Create a separate dataset to store your view
Dataset sharedDataset = bigquery.create(DatasetInfo.of(sharedDatasetId));

Python

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

shared_dataset_id = "shared_views"
shared_dataset_id_full = "{}.{}".format(client.project, shared_dataset_id)


shared_dataset = bigquery.Dataset(shared_dataset_id_full)
shared_dataset.location = "US"
shared_dataset = client.create_dataset(shared_dataset)  # API request

새 데이터 세트에 승인된 뷰 만들기

새 데이터세트에서 승인하려는 뷰를 만듭니다. 이 뷰는 데이터 분석가에게 공유하는 것으로, 데이터 분석가에게 보이고 싶지 않은 열을 제외하는 SQL 쿼리를 사용하여 만듭니다.

github_contributors 소스 테이블에는 RECORD 유형의 두 필드인 authorcommitter가 포함됩니다. 이 튜토리얼의 경우 승인된 뷰는 작성한 사람의 이름을 제외한 모든 작성자 데이터와 커밋한 사람의 이름을 제외한 모든 커밋자 데이터를 제외합니다.

새 데이터 세트에 뷰를 만들려면 다음 옵션 중 하나를 선택합니다.

콘솔

  1. BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 쿼리 편집기에서 다음 쿼리를 입력합니다.

    SELECT
    commit,
    author.name AS author,
    committer.name AS committer,
    repo_name
    FROM
    `PROJECT_ID.github_source_data.github_contributors`;

    PROJECT_ID를 프로젝트 ID로 바꿉니다.

  3. 저장 > 뷰 저장을 클릭합니다.

  4. 뷰 저장 대화상자에서 다음을 수행합니다.

    1. 프로젝트에서 프로젝트가 선택되었는지 확인합니다.

    2. 데이터 세트shared_views를 입력합니다.

    3. 테이블github_analyst_view를 입력합니다.

    4. 저장을 클릭합니다.

SQL

CREATE VIEW DDL 문을 사용합니다.

  1. Google Cloud 콘솔에서 BigQuery Studio 페이지로 이동합니다.

    BigQuery Studio로 이동

  2. 쿼리 편집기에서 다음 문을 입력합니다.

    CREATE VIEW shared_views.github_analyst_view
    AS (
      SELECT
        commit,
        author.name AS author,
        committer.name AS committer,
        repo_name
      FROM
        `PROJECT_ID.github_source_data.github_contributors`
    );

    PROJECT_ID를 프로젝트 ID로 바꿉니다.

  3. 실행을 클릭합니다.

쿼리를 실행하는 방법에 대한 자세한 내용은 대화형 쿼리 실행을 참조하세요.

자바

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

// Create the view in the new dataset
String viewQuery =
    String.format(
        "SELECT commit, author.name as author, committer.name as committer, repo_name FROM %s.%s.%s",
        projectId, sourceDatasetId, sourceTableId);

ViewDefinition viewDefinition = ViewDefinition.of(viewQuery);

Table view =
    bigquery.create(TableInfo.of(TableId.of(sharedDatasetId, sharedViewId), viewDefinition));

Python

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

shared_view_id = "github_analyst_view"
view = bigquery.Table(shared_dataset.table(shared_view_id))
sql_template = """
    SELECT
        commit, author.name as author,
        committer.name as committer, repo_name
    FROM
        `{}.{}.{}`
"""
view.view_query = sql_template.format(
    client.project, source_dataset_id, source_table_id
)
view = client.create_table(view)  # API request

데이터 분석가에게 쿼리 작업 실행 권한 부여

데이터 분석가가 뷰를 쿼리하려면 쿼리 작업을 실행할 수 있는 bigquery.jobs.create 권한이 필요합니다. bigquery.studioUser 역할에는 bigquery.jobs.create 권한이 포함됩니다. bigquery.studioUser 역할은 사용자에게 승인된 뷰를 보거나 쿼리할 권한을 부여하지 않습니다. 이후 단계에서 데이터 분석가에게 뷰에 액세스할 권한을 부여합니다.

데이터 분석 그룹을 프로젝트 수준의 bigquery.studioUser 역할에 할당하려면 다음 안내를 따르세요.

  1. Google Cloud 콘솔에서 IAM 페이지로 이동합니다.

    IAM으로 이동

  2. 프로젝트 선택기에서 프로젝트가 선택되어 있는지 확인합니다.

  3. 액세스 권한 부여를 클릭합니다.

  4. 액세스 권한 부여 대화상자에서 다음을 수행합니다.

    1. 새 주 구성원 필드에 데이터 분석가가 포함된 그룹을 입력합니다. 예를 들면 data_analysts@example.com입니다.

    2. 역할 선택 필드에서 BigQuery 스튜디오 사용자 역할을 검색하여 선택합니다.

    3. 저장을 클릭합니다.

데이터 분석가에게 승인된 뷰를 쿼리할 권한 부여

데이터 분석가가 뷰를 쿼리하려면 데이터 세트 수준 또는 뷰 수준에서 bigquery.dataViewer 역할을 부여받아야 합니다. 데이터 세트 수준에서 이 역할을 부여하면 분석가가 데이터 세트의 모든 테이블과 뷰에 액세스할 수 있습니다. 이 튜토리얼에서 만든 데이터 세트에는 승인된 뷰가 하나만 포함되어 있으므로 데이터 세트 수준에서 액세스 권한을 부여합니다. 액세스 권한을 부여해야 하는 승인된 뷰 모음이 있는 경우 승인된 데이터 세트를 대신 사용하는 것이 좋습니다.

이전에 데이터 분석가에게 부여한 bigquery.studioUser 역할은 쿼리 작업을 만드는 데 필요한 권한을 부여합니다. 하지만 승인된 뷰 또는 뷰가 포함된 데이터 세트에 대한 bigquery.dataViewer 액세스 권한이 없으면 뷰를 성공적으로 쿼리할 수 없습니다.

데이터 분석가에게 승인된 뷰가 포함된 데이터 세트에 대한 bigquery.dataViewer 액세스 권한을 부여하려면 다음 단계를 따르세요.

콘솔

  1. BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 탐색기 창에서 shared_views 데이터 세트를 선택합니다.

  3. 공유 > 권한을 클릭합니다.

  4. 공유 권한 창에서 주 구성원 추가를 클릭합니다.

  5. 새 주 구성원에 데이터 분석가가 포함된 그룹을 입력합니다(예: data_analysts@example.com).

  6. 역할 선택을 클릭하고 BigQuery > BigQuery 데이터 뷰어를 선택합니다.

  7. 저장을 클릭합니다.

  8. 닫기를 클릭합니다.

Java

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

// Assign access controls to the dataset containing the view
List<Acl> viewAcl = new ArrayList<>(sharedDataset.getAcl());
viewAcl.add(Acl.of(new Acl.Group("example-analyst-group@google.com"), Acl.Role.READER));
sharedDataset.toBuilder().setAcl(viewAcl).build().update();

Python

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

# analyst_group_email = 'data_analysts@example.com'
access_entries = shared_dataset.access_entries
access_entries.append(
    bigquery.AccessEntry("READER", "groupByEmail", analyst_group_email)
)
shared_dataset.access_entries = access_entries
shared_dataset = client.update_dataset(
    shared_dataset, ["access_entries"]
)  # API request

뷰가 소스 데이터세트에 액세스하는 것을 승인

승인된 뷰가 포함된 데이터 세트의 액세스 제어를 만든 후 소스 데이터 세트에 승인된 뷰 액세스 권한을 부여합니다. 이러한 승인은 데이터 분석가 그룹이 아닌 뷰에 소스 데이터 액세스 권한을 부여합니다.

승인된 뷰에 소스 데이터 액세스 권한을 부여하려면 다음 옵션 중 하나를 선택합니다.

콘솔

  1. BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 탐색기 창에서 github_source_data 데이터 세트를 선택합니다.

  3. 공유 > 뷰 승인을 클릭합니다.

  4. 승인된 뷰 창에서 승인된 뷰PROJECT_ID.shared_views.github_analyst_view를 입력합니다.

    PROJECT_ID를 프로젝트 ID로 바꿉니다.

  5. 승인 추가를 클릭합니다.

자바

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

// Authorize the view to access the source dataset
List<Acl> srcAcl = new ArrayList<>(sourceDataset.getAcl());
srcAcl.add(Acl.of(new Acl.View(view.getTableId())));
sourceDataset.toBuilder().setAcl(srcAcl).build().update();

Python

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

access_entries = source_dataset.access_entries
access_entries.append(
    bigquery.AccessEntry(None, "view", view.reference.to_api_repr())
)
source_dataset.access_entries = access_entries
source_dataset = client.update_dataset(
    source_dataset, ["access_entries"]
)  # API request

구성 확인

구성이 완료되면 데이터 분석가 그룹(예: data_analysts)의 구성원이 뷰를 쿼리하여 구성을 확인할 수 있습니다.

구성을 확인하려면 데이터 분석가가 다음 쿼리를 실행해야 합니다.

  1. BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 쿼리 편집기에서 다음 문을 입력합니다.

    SELECT
      *
    FROM
      `PROJECT_ID.shared_views.github_analyst_view`;

    PROJECT_ID를 프로젝트 ID로 바꿉니다.

  3. 실행을 클릭합니다.

쿼리 결과는 다음과 유사합니다. 결과에는 저자 이름과 커미터 이름만 표시됩니다.

승인된 뷰를 쿼리한 후의 쿼리 결과

쿼리를 실행하는 방법에 대한 자세한 내용은 대화형 쿼리 실행을 참조하세요.

전체 소스 코드

다음은 참조용 가이드의 전체 소스 코드입니다.

자바

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

// Create a source dataset to store your table.
Dataset sourceDataset = bigquery.create(DatasetInfo.of(sourceDatasetId));

// Populate a source table
String tableQuery =
    "SELECT commit, author, committer, repo_name"
        + " FROM `bigquery-public-data.github_repos.commits`"
        + " LIMIT 1000";
QueryJobConfiguration queryConfig =
    QueryJobConfiguration.newBuilder(tableQuery)
        .setDestinationTable(TableId.of(sourceDatasetId, sourceTableId))
        .build();
bigquery.query(queryConfig);

// Create a separate dataset to store your view
Dataset sharedDataset = bigquery.create(DatasetInfo.of(sharedDatasetId));

// Create the view in the new dataset
String viewQuery =
    String.format(
        "SELECT commit, author.name as author, committer.name as committer, repo_name FROM %s.%s.%s",
        projectId, sourceDatasetId, sourceTableId);

ViewDefinition viewDefinition = ViewDefinition.of(viewQuery);

Table view =
    bigquery.create(TableInfo.of(TableId.of(sharedDatasetId, sharedViewId), viewDefinition));

// Assign access controls to the dataset containing the view
List<Acl> viewAcl = new ArrayList<>(sharedDataset.getAcl());
viewAcl.add(Acl.of(new Acl.Group("example-analyst-group@google.com"), Acl.Role.READER));
sharedDataset.toBuilder().setAcl(viewAcl).build().update();

// Authorize the view to access the source dataset
List<Acl> srcAcl = new ArrayList<>(sourceDataset.getAcl());
srcAcl.add(Acl.of(new Acl.View(view.getTableId())));
sourceDataset.toBuilder().setAcl(srcAcl).build().update();

Python

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

# Create a source dataset
from google.cloud import bigquery

client = bigquery.Client()
source_dataset_id = "github_source_data"
source_dataset_id_full = "{}.{}".format(client.project, source_dataset_id)


source_dataset = bigquery.Dataset(source_dataset_id_full)
# Specify the geographic location where the dataset should reside.
source_dataset.location = "US"
source_dataset = client.create_dataset(source_dataset)  # API request

# Populate a source table
source_table_id = "github_contributors"
job_config = bigquery.QueryJobConfig()
job_config.destination = source_dataset.table(source_table_id)
sql = """
    SELECT commit, author, committer, repo_name
    FROM `bigquery-public-data.github_repos.commits`
    LIMIT 1000
"""
query_job = client.query(
    sql,
    # Location must match that of the dataset(s) referenced in the query
    # and of the destination table.
    location="US",
    job_config=job_config,
)  # API request - starts the query

query_job.result()  # Waits for the query to finish

# Create a separate dataset to store your view
shared_dataset_id = "shared_views"
shared_dataset_id_full = "{}.{}".format(client.project, shared_dataset_id)


shared_dataset = bigquery.Dataset(shared_dataset_id_full)
shared_dataset.location = "US"
shared_dataset = client.create_dataset(shared_dataset)  # API request

# Create the view in the new dataset
shared_view_id = "github_analyst_view"
view = bigquery.Table(shared_dataset.table(shared_view_id))
sql_template = """
    SELECT
        commit, author.name as author,
        committer.name as committer, repo_name
    FROM
        `{}.{}.{}`
"""
view.view_query = sql_template.format(
    client.project, source_dataset_id, source_table_id
)
view = client.create_table(view)  # API request

# Assign access controls to the dataset containing the view
# analyst_group_email = 'data_analysts@example.com'
access_entries = shared_dataset.access_entries
access_entries.append(
    bigquery.AccessEntry("READER", "groupByEmail", analyst_group_email)
)
shared_dataset.access_entries = access_entries
shared_dataset = client.update_dataset(
    shared_dataset, ["access_entries"]
)  # API request

# Authorize the view to access the source dataset
access_entries = source_dataset.access_entries
access_entries.append(
    bigquery.AccessEntry(None, "view", view.reference.to_api_repr())
)
source_dataset.access_entries = access_entries
source_dataset = client.update_dataset(
    source_dataset, ["access_entries"]
)  # API request

삭제

이 튜토리얼에서 사용된 리소스 비용이 Google Cloud 계정에 청구되지 않도록 하려면 리소스가 포함된 프로젝트를 삭제하거나 프로젝트를 유지하고 개별 리소스를 삭제하세요.

프로젝트 삭제

콘솔

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. In the project list, select the project that you want to delete, and then click Delete.
  3. In the dialog, type the project ID, and then click Shut down to delete the project.

gcloud

    Delete a Google Cloud project:

    gcloud projects delete PROJECT_ID

개별 리소스 삭제

또는 이 튜토리얼에서 사용된 개별 리소스를 삭제하려면 다음을 수행합니다.

  1. 승인된 뷰를 삭제합니다.

  2. 승인된 뷰가 포함된 데이터 세트를 삭제합니다.

  3. 소스 데이터 세트에서 테이블을 삭제합니다.

  4. 소스 데이터 세트를 삭제합니다.

이 튜토리얼에서 사용된 리소스는 직접 만들었으므로 삭제하는 데 추가 권한이 필요하지 않습니다.

다음 단계

  • BigQuery의 액세스 제어에 대한 자세한 내용은 BigQuery IAM 역할 및 권한을 참고하세요.
  • BigQuery 뷰에 대해 알아보려면 논리적 뷰 소개를 참고하세요.
  • 승인된 뷰에 대한 자세한 내용은 승인된 뷰를 참고하세요.
  • 액세스 제어에 관한 기본 개념을 알아보려면 IAM 개요를 참고하세요.
  • 액세스 제어를 관리하는 방법은 정책 관리를 참고하세요.