승인된 뷰 만들기


BigQuery는 방대한 양의 데이터에서 거의 실시간으로 SQL 쿼리를 실행하는 데 사용할 수 있는 페타바이트 규모의 분석 데이터 웨어하우스입니다.

데이터 세트에 대한 뷰 액세스 권한 부여는 BigQuery에서 승인된 뷰 생성이라고도 합니다. 승인된 뷰를 사용하면 기본 테이블에 대한 액세스 권한을 부여하지 않고도 특정 사용자 및 그룹과 쿼리 결과를 공유할 수 있습니다. 뷰의 SQL 쿼리를 사용하여 사용자가 쿼리할 수 있는 열(필드)을 제한할 수도 있습니다. 이 튜토리얼에서는 승인된 뷰를 만들어 보겠습니다.

목표

이 튜토리얼에서는 다음 작업을 완료하는 방법을 보여줍니다.

  • 데이터 세트를 만들고 데이터 세트에 액세스 제어 적용
  • 프로젝트에 액세스 제어 할당
  • 사용자가 쿼리할 수 있는 데이터를 제한하는 승인된 뷰 만들기

비용

BigQuery는 유료 제품이며 이 튜토리얼에서는 BigQuery 사용 비용이 청구됩니다. BigQuery는 일부 리소스를 특정 한도까지 무료로 사용할 수 있습니다. 자세한 내용은 BigQuery 무료 연산 및 무료 등급을 참조하세요.

시작하기 전에

이 튜토리얼을 시작하기 전에 Google Cloud Console을 사용하여 프로젝트를 만들거나 선택합니다.

  1. Google Cloud 계정에 로그인합니다. Google Cloud를 처음 사용하는 경우 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
  2. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  3. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  4. BigQuery는 새 프로젝트에서 자동으로 사용 설정됩니다. 기존 프로젝트에서 BigQuery를 활성화하려면

    BigQuery API 사용 설정

    API 사용 설정

    로 이동합니다.
  5. 선택사항: 프로젝트에 대한 결제를 사용 설정합니다. 결제를 사용 설정하거나 신용카드를 제공하지 않는 경우 이 문서의 단계가 계속 작동합니다. BigQuery에서는 단계를 수행하기 위한 샌드박스를 제공합니다. 자세한 내용은 BigQuery 샌드박스 사용 설정을 참조하세요.

소스 데이터 세트 만들기

먼저 소스 데이터를 저장할 데이터 세트를 만듭니다. 이 튜토리얼에서는 GitHub 공개 데이터 세트를 쿼리하여 소스 데이터 세트의 테이블을 채웁니다. 소스 데이터 세트의 데이터에는 데이터 분석가에게 보이고 싶지 않은 정보가 포함되어 있습니다. 승인된 보기를 사용하여 데이터에 대한 액세스를 제한할 수 있습니다.

소스 데이터 세트를 만들려면 다음 안내를 따르세요.

콘솔

  1. Google Cloud 콘솔에서 BigQuery 페이지를 엽니다.

    BigQuery로 이동

  2. 탐색기 창에서 데이터 세트를 만들 프로젝트를 선택합니다.

  3. 작업 옵션을 펼치고 데이터 세트 만들기를 클릭합니다.

  4. 데이터 세트 IDgithub_source_data를 입력합니다.

  5. 다른 기본 설정은 그대로 두고 데이터 세트 만들기를 클릭합니다.

SQL

CREATE SCHEMA DDL 문을 사용합니다.

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 쿼리 편집기에서 다음 문을 입력합니다.

    CREATE SCHEMA github_source_data;
    

  3. 실행을 클릭합니다.

쿼리를 실행하는 방법에 대한 자세한 내용은 대화형 쿼리 실행을 참조하세요.

Java

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

// Create a source dataset to store your table.
Dataset sourceDataset = bigquery.create(DatasetInfo.of(sourceDatasetId));

Python

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

from google.cloud import bigquery

client = bigquery.Client()
source_dataset_id = "github_source_data"
source_dataset_id_full = "{}.{}".format(client.project, source_dataset_id)

source_dataset = bigquery.Dataset(source_dataset_id_full)
# Specify the geographic location where the dataset should reside.
source_dataset.location = "US"
source_dataset = client.create_dataset(source_dataset)  # API request

소스 데이터 세트를 만든 후 SQL 쿼리를 사용하여 테이블을 채웁니다. 이 쿼리는 GitHub 공개 데이터 세트에서 데이터를 검색합니다.

콘솔

  1. Google Cloud 콘솔에서 BigQuery 페이지를 엽니다.

    BigQuery로 이동

  2. 다음 쿼리를 복사하여 편집기 창에 붙여넣습니다.

    SELECT
      commit,
      author,
      committer,
      repo_name
    FROM
      `bigquery-public-data.github_repos.commits`
    LIMIT
      1000;
    
  3. 더보기를 클릭하고 쿼리 설정을 선택합니다.

  4. 대상에서 쿼리 결과의 대상 테이블 설정을 선택합니다.

  5. 데이터 세트PROJECT_ID.github_source_data를 입력합니다. PROJECT_ID를 프로젝트 ID로 바꿉니다.

  6. 테이블 IDgithub_contributors을 입력합니다.

  7. 저장을 클릭합니다.

  8. 실행을 클릭합니다.

  9. 쿼리가 완료되면 github_contributors를 클릭한 후 미리보기를 클릭하여 데이터가 테이블에 기록되었는지 확인합니다.

자바

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

// Populate a source table
String tableQuery =
    "SELECT commit, author, committer, repo_name"
        + " FROM `bigquery-public-data.github_repos.commits`"
        + " LIMIT 1000";
QueryJobConfiguration queryConfig =
    QueryJobConfiguration.newBuilder(tableQuery)
        .setDestinationTable(TableId.of(sourceDatasetId, sourceTableId))
        .build();
bigquery.query(queryConfig);

Python

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

source_table_id = "github_contributors"
job_config = bigquery.QueryJobConfig()
job_config.destination = source_dataset.table(source_table_id)
sql = """
    SELECT commit, author, committer, repo_name
    FROM `bigquery-public-data.github_repos.commits`
    LIMIT 1000
"""
query_job = client.query(
    sql,
    # Location must match that of the dataset(s) referenced in the query
    # and of the destination table.
    location="US",
    job_config=job_config,
)  # API request - starts the query

query_job.result()  # Waits for the query to finish

뷰를 저장할 수 있는 데이터 세트 만들기

소스 데이터 세트를 만든 다음 데이터 분석가에게 공유할 승인된 뷰를 저장할 별도의 새로운 개별 데이터 세트를 만듭니다. 이후 단계에서는 소스 데이터 세트의 데이터에 대해 승인된 뷰 액세스 권한을 부여합니다. 데이터 분석가는 승인된 뷰에 액세스할 수 있지만 소스 데이터에 직접 액세스할 수는 없습니다.

승인된 뷰는 소스 데이터와 다른 데이터 세트에 생성됩니다. 이렇게 하면 데이터 소유자가 데이터 기본 데이터 액세스 권한을 동시에 부여하지 않아도 승인된 뷰에 대한 액세스 권한을 사용자에게 부여할 수 있습니다. 소스 데이터의 데이터 세트와 승인된 뷰 데이터 세트는 동일한 리전 위치에 있어야 합니다.

뷰를 저장할 데이터 세트를 만들려면 다음 안내를 따르세요.

콘솔

  1. Google Cloud 콘솔에서 BigQuery 페이지를 엽니다.

    BigQuery로 이동

  2. 탐색기 패널에서 데이터 세트를 만들 프로젝트를 선택합니다.

  3. 작업 옵션을 펼치고 데이터 세트 만들기를 클릭합니다.

  4. 데이터 세트 IDshared_views를 입력합니다.

  5. 다른 기본 설정은 그대로 두고 데이터 세트 만들기를 클릭합니다.

SQL

CREATE SCHEMA DDL 문을 사용합니다.

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 쿼리 편집기에서 다음 문을 입력합니다.

    CREATE SCHEMA shared_views;
    

  3. 실행을 클릭합니다.

쿼리를 실행하는 방법에 대한 자세한 내용은 대화형 쿼리 실행을 참조하세요.

Java

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

// Create a separate dataset to store your view
Dataset sharedDataset = bigquery.create(DatasetInfo.of(sharedDatasetId));

Python

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

shared_dataset_id = "shared_views"
shared_dataset_id_full = "{}.{}".format(client.project, shared_dataset_id)

shared_dataset = bigquery.Dataset(shared_dataset_id_full)
shared_dataset.location = "US"
shared_dataset = client.create_dataset(shared_dataset)  # API request

새 데이터세트에 뷰 만들기

새 데이터 세트에서 승인하려는 뷰를 만듭니다. 이 뷰는 데이터 분석가에게 공유하는 것으로, 데이터 분석가에게 보이고 싶지 않은 열을 제외하는 SQL 쿼리를 사용하여 만듭니다.

이 튜토리얼의 경우 공유한 뷰는 작성한 사람의 이름을 제외한 작성한 사람의 작성자 정보와 커밋한 사람의 이름을 제외한 커밋한 사람의 정보를 제외합니다.

새 데이터 세트에 뷰를 만들려면 다음 안내를 따르세요.

콘솔

  1. Google Cloud 콘솔에서 BigQuery 페이지를 엽니다.

    BigQuery로 이동

  2. 다음 쿼리를 복사하여 편집기 창에 붙여넣습니다. PROJECT_ID를 프로젝트 ID로 바꿉니다.

    SELECT
      commit,
      author.name AS author,
      committer.name AS committer,
      repo_name
    FROM
      `PROJECT_ID.github_source_data.github_contributors`;
    
  3. 저장 > 뷰 저장을 클릭합니다.

  4. 뷰 저장 대화상자에서 다음을 수행합니다.

    1. 프로젝트에서 프로젝트가 선택되었는지 확인합니다.
    2. 데이터 세트shared_views를 입력합니다.
    3. 테이블github_analyst_view를 입력합니다.
    4. 저장을 클릭합니다.

SQL

CREATE VIEW DDL 문을 사용합니다.

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 쿼리 편집기에서 다음 문을 입력합니다.

    CREATE VIEW shared_views.github_analyst_view
    AS (
      SELECT
        commit,
        author.name AS author,
        committer.name AS committer,
        repo_name
      FROM
        `PROJECT_ID.github_source_data.github_contributors`
    );
    

    PROJECT_ID를 프로젝트 ID로 바꿉니다.

  3. 실행을 클릭합니다.

쿼리를 실행하는 방법에 대한 자세한 내용은 대화형 쿼리 실행을 참조하세요.

Java

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

// Create the view in the new dataset
String viewQuery =
    String.format(
        "SELECT commit, author.name as author, committer.name as committer, repo_name FROM %s.%s.%s",
        projectId, sourceDatasetId, sourceTableId);

ViewDefinition viewDefinition = ViewDefinition.of(viewQuery);

Table view =
    bigquery.create(TableInfo.of(TableId.of(sharedDatasetId, sharedViewId), viewDefinition));

Python

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

shared_view_id = "github_analyst_view"
view = bigquery.Table(shared_dataset.table(shared_view_id))
sql_template = """
    SELECT
        commit, author.name as author,
        committer.name as committer, repo_name
    FROM
        `{}.{}.{}`
"""
view.view_query = sql_template.format(
    client.project, source_dataset_id, source_table_id
)
view = client.create_table(view)  # API request

데이터 분석가에게 프로젝트 수준 IAM 역할 할당

뷰를 쿼리하려면 데이터 분석가에게 쿼리 작업을 실행할 권한이 있어야 합니다. bigquery.user 역할에는 쿼리 작업을 비롯하여 프로젝트 내에서 작업을 실행하는 권한이 포함되어 있습니다. 사용자 또는 그룹에게 프로젝트 수준의 bigquery.user 역할을 부여하면 사용자는 데이터 세트를 만들고 이러한 데이터 세트의 테이블에 대해 쿼리 작업을 실행할 수 있습니다. bigquery.user 역할은 사용자가 만들지 않은 데이터 세트의 데이터를 쿼리하거나 테이블 데이터를 보거나 테이블 스키마 세부정보를 볼 수 있는 권한을 제공하지 않습니다.

데이터 분석을 프로젝트 수준의 bigquery.user 역할에 할당하면 뷰에서 쿼리한 테이블을 포함하는 데이터 세트에서 테이블 데이터를 보거나 쿼리하는 기능을 제공하지 않습니다. bigquery.user 역할도 사용자에게 뷰를 업데이트할 수 있는 기능을 부여하지 않습니다. 기업 내 대부분의 개인(데이터 과학자, 비즈니스 인텔리전스 분석가, 데이터 분석가)에게는 프로젝트 수준 bigquery.user 역할이 할당되어야 합니다.

IAM 역할에 그룹을 추가할 때 이메일 주소와 도메인이 활성 상태인 Google 계정이나 Google Apps 계정에 연결되어야 합니다.

데이터 분석 그룹을 프로젝트 수준의 bigquery.user 역할에 할당하려면 다음 안내를 따릅니다.

콘솔

  1. Google Cloud Console에서 IAM 페이지를 엽니다.

    IAM 페이지 열기

  2. 상단 표시줄의 프로젝트 선택기에서 프로젝트가 선택되어 있는지 확인합니다.

  3. 액세스 권한 부여를 클릭합니다.

  4. 액세스 권한 부여 대화상자에서 다음을 수행합니다.

    1. 새 주 구성원 대화상자에 데이터 분석가가 포함된 그룹을 입력합니다(예:data_analysts@example.com).
    2. 역할 선택 상자에서 BigQuery 사용자 역할을 검색하여 선택합니다.
    3. 저장을 클릭합니다.

뷰가 포함된 데이터 세트에 액세스 제어 할당

데이터 분석가가 뷰를 쿼리하려면 뷰가 포함된 데이터 세트에 대한 bigquery.dataViewer 역할을 부여받아야 합니다. bigquery.user 역할은 쿼리 작업을 만드는 데 필요한 권한을 데이터 분석가에게 부여합니다. 하지만 보기를 포함하는 데이터 세트에 bigquery.dataViewer 액세스 권한이 없으면 뷰를 성공적으로 쿼리할 수 없습니다.

데이터 분석가에게 데이터 세트에 대한 bigquery.dataViewer 액세스 권한을 부여하려면 다음 안내를 따르세요.

콘솔

  1. Google Cloud 콘솔에서 BigQuery 페이지를 엽니다.

    BigQuery로 이동

  2. 탐색기 창에서 shared_views 데이터 세트를 선택합니다.

  3. 공유 > 권한을 클릭합니다.

  4. 데이터 세트 권한 창에서 주 구성원 추가를 클릭합니다.

  5. 새 주 구성원 대화상자에 데이터 분석가가 포함된 그룹을 입력합니다(예:data_analysts@example.com).

  6. 역할 선택을 클릭하고 BigQuery> BigQuery 데이터 뷰어를 선택합니다.

  7. 저장을 클릭합니다.

  8. 닫기를 클릭합니다.

Java

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

// Assign access controls to the dataset containing the view
List<Acl> viewAcl = new ArrayList<>(sharedDataset.getAcl());
viewAcl.add(Acl.of(new Acl.Group("example-analyst-group@google.com"), Acl.Role.READER));
sharedDataset.toBuilder().setAcl(viewAcl).build().update();

Python

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

# analyst_group_email = 'data_analysts@example.com'
access_entries = shared_dataset.access_entries
access_entries.append(
    bigquery.AccessEntry("READER", "groupByEmail", analyst_group_email)
)
shared_dataset.access_entries = access_entries
shared_dataset = client.update_dataset(
    shared_dataset, ["access_entries"]
)  # API request

뷰가 소스 데이터세트에 액세스하는 것을 승인

뷰가 포함된 데이터 세트의 액세스 제어를 만든 다음 소스 데이터 세트에서 승인된 뷰로 보기를 추가합니다. 이러한 승인은 데이터 분석가 그룹이 아닌 뷰에 소스 데이터 액세스 권한을 부여합니다.

뷰가 소스 데이터에 액세스하는 것을 승인하려면 다음 안내를 따르세요.

콘솔

  1. Google Cloud 콘솔에서 BigQuery 페이지를 엽니다.

    BigQuery로 이동

  2. 탐색기 창에서 github_source_data 데이터 세트를 선택합니다.

  3. 공유를 클릭한 후 뷰 승인을 선택합니다.

  4. 승인된 뷰 창이 열리면 승인된 뷰 필드에 github_analyst_view 뷰를 입력합니다.

  5. 승인 추가를 클릭합니다.

이제 github_analyst_view 뷰가 소스 데이터 세트의 데이터에 액세스하도록 승인됩니다.

자바

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

// Authorize the view to access the source dataset
List<Acl> srcAcl = new ArrayList<>(sourceDataset.getAcl());
srcAcl.add(Acl.of(new Acl.View(view.getTableId())));
sourceDataset.toBuilder().setAcl(srcAcl).build().update();

Python

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

access_entries = source_dataset.access_entries
access_entries.append(
    bigquery.AccessEntry(None, "view", view.reference.to_api_repr())
)
source_dataset.access_entries = access_entries
source_dataset = client.update_dataset(
    source_dataset, ["access_entries"]
)  # API request

구성 확인

구성이 완료되면 데이터 분석가 그룹(예: data_analysts)의 구성원이 뷰를 쿼리하여 구성을 확인할 수 있습니다.

구성을 확인하려면 다음 안내를 따르세요.

SQL

데이터 분석가 그룹의 구성원이 다음 작업을 수행하도록 합니다.

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 쿼리 편집기에서 다음 문을 입력합니다.

    SELECT
      *
    FROM
      `PROJECT_ID.shared_views.github_analyst_view`;
    

    PROJECT_ID를 프로젝트 ID로 바꿉니다.

  3. 실행을 클릭합니다.

쿼리를 실행하는 방법에 대한 자세한 내용은 대화형 쿼리 실행을 참조하세요.

전체 소스 코드

다음은 참조용 튜토리얼의 전체 소스 코드입니다.

자바

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Java 설정 안내를 따르세요. 자세한 내용은 BigQuery Java API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

// Create a source dataset to store your table.
Dataset sourceDataset = bigquery.create(DatasetInfo.of(sourceDatasetId));

// Populate a source table
String tableQuery =
    "SELECT commit, author, committer, repo_name"
        + " FROM `bigquery-public-data.github_repos.commits`"
        + " LIMIT 1000";
QueryJobConfiguration queryConfig =
    QueryJobConfiguration.newBuilder(tableQuery)
        .setDestinationTable(TableId.of(sourceDatasetId, sourceTableId))
        .build();
bigquery.query(queryConfig);

// Create a separate dataset to store your view
Dataset sharedDataset = bigquery.create(DatasetInfo.of(sharedDatasetId));

// Create the view in the new dataset
String viewQuery =
    String.format(
        "SELECT commit, author.name as author, committer.name as committer, repo_name FROM %s.%s.%s",
        projectId, sourceDatasetId, sourceTableId);

ViewDefinition viewDefinition = ViewDefinition.of(viewQuery);

Table view =
    bigquery.create(TableInfo.of(TableId.of(sharedDatasetId, sharedViewId), viewDefinition));

// Assign access controls to the dataset containing the view
List<Acl> viewAcl = new ArrayList<>(sharedDataset.getAcl());
viewAcl.add(Acl.of(new Acl.Group("example-analyst-group@google.com"), Acl.Role.READER));
sharedDataset.toBuilder().setAcl(viewAcl).build().update();

// Authorize the view to access the source dataset
List<Acl> srcAcl = new ArrayList<>(sourceDataset.getAcl());
srcAcl.add(Acl.of(new Acl.View(view.getTableId())));
sourceDataset.toBuilder().setAcl(srcAcl).build().update();

Python

이 샘플을 사용해 보기 전에 BigQuery 빠른 시작: 클라이언트 라이브러리 사용Python 설정 안내를 따르세요. 자세한 내용은 BigQuery Python API 참고 문서를 확인하세요.

BigQuery에 인증하려면 애플리케이션 기본 사용자 인증 정보를 설정합니다. 자세한 내용은 클라이언트 라이브러리의 인증 설정을 참조하세요.

# Create a source dataset
from google.cloud import bigquery

client = bigquery.Client()
source_dataset_id = "github_source_data"
source_dataset_id_full = "{}.{}".format(client.project, source_dataset_id)

source_dataset = bigquery.Dataset(source_dataset_id_full)
# Specify the geographic location where the dataset should reside.
source_dataset.location = "US"
source_dataset = client.create_dataset(source_dataset)  # API request

# Populate a source table
source_table_id = "github_contributors"
job_config = bigquery.QueryJobConfig()
job_config.destination = source_dataset.table(source_table_id)
sql = """
    SELECT commit, author, committer, repo_name
    FROM `bigquery-public-data.github_repos.commits`
    LIMIT 1000
"""
query_job = client.query(
    sql,
    # Location must match that of the dataset(s) referenced in the query
    # and of the destination table.
    location="US",
    job_config=job_config,
)  # API request - starts the query

query_job.result()  # Waits for the query to finish

# Create a separate dataset to store your view
shared_dataset_id = "shared_views"
shared_dataset_id_full = "{}.{}".format(client.project, shared_dataset_id)

shared_dataset = bigquery.Dataset(shared_dataset_id_full)
shared_dataset.location = "US"
shared_dataset = client.create_dataset(shared_dataset)  # API request

# Create the view in the new dataset
shared_view_id = "github_analyst_view"
view = bigquery.Table(shared_dataset.table(shared_view_id))
sql_template = """
    SELECT
        commit, author.name as author,
        committer.name as committer, repo_name
    FROM
        `{}.{}.{}`
"""
view.view_query = sql_template.format(
    client.project, source_dataset_id, source_table_id
)
view = client.create_table(view)  # API request

# Assign access controls to the dataset containing the view
# analyst_group_email = 'data_analysts@example.com'
access_entries = shared_dataset.access_entries
access_entries.append(
    bigquery.AccessEntry("READER", "groupByEmail", analyst_group_email)
)
shared_dataset.access_entries = access_entries
shared_dataset = client.update_dataset(
    shared_dataset, ["access_entries"]
)  # API request

# Authorize the view to access the source dataset
access_entries = source_dataset.access_entries
access_entries.append(
    bigquery.AccessEntry(None, "view", view.reference.to_api_repr())
)
source_dataset.access_entries = access_entries
source_dataset = client.update_dataset(
    source_dataset, ["access_entries"]
)  # API request

삭제

이 튜토리얼에서 사용된 리소스 비용이 Google Cloud 계정에 청구되지 않도록 하려면 리소스가 포함된 프로젝트를 삭제하거나 프로젝트를 유지하고 개별 리소스를 삭제하세요.

  1. Google Cloud 콘솔에서 리소스 관리 페이지로 이동합니다.

    리소스 관리로 이동

  2. 프로젝트 목록에서 삭제할 프로젝트를 선택하고 삭제를 클릭합니다.
  3. 대화상자에서 프로젝트 ID를 입력한 후 종료를 클릭하여 프로젝트를 삭제합니다.

다음 단계