레이크에서 데이터 애셋 관리

이 페이지에서는 Cloud Storage 버킷과 BigQuery 데이터 세트를 기존 Dataplex 영역의 애셋으로 추가, 업그레이드, 삭제하는 방법을 설명합니다.

개요

애셋은 Cloud Storage 또는 BigQuery에 저장된 데이터에 매핑됩니다. 별도의 Google Cloud 프로젝트에 저장된 데이터를 레이크 내의 단일 영역에 애셋으로 매핑할 수 있습니다. 레이크 내에서 관리할 기존 Cloud Storage 버킷 또는 BigQuery 데이터 세트를 연결할 수 있습니다.

시작하기 전에

  • 아직 레이크가 없는 경우 해당 레이크에 레이크영역을 만듭니다.

  • 대부분 gcloud lakes 명령어에는 위치가 필요합니다. --location 플래그를 사용하여 위치를 지정할 수 있습니다.

액세스 제어

  • 애셋을 삭제하려면 dataplex.lakes.delete, dataplex.zones.delete 권한 또는 dataplex.assets.delete IAM 권한이 포함된 IAM 역할을 부여합니다. Dataplex 관련 roles/dataplex.adminroles/dataplex.editor 역할을 사용하여 이러한 권한을 부여할 수 있습니다.

  • 애셋을 추가하려면 create - dataplex.lakes.create, dataplex.zones.create 또는 dataplex.assets.create 권한이 포함된 IAM 역할을 부여합니다. roles/dataplex.adminroles/dataplex.editor 역할에는 이러한 권한이 포함되어 있습니다.

  • 또한 roles/ownerroles/editor 레거시 역할을 사용하여 사용자 또는 그룹에 권한을 부여할 수 있습니다.

  • Dataplex 레이크에 연결된 리소스에 Dataplex 서비스를 승인해야 합니다. 레이크에서 만든 프로젝트의 리소스에 승인이 자동으로 그리고 암시적으로 부여됩니다. 기타 프로젝트의 경우 리소스에서 Dataplex 서비스를 명시적으로 승인합니다.

자세한 내용은 Dataplex IAM 및 액세스 제어를 참조하세요.

Cloud Storage 버킷에 대한 역할 부여

다른 프로젝트의 Cloud Storage 버킷을 레이크에 연결하려면 Dataplex 서비스 계정(콘솔의 레이크 세부정보 페이지에서 검색한 service-PROJECT_NUMBER@gcp-sa-dataplex.iam.gserviceaccount.com)에 버킷이 포함된 프로젝트에 대한 Dataplex 서비스 계정 역할(roles/dataplex.serviceAgent)을 부여해야 합니다. 이 역할은 버킷에 대한 필수 관리자 수준 역할을 Dataplex 서비스에 제공하여 버킷 자체에 권한을 설정할 수 있도록 합니다.

BigQuery 데이터 세트에 대한 역할 부여

다른 프로젝트의 BigQuery 데이터 세트를 레이크에 연결하려면 데이터 세트에 대한 BigQuery 관리자 역할인 Dataplex 서비스 계정을 부여해야 합니다.

VPC 서비스 제어 고려사항

Dataplex는 VPC 서비스 제어 경계를 위반하지 않습니다. 레이크에 애셋을 추가하기 전에 기본 버킷 또는 데이터 세트가 레이크와 동일한 VPC 서비스 제어 네트워크에 있는지 확인합니다.

자세한 내용은 Dataplex를 사용한 VPC 서비스 제어를 참조하세요.

애셋 추가

Dataplex API 메서드 lakes.zones.assets.create를 실행하거나 로컬 브라우저에서 열린 데이터 영역 페이지에 버킷 또는 데이터 세트를 추가하여 Cloud Storage 버킷 또는 BigQuery 데이터 세트 애셋을 추가할 수 있습니다.

Dataplex 레이크 리전과 Cloud Storage 버킷 리전 중 하나가 겹치지 않으면 레이크의 영역에 버킷을 추가할 수 없습니다.

Cloud Storage 애셋의 리전 위치와 게시 데이터 세트를 만들 때 Dataplex가 버킷의 위치를 처리하는 방법에 대한 자세한 내용은 리전별 리소스를 참조하세요.

콘솔

  1. Google Cloud 콘솔에서 Dataplex 페이지를 엽니다.

    Google Cloud 콘솔에서 Dataplex 열기

  2. 관리 페이지에서 Cloud Storage 버킷 또는 BigQuery 데이터 세트를 추가할 레이크를 클릭합니다. 레이크 페이지가 열립니다.

    레이크 세부정보 페이지
  3. 영역 탭에서 애셋을 추가할 데이터 영역의 이름을 클릭합니다. 해당 데이터 영역의 데이터 영역 페이지가 열립니다.

  4. 애셋 탭에서 + 애셋 추가를 클릭합니다. 애셋 추가 페이지가 열립니다.

  5. 애셋 추가를 클릭합니다.

  6. 유형 필드에서 BigQuery 데이터 세트 또는 Cloud Storage 버킷을 선택합니다.

  7. 표시 이름 필드에 새 애셋의 이름을 입력합니다.

  8. ID 필드에 애셋의 고유 ID를 입력합니다.

  9. 선택사항: 설명을 입력합니다.

  10. 데이터 세트 또는 버킷 필드에서 애셋 유형에 따라 찾아보기를 클릭하여 Cloud Storage 버킷 또는 BigQuery 데이터 세트를 찾아 선택합니다.

  11. 선택사항: 애셋 유형이 Cloud Storage 버킷이고 Dataplex가 애셋을 관리하도록 하려면 관리형으로 업그레이드 체크박스를 선택합니다. 이 옵션을 선택하면 애셋을 개별적으로 업그레이드할 필요가 없습니다. BigQuery 데이터 세트에는 이 옵션을 사용할 수 없습니다.

  12. 계속을 클릭합니다.

  13. 나머지 매개변수 값을 선택합니다. 보안 설정에 대한 자세한 내용은 레이크 보안을 참조하세요.

  14. 제출을 클릭하여 애셋을 추가합니다.

  15. 데이터 영역 페이지로 돌아와 애셋 목록에 새 애셋이 나타나는지 확인합니다.

REST

API 안내에 따라 API 탐색기를 사용하여 버킷을 추가합니다.

추가에 성공하면 데이터 영역이 자동으로 활성 상태로 전환됩니다. 실패하면 데이터 영역이 이전의 정상 상태로 롤백됩니다.

Cloud Storage 버킷 애셋 업그레이드

Cloud Storage 버킷 유형의 애셋을 추가하면 Dataplex가 애셋에서 호스팅되는 테이블에 BigQuery 외부 테이블을 자동으로 게시합니다.

Cloud Storage 버킷 애셋을 업그레이드하면 Dataplex가 연결된 외부 테이블을 삭제하고 BigLake 테이블을 만듭니다. BigLake 테이블은 행 수준, 열 수준, 동적 데이터 마스킹을 포함한 보다 세분화된 보안을 지원합니다.

Google Cloud 콘솔에서 또는 Dataplex API 메서드 패치를 실행하여 Cloud Storage 버킷 애셋을 업그레이드할 수 있습니다.

콘솔

  1. Google Cloud 콘솔에서 Dataplex 페이지를 엽니다.

    Dataplex로 이동

  2. 관리 페이지에서 레이크 이름을 클릭합니다. 레이크 페이지가 열립니다.

  3. 영역 탭에서 데이터 영역의 이름을 클릭합니다. 데이터 영역 페이지가 열립니다.

  4. 애셋 탭에서 업그레이드할 애셋의 이름을 클릭합니다.

  5. 관리형으로 업그레이드를 클릭합니다.

REST

API 안내에 따라 Cloud Explorer를 사용하여 버킷 애셋을 업그레이드합니다.

Cloud Storage 버킷 애셋 다운그레이드

Cloud Storage 버킷 애셋을 다운그레이드하면 Dataplex가 연결된 BigLake 테이블을 삭제하고 외부 테이블을 만듭니다.

Google Cloud 콘솔에서 또는 ResourceSpec에서 readAccessMode 필드가 DIRECT로 설정된 Dataplex API 메서드 패치를 실행하여 Cloud Storage 버킷 애셋을 다운그레이드할 수 있습니다.

콘솔

  1. Google Cloud 콘솔에서 Dataplex 페이지를 엽니다.

    Dataplex로 이동

  2. 관리 페이지에서 레이크 이름을 클릭합니다. 레이크 페이지가 열립니다.

  3. 영역 탭에서 데이터 영역의 이름을 클릭합니다. 데이터 영역 페이지가 열립니다.

  4. 애셋 탭에서 업그레이드할 애셋의 이름을 클릭합니다.

  5. 관리형에서 다운그레이드를 클릭합니다.

REST

API 안내에 따라 Cloud Explorer를 사용하여 버킷 애셋을 다운그레이드합니다. ResourceSpec에서 readAccessMode 필드를 DIRECT로 설정해야 합니다.

애셋 삭제

Google Cloud 콘솔에서 또는 Dataplex API 메서드 lakes.zones.assets.delete를 실행하여 Cloud Storage 버킷 또는 BigQuery 데이터 세트 애셋을 삭제할 수 있습니다. 애셋을 다른 곳에 연결하기 전에 데이터 영역 또는 레이크에서 애셋을 삭제합니다.

다음 안내에서는 Google Cloud 콘솔 또는 Dataplex API를 사용하여 Dataplex 애셋을 삭제하는 방법을 보여줍니다.

콘솔

  1. Google Cloud 콘솔에서 Dataplex 페이지를 엽니다.

    Google Cloud 콘솔에서 Dataplex 열기

  2. 관리 페이지에서 Cloud Storage 버킷 또는 BigQuery 데이터 세트를 삭제하려는 레이크를 클릭합니다. 해당 레이크의 레이크 페이지가 열립니다.

    레이크 세부정보 페이지
  3. 영역 탭에서 Cloud Storage 버킷 또는 BigQuery 데이터 세트를 삭제하려는 데이터 영역의 이름을 클릭합니다. 해당 데이터 영역의 데이터 영역 페이지가 열립니다.

  4. 애셋 탭에서 애셋 이름 왼쪽의 체크박스를 선택하여 애셋을 선택합니다.

  5. 애셋 삭제를 클릭하여 애셋을 삭제합니다.

  6. 대화상자에서 삭제를 클릭하여 삭제를 확인합니다.

REST

API 안내에 따라 Cloud Explorer를 사용하여 버킷을 삭제합니다.

다음 단계