빠른 시작: 레이크 만들기

이 페이지에서는 레이크를 만들고, 영역을 추가하고, 애셋을 연결하는 과정을 통해 Google Cloud 콘솔에서 Dataplex를 시작하는 방법을 보여줍니다.

시작하기 전에

  1. Google Cloud 계정에 로그인합니다. Google Cloud를 처음 사용하는 경우 계정을 만들고 Google 제품의 실제 성능을 평가해 보세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
  2. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  3. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  4. API Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery, Cloud Storage 사용 설정

    API 사용 설정

  5. 프로젝트에 다음 역할이 있는지 확인합니다. roles/dataplex.admin, roles/dataplex.editor

    역할 확인

    1. Google Cloud 콘솔에서 IAM 페이지로 이동합니다.

      IAM으로 이동
    2. 프로젝트를 선택합니다.
    3. 주 구성원 열에서 이메일 주소가 있는 행을 찾습니다.

      이메일 주소가 열에 없으면 역할이 없는 것입니다.

    4. 이메일 주소가 있는 행에 대해 역할 열에서 역할 목록에 필요한 역할이 있는지 확인합니다.

    역할 부여

    1. Google Cloud 콘솔에서 IAM 페이지로 이동합니다.

      IAM으로 이동
    2. 프로젝트를 선택합니다.
    3. 액세스 권한 부여를 클릭합니다.
    4. 새 주 구성원 필드에 이메일 주소를 입력합니다.
    5. 역할 선택 목록에서 역할을 선택합니다.
    6. 역할을 추가로 부여하려면 다른 역할 추가를 클릭하고 각 역할을 추가합니다.
    7. 저장을 클릭합니다.
  6. Google Cloud Console의 프로젝트 선택기 페이지에서 Google Cloud 프로젝트를 선택하거나 만듭니다.

    프로젝트 선택기로 이동

  7. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다.

  8. API Dataplex, Dataproc, Dataproc Metastore, Data Catalog, BigQuery, Cloud Storage 사용 설정

    API 사용 설정

  9. 프로젝트에 다음 역할이 있는지 확인합니다. roles/dataplex.admin, roles/dataplex.editor

    역할 확인

    1. Google Cloud 콘솔에서 IAM 페이지로 이동합니다.

      IAM으로 이동
    2. 프로젝트를 선택합니다.
    3. 주 구성원 열에서 이메일 주소가 있는 행을 찾습니다.

      이메일 주소가 열에 없으면 역할이 없는 것입니다.

    4. 이메일 주소가 있는 행에 대해 역할 열에서 역할 목록에 필요한 역할이 있는지 확인합니다.

    역할 부여

    1. Google Cloud 콘솔에서 IAM 페이지로 이동합니다.

      IAM으로 이동
    2. 프로젝트를 선택합니다.
    3. 액세스 권한 부여를 클릭합니다.
    4. 새 주 구성원 필드에 이메일 주소를 입력합니다.
    5. 역할 선택 목록에서 역할을 선택합니다.
    6. 역할을 추가로 부여하려면 다른 역할 추가를 클릭하고 각 역할을 추가합니다.
    7. 저장을 클릭합니다.
  10. Cloud Storage 버킷 만들기:
    1. Google Cloud Console에서 Cloud Storage 버킷 페이지로 이동합니다.

      버킷 페이지로 이동

    2. 버킷 만들기를 클릭합니다.
    3. 버킷 만들기 페이지에서 버킷 정보를 입력합니다. 다음 단계로 이동하려면 계속을 클릭합니다.
      • 버킷 이름 지정에서 고유한 버킷 이름을 입력합니다. 버킷 네임스페이스는 전역적이며 공개로 표시되므로 버킷 이름에 민감한 정보를 포함해서는 안 됩니다.
      • 데이터를 저장할 위치 선택에서 다음을 수행합니다.
        • 위치 유형 옵션을 선택합니다.
        • 위치 옵션을 선택합니다.
      • 데이터의 기본 스토리지 클래스 선택에서 다음을 선택합니다. 표준.
      • 객체 액세스를 제어하는 방식 선택에서 액세스 제어 옵션을 선택합니다.
      • 고급 설정(선택사항)에서 암호화 방법, 보관 정책 또는 버킷 라벨을 지정합니다.
    4. 만들기를 클릭합니다.

레이크 만들기

다음 단계에서는 Google Cloud 콘솔을 사용하여 레이크를 만드는 방법을 보여줍니다.

  1. Google Cloud 콘솔에서 Dataplex로 이동합니다.

    Dataplex로 이동

  2. 관리 뷰로 이동합니다.

  3. 만들기를 클릭합니다.

  4. 표시 이름을 입력합니다.

  5. 레이크 ID는 자동으로 생성됩니다.

  6. 레이크를 만들 리전을 지정합니다.

    지정된 리전(예: us-central1)에서 생성된 레이크의 경우 영역 설정에 따라 단일 리전(us-central1) 데이터와 멀티 리전(us multi-region) 데이터를 모두 연결할 수 있습니다.

  7. 만들기를 클릭합니다.

레이크에 영역 추가

레이크를 만든 후 레이크에 영역을 추가할 수 있습니다. 영역은 비구조화 및 구조화된 데이터의 논리적 그룹입니다.

  1. 관리 뷰에서 영역을 추가할 레이크의 이름을 클릭합니다.

  2. 영역 추가를 클릭합니다.

  3. 영역의 표시 이름을 입력합니다.

  4. 유형 드롭다운을 클릭합니다. 원시 영역 또는 선별된 영역을 선택합니다. 영역 유형에 대해 자세히 알아보세요.

  5. 데이터 위치에서 리전 또는 멀티 리전을 선택합니다. 선택한 항목은 나중에 변경할 수 없습니다. 단일 리전 및 멀티 리전 데이터는 같은 영역에서 함께 사용할 수 없습니다.

  6. 만들기를 클릭합니다.

영역이 생성되려면 몇 분 정도 걸릴 수 있습니다.

애셋 연결

데이터를 Cloud Storage 버킷이나 BigQuery 데이터 세트에 저장할 수 있으며 Dataplex 레이크 내의 데이터 영역에 애셋으로 연결할 수 있습니다.

이전에 만든 Cloud Storage 버킷을 애셋으로 연결하려면 다음 단계를 따르세요.

  1. 관리 뷰에서 Cloud Storage 버킷을 연결할 레이크의 이름을 클릭합니다.

  2. 영역 탭에서 애셋을 추가할 영역을 클릭합니다.

  3. 애셋 탭에서 애셋 추가를 클릭합니다.

  4. 애셋 추가를 클릭합니다.

  5. 유형에서 스토리지 버킷을 선택합니다.

  6. 표시 이름에 애셋 이름을 입력합니다.

  7. 버킷 필드에서 찾아보기를 클릭합니다. Cloud Storage 버킷이 있으면 버킷을 찾아 선택을 클릭합니다. Cloud Storage 버킷이 없으면 버튼을 클릭하여 버킷을 만들 수 있습니다.

    1. 버킷의 고유한 이름을 입력합니다. 계속을 클릭합니다.

    2. 위치 유형을 선택합니다. 계속을 클릭합니다.

    3. 데이터의 기본 스토리지 클래스를 선택합니다. 계속을 클릭합니다.

    4. 액세스 제어 수준을 선택합니다. 계속을 클릭합니다.

    5. 데이터 보호 옵션 또는 없음을 선택합니다. 계속을 클릭합니다.

    6. 만들기를 클릭합니다.

    7. 선택을 클릭합니다.

  8. 완료를 클릭합니다.

  9. 계속을 클릭합니다.

  10. 검색 설정에서 상속을 선택하여 영역 수준에서 검색 설정을 상속합니다.

  11. 계속을 클릭합니다.

  12. 애셋 추가에서 제출을 클릭합니다.

애셋 생성이 완료될 때까지 기다립니다.

삭제

이 페이지에서 사용한 리소스 비용이 Google Cloud 계정에 청구되지 않도록 하려면 다음 단계를 수행합니다.

  1. Google Cloud 콘솔에서 리소스 관리 페이지로 이동합니다.

    리소스 관리로 이동

  2. 삭제하려는 프로젝트가 조직에 연결되어 있으면 이름 열에서 조직 목록을 확장합니다.
  3. 프로젝트 목록에서 삭제할 프로젝트를 선택하고 삭제를 클릭합니다.
  4. 대화상자에서 프로젝트 ID를 입력한 후 종료를 클릭하여 프로젝트를 삭제합니다.

또는 이 튜토리얼에서 사용된 리소스를 삭제할 수 있습니다. 레이크의 모든 데이터 영역 리소스가 삭제되지 않으면 레이크를 삭제할 수 없습니다. 마찬가지로 영역의 모든 애셋 리소스가 삭제되지 않으면 데이터 영역을 삭제할 수 없습니다.

스토리지 버킷 분리

다음 단계에서는 생성된 Dataplex 애셋을 분리하는 방법을 보여줍니다.

  1. Google Cloud 콘솔에서 Dataplex로 이동합니다.

    Dataplex로 이동

  2. 관리 뷰에서 자신이 만든 레이크의 이름을 클릭합니다.

  3. 영역 탭에서 자신이 만든 영역의 이름을 클릭합니다.

  4. 애셋 탭에서 버킷 이름 왼쪽의 체크박스를 선택하여 분리할 애셋을 선택합니다.

  5. 애셋 삭제를 클릭합니다.

  6. 삭제를 클릭하여 분리를 확인합니다.

영역 삭제

다음 단계에서는 생성된 Dataplex 영역을 삭제하는 방법을 보여줍니다.

  1. Google Cloud 콘솔에서 Dataplex로 이동합니다.

    Dataplex로 이동

  2. 관리 뷰에서 자신이 만든 레이크를 클릭합니다.

  3. 영역 탭에서 데이터 영역 이름 왼쪽의 체크박스를 선택하여 삭제할 영역을 선택합니다.

  4. 영역 삭제를 클릭합니다.

  5. 삭제를 클릭하여 삭제를 확인합니다.

레이크 삭제

다음 단계에서는 생성된 Dataplex 레이크를 삭제하는 방법을 보여줍니다.

  1. Google Cloud 콘솔에서 Dataplex로 이동합니다.

    Dataplex로 이동

  2. 관리 뷰에서 자신이 만든 레이크를 클릭합니다.

  3. 페이지 상단에서 삭제를 클릭합니다.

  4. 텍스트 상자에 'delete'를 입력하여 삭제를 확인합니다.

  5. 레이크 삭제를 클릭하여 삭제를 확인합니다.

다음 단계

레이크, 영역, 애셋을 만든 후 다음을 수행할 수 있습니다.