クイックスタート: レイクの作成

このページでは、レイクの作成、ゾーンの追加、アセットのアタッチを通じて、Google Cloud コンソールで Dataplex を開始する方法について説明します。

始める前に

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタに移動

  3. Google Cloud プロジェクトで課金が有効になっていることを確認します

  4. Dataplex、Dataproc、Dataproc Metastore、Data Catalog、BigQuery、Cloud Storage API を有効にします。

    API を有効にする

  5. プロジェクトに次のロールがあることを確認します。 roles/dataplex.admin, roles/dataplex.editor

    ロールを確認する

    1. Google Cloud コンソールの [IAM] ページに移動します。

      [IAM] に移動
    2. プロジェクトを選択します。
    3. [プリンシパル] 列で、自分のメールアドレスを含む行を見つけます。

      自分のメールアドレスがその列にない場合、ロールは割り当てられていません。

    4. 自分のメールアドレスを含む行の [ロール] 列で、ロールのリストに必要なロールが含まれているかどうかを確認します。

    ロールを付与する

    1. Google Cloud コンソールの [IAM] ページに移動します。

      [IAM] に移動
    2. プロジェクトを選択します。
    3. [ アクセスを許可] をクリックします。
    4. [新しいプリンシパル] フィールドに、自分のメールアドレスを入力します。
    5. [ロールを選択] リストでロールを選択します。
    6. 追加のロールを付与するには、 [別のロールを追加] をクリックして各ロールを追加します。
    7. [保存] をクリックします。
  6. Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタに移動

  7. Google Cloud プロジェクトで課金が有効になっていることを確認します

  8. Dataplex、Dataproc、Dataproc Metastore、Data Catalog、BigQuery、Cloud Storage API を有効にします。

    API を有効にする

  9. プロジェクトに次のロールがあることを確認します。 roles/dataplex.admin, roles/dataplex.editor

    ロールを確認する

    1. Google Cloud コンソールの [IAM] ページに移動します。

      [IAM] に移動
    2. プロジェクトを選択します。
    3. [プリンシパル] 列で、自分のメールアドレスを含む行を見つけます。

      自分のメールアドレスがその列にない場合、ロールは割り当てられていません。

    4. 自分のメールアドレスを含む行の [ロール] 列で、ロールのリストに必要なロールが含まれているかどうかを確認します。

    ロールを付与する

    1. Google Cloud コンソールの [IAM] ページに移動します。

      [IAM] に移動
    2. プロジェクトを選択します。
    3. [ アクセスを許可] をクリックします。
    4. [新しいプリンシパル] フィールドに、自分のメールアドレスを入力します。
    5. [ロールを選択] リストでロールを選択します。
    6. 追加のロールを付与するには、 [別のロールを追加] をクリックして各ロールを追加します。
    7. [保存] をクリックします。
  10. Cloud Storage バケットの作成:
    1. Google Cloud コンソールで、Cloud Storage の [バケット] ページに移動します。

      [バケット] ページに移動

    2. [バケットを作成] をクリックします。
    3. [バケットの作成] ページでユーザーのバケット情報を入力します。次のステップに進むには、[続行] をクリックします。
      • [バケット名] に、一意のバケット名を入力します。バケットの名前空間は世界中の誰でも閲覧可能なため、機密情報をバケット名に含めないようにしてください。
      • [データの保存場所の選択] で、次の操作を行います。
        • [ロケーション タイプ] オプションを選択します。
        • [ロケーション] オプションを選択します。
      • [データのデフォルトのストレージ クラスを選択する] で、次を選択します。 Standard.
      • [オブジェクトへのアクセスを制御する方法を選択する] で [アクセス制御] オプションを選択します。
      • [詳細設定(省略可)] には、暗号化メソッド保持ポリシー、またはバケットラベルを指定します。
    4. [作成] をクリックします。

レイクを作成する

次の手順では、Google Cloud コンソールを使用してレイクを作成する方法を説明します。

  1. Google Cloud コンソールで [Dataplex] に移動します。

    Dataplex に移動

  2. [管理] ビューに移動します。

  3. [ 作成] をクリックします。

  4. [表示名] を入力します。

  5. レイク ID が自動的に生成されます。

  6. レイクを作成する [リージョン] を指定します。

    所与のリージョン(たとえば、us-central1)で作成されたレイクの場合、シングルリージョン(us-central1)データとマルチリージョン(us multi-region)データの両方をゾーン設定に応じてアタッチできます。

  7. [作成] をクリックします。

レイクにゾーンを追加する

レイクを作成したら、レイクにゾーンを追加できます。ゾーンは、非構造化と構造化のデータの論理グループです。

  1. [管理] ビューで、ゾーンを追加するレイクの名前をクリックします。

  2. [ゾーンを追加] をクリックします。

  3. ゾーンの表示名を入力します。

  4. [タイプ] プルダウンをクリックします。[Raw Zone] または [Curated Zone] を選択します。クラスタのタイプに関する詳細を確認します。

  5. [データのロケーション] で、[リージョン] または [マルチリージョン] を選択します。選択したものは後で変更できません。単一リージョンとマルチリージョンのデータを同一のゾーン内で混在させることはできません。

  6. [作成] をクリックします。

ゾーンが作成されるまでに数分かかる場合があります。

アセットをアタッチする

データは Cloud Storage バケットまたは BigQuery データセットに格納でき、アセットとして Dataplex レイク内のデータゾーンにアタッチできます。

これらの手順に従って、前に作成した Cloud Storage バケットをアセットとしてアタッチします。

  1. [管理] ビューで、Cloud Storage バケットをアタッチするレイクの名前をクリックします。

  2. [ゾーン] タブで、アセットを追加するゾーンをクリックします。

  3. [アセット] タブで、 [アセットを追加] をクリックします。

  4. [アセットを追加] をクリックします。

  5. [タイプ] で、[Storage バケット] を選択します。

  6. [表示名] にアセットの名前を入力します。

  7. [バケット] フィールドで [参照] をクリックします。Cloud Storage バケットがある場合は、それを見つけて [選択] をクリックします。Cloud Storage バケットがない場合は、 ボタンをクリックして作成できます。

    1. バケットの一意の名前を入力します。[続行] をクリックします。

    2. [ロケーション タイプ] を選択します。[続行] をクリックします。

    3. データのデフォルトのストレージ クラスを選択します。[続行] をクリックします。

    4. アクセス制御レベルを選択します。[続行] をクリックします。

    5. データ保護オプションまたは [なし] を選択します。[続行] をクリックします。

    6. [作成] をクリックします。

    7. [選択] をクリックします。

  8. [完了] をクリックします。

  9. [続行] をクリックします。

  10. [検出の設定] で [継承] を選択して、ゾーンレベルから検出の設定を継承します。

  11. [続行] をクリックします。

  12. [アセットを追加] で [送信] をクリックします。

クラスタの作成が完了するまで待機します。

クリーンアップ

このページで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、次の手順を行います。

  1. Google Cloud コンソールで、[リソースの管理] ページに移動します。

    [リソースの管理] に移動

  2. 削除するプロジェクトが組織に関連付けられている場合は、[名前] 列の [組織] リストを展開します。
  3. プロジェクト リストで、削除するプロジェクトを選択し、[削除] をクリックします。
  4. ダイアログでプロジェクト ID を入力し、[シャットダウン] をクリックしてプロジェクトを削除します。

あるいは、このチュートリアルで使用したリソースを削除することもできます。レイクは、その下のすべてのデータゾーン リソースが削除されていない限り削除できません。同様に、データゾーンは、その下のすべてのアセット リソースが削除されていない限り削除できません。

ストレージ バケットを接続解除する

次の手順では、作成した Dataplex アセットを接続解除する方法を説明します。

  1. Google Cloud コンソールで [Dataplex] に移動します。

    Dataplex に移動

  2. [管理] ビューで、作成したレイクの名前をクリックします。

  3. [ゾーン] タブで、作成したゾーンの名前をクリックします。

  4. [アセット] タブで、バケット名の左側にあるチェックボックスをオンにして、接続解除するアセットを選択します。

  5. [アセットを削除] をクリックします。

  6. [削除] をクリックして接続解除を確定します。

ゾーンを削除する

次の手順では、作成した Dataplex ゾーンを削除する方法について説明します。

  1. Google Cloud コンソールで [Dataplex] に移動します。

    Dataplex に移動

  2. [管理] ビューで、作成したレイクをクリックします。

  3. [ゾーン] タブで、データゾーン名の左側にあるチェックボックスをオンにして、削除するゾーンを選択します。

  4. [ゾーンを削除] をクリックします。

  5. [削除] をクリックして削除を確定します。

レイクを削除する

次の手順では、作成した Dataplex レイクを削除する方法を説明します。

  1. Google Cloud コンソールで [Dataplex] に移動します。

    Dataplex に移動

  2. [管理] ビューで、作成したレイクをクリックします。

  3. ページ上部の [削除] をクリックします。

  4. テキスト ボックスに「削除」と入力して削除を確定します。

  5. [レイクを削除] をクリックして削除を確定します。

次のステップ

レイク、ゾーン、アセットを作成すると、次のことができます。