クイックスタート: レイクの作成

このページでは、レイクの作成、ゾーンの追加、アセットのアタッチを通じて、Google Cloud コンソールで Dataplex を開始する方法について説明します。

始める前に

  1. Google Cloud アカウントにログインします。Google Cloud を初めて使用する場合は、アカウントを作成して、実際のシナリオでの Google プロダクトのパフォーマンスを評価してください。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
  2. Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタに移動

  3. Google Cloud プロジェクトで課金が有効になっていることを確認します

  4. Dataplex、Dataproc、Dataproc Metastore、Data Catalog、BigQuery、Cloud Storage API を有効にします。

    API を有効にする

  5. プロジェクトに次のロールがあることを確認します。 roles/dataplex.admin, roles/dataplex.editor

    ロールを確認する

    1. Google Cloud コンソールの [IAM] ページに移動します。

      [IAM] に移動
    2. プロジェクトを選択します。
    3. [プリンシパル] 列で、自分のメールアドレスを含む行を見つけます。

      自分のメールアドレスがその列にない場合、ロールは割り当てられていません。

    4. 自分のメールアドレスを含む行の [ロール] 列で、ロールのリストに必要なロールが含まれているかどうかを確認します。

    ロールを付与する

    1. Google Cloud コンソールの [IAM] ページに移動します。

      [IAM] に移動
    2. プロジェクトを選択します。
    3. [ アクセスを許可] をクリックします。
    4. [新しいプリンシパル] フィールドに、自分のメールアドレスを入力します。
    5. [ロールを選択] リストでロールを選択します。
    6. 追加のロールを付与するには、 [別のロールを追加] をクリックして各ロールを追加します。
    7. [保存] をクリックします。
  6. Google Cloud Console の [プロジェクト セレクタ] ページで、Google Cloud プロジェクトを選択または作成します。

    プロジェクト セレクタに移動

  7. Google Cloud プロジェクトで課金が有効になっていることを確認します

  8. Dataplex、Dataproc、Dataproc Metastore、Data Catalog、BigQuery、Cloud Storage API を有効にします。

    API を有効にする

  9. プロジェクトに次のロールがあることを確認します。 roles/dataplex.admin, roles/dataplex.editor

    ロールを確認する

    1. Google Cloud コンソールの [IAM] ページに移動します。

      [IAM] に移動
    2. プロジェクトを選択します。
    3. [プリンシパル] 列で、自分のメールアドレスを含む行を見つけます。

      自分のメールアドレスがその列にない場合、ロールは割り当てられていません。

    4. 自分のメールアドレスを含む行の [ロール] 列で、ロールのリストに必要なロールが含まれているかどうかを確認します。

    ロールを付与する

    1. Google Cloud コンソールの [IAM] ページに移動します。

      [IAM] に移動
    2. プロジェクトを選択します。
    3. [ アクセスを許可] をクリックします。
    4. [新しいプリンシパル] フィールドに、自分のメールアドレスを入力します。
    5. [ロールを選択] リストでロールを選択します。
    6. 追加のロールを付与するには、 [別のロールを追加] をクリックして各ロールを追加します。
    7. [保存] をクリックします。
  10. Cloud Storage バケットの作成:
    1. Google Cloud コンソールで、Cloud Storage の [バケット] ページに移動します。

      [バケット] ページに移動

    2. [バケットを作成] をクリックします。
    3. [バケットの作成] ページでユーザーのバケット情報を入力します。次のステップに進むには、[続行] をクリックします。
      • [バケット名] に、一意のバケット名を入力します。バケットの名前空間は世界中の誰でも閲覧可能なため、機密情報をバケット名に含めないようにしてください。
      • [データの保存場所の選択] で、次の操作を行います。
        • [ロケーション タイプ] オプションを選択します。
        • [ロケーション] オプションを選択します。
      • [データのデフォルトのストレージ クラスを選択する] で、次を選択します。 Standard.
      • [オブジェクトへのアクセスを制御する方法を選択する] で [アクセス制御] オプションを選択します。
      • [詳細設定(省略可)] には、暗号化メソッド保持ポリシー、またはバケットラベルを指定します。
    4. [作成] をクリックします。

レイクを作成する

次の手順では、Google Cloud コンソールを使用してレイクを作成する方法を説明します。

  1. Google Cloud コンソールで [Dataplex] に移動します。

    Dataplex に移動

  2. [管理] ビューに移動します。

  3. [ 作成] をクリックします。

  4. [表示名] を入力します。

  5. レイク ID が自動的に生成されます。

  6. レイクを作成する [リージョン] を指定します。

    所与のリージョン(たとえば、us-central1)で作成されたレイクの場合、シングルリージョン(us-central1)データとマルチリージョン(us multi-region)データの両方をゾーン設定に応じてアタッチできます。

  7. [作成] をクリックします。

レイクにゾーンを追加する

レイクを作成したら、レイクにゾーンを追加できます。ゾーンは、非構造化と構造化のデータの論理グループです。

  1. [管理] ビューで、ゾーンを追加するレイクの名前をクリックします。

  2. [ゾーンを追加] をクリックします。

  3. ゾーンの表示名を入力します。

  4. [タイプ] プルダウンをクリックします。[Raw Zone] または [Curated Zone] を選択します。クラスタのタイプに関する詳細を確認します。

  5. [データのロケーション] で、[リージョン] または [マルチリージョン] を選択します。選択したものは後で変更できません。単一リージョンとマルチリージョンのデータを同一のゾーン内で混在させることはできません。

  6. [作成] をクリックします。

ゾーンが作成されるまでに数分かかる場合があります。

アセットをアタッチする

データは Cloud Storage バケットまたは BigQuery データセットに格納でき、アセットとして Dataplex レイク内のデータゾーンにアタッチできます。

これらの手順に従って、前に作成した Cloud Storage バケットをアセットとしてアタッチします。

  1. [管理] ビューで、Cloud Storage バケットをアタッチするレイクの名前をクリックします。

  2. [ゾーン] タブで、アセットを追加するゾーンをクリックします。

  3. [アセット] タブで、 [アセットを追加] をクリックします。

  4. [アセットを追加] をクリックします。

  5. [タイプ] で、[Storage バケット] を選択します。

  6. [表示名] にアセットの名前を入力します。

  7. [バケット] フィールドで [参照] をクリックします。Cloud Storage バケットがある場合は、それを見つけて [選択] をクリックします。Cloud Storage バケットがない場合は、 ボタンをクリックして作成できます。

    1. バケットの一意の名前を入力します。[続行] をクリックします。

    2. [ロケーション タイプ] を選択します。[続行] をクリックします。

    3. データのデフォルトのストレージ クラスを選択します。[続行] をクリックします。

    4. アクセス制御レベルを選択します。[続行] をクリックします。

    5. データ保護オプションまたは [なし] を選択します。[続行] をクリックします。

    6. [作成] をクリックします。

    7. [選択] をクリックします。

  8. [完了] をクリックします。

  9. [続行] をクリックします。

  10. [検出の設定] で [継承] を選択して、ゾーンレベルから検出の設定を継承します。

  11. [続行] をクリックします。

  12. [アセットを追加] で [送信] をクリックします。

クラスタの作成が完了するまで待機します。

クリーンアップ

このページで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、次の手順を行います。

  1. Google Cloud コンソールで、[リソースの管理] ページに移動します。

    [リソースの管理] に移動

  2. 削除するプロジェクトが組織に関連付けられている場合は、[名前] 列の [組織] リストを展開します。
  3. プロジェクト リストで、削除するプロジェクトを選択し、[削除] をクリックします。
  4. ダイアログでプロジェクト ID を入力し、[シャットダウン] をクリックしてプロジェクトを削除します。

あるいは、このチュートリアルで使用したリソースを削除することもできます。レイクは、その下のすべてのデータゾーン リソースが削除されていない限り削除できません。同様に、データゾーンは、その下のすべてのアセット リソースが削除されていない限り削除できません。

ストレージ バケットを接続解除する

次の手順では、作成した Dataplex アセットを接続解除する方法を説明します。

  1. Google Cloud コンソールで [Dataplex] に移動します。

    Dataplex に移動

  2. [管理] ビューで、作成したレイクの名前をクリックします。

  3. [ゾーン] タブで、作成したゾーンの名前をクリックします。

  4. [アセット] タブで、バケット名の左側にあるチェックボックスをオンにして、接続解除するアセットを選択します。

  5. [アセットを削除] をクリックします。

  6. [削除] をクリックして接続解除を確定します。

ゾーンを削除する

次の手順では、作成した Dataplex ゾーンを削除する方法について説明します。

  1. Google Cloud コンソールで [Dataplex] に移動します。

    Dataplex に移動

  2. [管理] ビューで、作成したレイクをクリックします。

  3. [ゾーン] タブで、データゾーン名の左側にあるチェックボックスをオンにして、削除するゾーンを選択します。

  4. [ゾーンを削除] をクリックします。

  5. [削除] をクリックして削除を確定します。

レイクを削除する

次の手順では、作成した Dataplex レイクを削除する方法を説明します。

  1. Google Cloud コンソールで [Dataplex] に移動します。

    Dataplex に移動

  2. [管理] ビューで、作成したレイクをクリックします。

  3. ページ上部の [削除] をクリックします。

  4. テキスト ボックスに「削除」と入力して削除を確定します。

  5. [レイクを削除] をクリックして削除を確定します。

次のステップ

レイク、ゾーン、アセットを作成すると、次のことができます。