クイックスタート: レイクの作成
このページでは、レイクの作成、ゾーンの追加、アセットのアタッチを通じて、Google Cloud コンソールで Dataplex を開始する方法について説明します。
始める前に
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataplex、Dataproc、Dataproc Metastore、Data Catalog、BigQuery、Cloud Storage APIs.
-
Make sure that you have the following role or roles on the project: roles/dataplex.admin, roles/dataplex.editor
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
[IAM] に移動 - プロジェクトを選択します。
- [ アクセスを許可] をクリックします。
-
[新しいプリンシパル] フィールドに、ユーザー ID を入力します。 これは通常、Google アカウントのメールアドレスです。
- [ロールを選択] リストでロールを選択します。
- 追加のロールを付与するには、 [別のロールを追加] をクリックして各ロールを追加します。
- [保存] をクリックします。
-
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Dataplex、Dataproc、Dataproc Metastore、Data Catalog、BigQuery、Cloud Storage APIs.
-
Make sure that you have the following role or roles on the project: roles/dataplex.admin, roles/dataplex.editor
Check for the roles
-
In the Google Cloud console, go to the IAM page.
Go to IAM - Select the project.
-
In the Principal column, find all rows that identify you or a group that you're included in. To learn which groups you're included in, contact your administrator.
- For all rows that specify or include you, check the Role colunn to see whether the list of roles includes the required roles.
Grant the roles
-
In the Google Cloud console, go to the IAM page.
[IAM] に移動 - プロジェクトを選択します。
- [ アクセスを許可] をクリックします。
-
[新しいプリンシパル] フィールドに、ユーザー ID を入力します。 これは通常、Google アカウントのメールアドレスです。
- [ロールを選択] リストでロールを選択します。
- 追加のロールを付与するには、 [別のロールを追加] をクリックして各ロールを追加します。
- [保存] をクリックします。
-
- Cloud Storage バケットの作成:
- In the Google Cloud console, go to the Cloud Storage Buckets page.
- Click Create bucket.
- On the Create a bucket page, enter your bucket information. To go to the next
step, click Continue.
- For Name your bucket, enter a unique bucket name. Don't include sensitive information in the bucket name, because the bucket namespace is global and publicly visible.
-
For Choose where to store your data, do the following:
- Select a Location type option.
- Select a Location option.
- For Choose a default storage class for your data, select the following: Standard.
- For Choose how to control access to objects, select an Access control option.
- For Advanced settings (optional), specify an encryption method, a retention policy, or bucket labels.
- Click Create.
レイクを作成する
次の手順では、Google Cloud コンソールを使用してレイクを作成する方法を説明します。
Google Cloud コンソールで [Dataplex] に移動します。
[管理] ビューに移動します。
[
作成] をクリックします。[表示名] を入力します。
レイク ID が自動的に生成されます。
レイクを作成する [リージョン] を指定します。
所与のリージョン(たとえば、
us-central1
)で作成されたレイクの場合、シングルリージョン(us-central1
)データとマルチリージョン(us multi-region
)データの両方をゾーン設定に応じてアタッチできます。[作成] をクリックします。
レイクにゾーンを追加する
レイクを作成したら、レイクにゾーンを追加できます。ゾーンは、非構造化と構造化のデータの論理グループです。
[管理] ビューで、ゾーンを追加するレイクの名前をクリックします。
[ゾーンを追加] をクリックします。
ゾーンの表示名を入力します。
[タイプ] プルダウンをクリックします。[Raw Zone] または [Curated Zone] を選択します。クラスタのタイプに関する詳細を確認します。
[データのロケーション] で、[リージョン] または [マルチリージョン] を選択します。選択したものは後で変更できません。単一リージョンとマルチリージョンのデータを同一のゾーン内で混在させることはできません。
[作成] をクリックします。
ゾーンが作成されるまでに数分かかる場合があります。
アセットをアタッチする
データは Cloud Storage バケットまたは BigQuery データセットに格納でき、アセットとして Dataplex レイク内のデータゾーンにアタッチできます。
これらの手順に従って、前に作成した Cloud Storage バケットをアセットとしてアタッチします。
[管理] ビューで、Cloud Storage バケットをアタッチするレイクの名前をクリックします。
[ゾーン] タブで、アセットを追加するゾーンをクリックします。
[アセット] タブで、
[アセットを追加] をクリックします。[アセットを追加] をクリックします。
[タイプ] で、[Storage バケット] を選択します。
[表示名] にアセットの名前を入力します。
[バケット] フィールドで [参照] をクリックします。Cloud Storage バケットがある場合は、それを見つけて [選択] をクリックします。Cloud Storage バケットがない場合は、
ボタンをクリックして作成できます。バケットの一意の名前を入力します。[続行] をクリックします。
[ロケーション タイプ] を選択します。[続行] をクリックします。
データのデフォルトのストレージ クラスを選択します。[続行] をクリックします。
アクセス制御レベルを選択します。[続行] をクリックします。
データ保護オプションまたは [なし] を選択します。[続行] をクリックします。
[作成] をクリックします。
[選択] をクリックします。
[完了] をクリックします。
[続行] をクリックします。
[検出の設定] で [継承] を選択して、ゾーンレベルから検出の設定を継承します。
[続行] をクリックします。
[アセットを追加] で [送信] をクリックします。
クラスタの作成が完了するまで待機します。
クリーンアップ
このページで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、次の手順を行います。
- In the Google Cloud console, go to the Manage resources page.
- If the project that you plan to delete is attached to an organization, expand the Organization list in the Name column.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
あるいは、このチュートリアルで使用したリソースを削除することもできます。レイクは、その下のすべてのデータゾーン リソースが削除されていない限り削除できません。同様に、データゾーンは、その下のすべてのアセット リソースが削除されていない限り削除できません。
ストレージ バケットを接続解除する
次の手順では、作成した Dataplex アセットを接続解除する方法を説明します。
Google Cloud コンソールで [Dataplex] に移動します。
[管理] ビューで、作成したレイクの名前をクリックします。
[ゾーン] タブで、作成したゾーンの名前をクリックします。
[アセット] タブで、バケット名の左側にあるチェックボックスをオンにして、接続解除するアセットを選択します。
[アセットを削除] をクリックします。
[削除] をクリックして接続解除を確定します。
ゾーンを削除する
次の手順では、作成した Dataplex ゾーンを削除する方法について説明します。
Google Cloud コンソールで [Dataplex] に移動します。
[管理] ビューで、作成したレイクをクリックします。
[ゾーン] タブで、データゾーン名の左側にあるチェックボックスをオンにして、削除するゾーンを選択します。
[ゾーンを削除] をクリックします。
[削除] をクリックして削除を確定します。
レイクを削除する
次の手順では、作成した Dataplex レイクを削除する方法を説明します。
Google Cloud コンソールで [Dataplex] に移動します。
[管理] ビューで、作成したレイクをクリックします。
ページ上部の [削除] をクリックします。
テキスト ボックスに「削除」と入力して削除を確定します。
[レイクを削除] をクリックして削除を確定します。
次のステップ
レイク、ゾーン、アセットを作成すると、次のことができます。
- レイクとゾーンにデータを編成します。
- レイクを保護します。
- 検出されたメタデータを Google Cloud コンソールを使用して表示します。
- 検出されたメタデータを API を使用して表示します。