このページでは、Cloud Data Fusion インスタンスを作成する方法について説明します。
始める前に
- Cloud Data Fusion API を有効にします。
- Cloud Data Fusion インスタンスを作成するには、
instances.create
権限が必要です。詳細については、アクセス制御をご覧ください。 - Cloud Data Fusion インスタンスは、Compute Engine のデフォルトのサービス アカウントとして実行されます。利用可能な種類とロールについては、サービス アカウントをご覧ください。
- デフォルトでは、Cloud Data Fusion はプロジェクト内の Dataproc クラスタを使用してパイプラインを実行します。プロジェクトが Dataproc ネットワークの要件を満たしていることを確認してください。
- 新しいプロジェクトはデフォルト ネットワークで開始されます。デフォルトのネットワークには、ファイアウォール default-allow-ssh が事前に設定されています。このファイアウォールでは、任意の送信元からネットワーク内の任意のインスタンスへの受信接続が TCP ポート 22 で許可されます。バージョン 6.2.0 より前のバージョンで、Cloud Data Fusion インスタンスで使用されているネットワークに TCP ポート 22 で上り(内向き)を許可するルールが存在しない場合、このルールを作成します。
インスタンスの作成
Console
API が有効になっている場合、Google Cloud コンソールの Cloud Data Fusion セクションに [インスタンス] ページが表示され、ここで Cloud Data Fusion インスタンスを作成して管理できます。
- [インスタンスを作成] をクリックします。
- [インスタンス名] を入力します。
- インスタンスの [説明] を入力します。
- インスタンスを作成する [リージョン] を指定します。
- 使用する Cloud Data Fusion の [バージョン] を指定します。
- 使用するエディションを選択します。デフォルトは [基本] です。
- 省略可: [アクセラレータを追加] をクリックして、インスタンスで使用するアクセラレータを選択します。
- Cloud Data Fusion バージョン 6.2.3 以降では、Dataproc で Cloud Data Fusion パイプラインの実行に使用する Dataproc サービス アカウントを指定します。UI では、デフォルトの Compute Engine アカウントがあらかじめ選択されています。バージョンに関係なく、サービス アカウントにニーズに適した Identity and Access Management ロールがあることを確認してください。詳しくは、サービス アカウント ユーザーの権限の付与をご覧ください。
省略可: 詳細オプションを指定します。何も指定しない場合は、次のデフォルトが使用されます。
カテゴリ 設定 説明 デフォルト プライベート IP プライベート IP アドレスを有効にする プライベート インスタンスの作成をご覧ください。 無効 ロギングとモニタリング Cloud Logging を有効にする パイプライン ログを表示するために Cloud Logging を有効にするオプション。
無効 ロギングとモニタリング Cloud Monitoring を有効にする Monitoring を有効にするオプション。 無効 暗号化 顧客管理の暗号鍵(CMEK)を使用する バージョン 6.5 以降でロールベースのアクセス制御を使用するオプション。 無効 ラベル <キー> <値> ペア Compute Engine VM など、基になる関連リソースにアノテーションを付けるために使用する、インスタンスのリソースラベル。ラベルキーとラベル値に使用できるのは、文字、数字、ダッシュ、アンダースコアのみです。ラベルキーの先頭は文字または数字にする必要があります。 なし [作成] をクリックします。インスタンスの作成プロセスが完了するまで 30 分ほどかかります。
Cloud Data Fusion がインスタンスを作成している間、[インスタンス] ページのインスタンス名の横に進捗状況が表示されます。完了すると、インスタンスの使用を開始できることを意味する緑色のチェックマークに変わります。
API
インスタンスの作成
Cloud Data Fusion REST API を使用して Cloud Data Fusion インスタンスを作成するには、instances.create
API リクエストを作成し、Instance
リソースに構成情報を入力します。
次のステップ
- Cloud Data Fusion について学ぶ。
- チュートリアルに取り組む。