このページは Cloud Translation API によって翻訳されました。

Studio 管理機能を管理する

このページでは、Cloud Data Fusion Studio で構成を管理するために提供される管理機能について説明します。 Cloud Data Fusion は階層に従い、各インスタンスに複数の名前空間を持つことができます。管理者は Cloud Data Fusion Studio から、すべての名前空間を一元的に管理することも、個別に管理することもできます。Cloud Data Fusion Studio には、次のシステムと名前空間のコントロールが用意されています。

システム管理

Cloud Data Fusion Studio で [システム管理] をクリックすると、次のタブが表示されます。

[管理] タブ: さまざまな Cloud Data Fusion サービスの健全性ステータスを確認します。各サービスのログも表示できます。
[構成] タブ: 次のコントロールを作成、表示、編集します。
- Namespace。詳細については、名前空間サービスアカウントを使用したアクセス制御をご覧ください。
- システムコンピューティングプロファイル。コンピューティングプロファイルは、パイプラインの実行用クラスタの作成と、関連する構成の適用時に使用するプロビジョナーを示します。

プロビジョナーは、パイプラインが実行されるクラウド環境の作成、初期化、破棄を担当します。各プロビジョナーは、作成および削除されるクラスタのタイプを制御するために使用される一連の構成を公開します。プロビジョナーによって、作成されるクラスタのタイプが異なります。

各コンピューティングプロファイルには、システムまたはユーザーのスコープがあります。システムコンピューティングプロファイルは、その下の任意の名前空間に使用できます。ユーザーコンピューティングプロファイルは名前空間内に存在し、その名前空間内のパイプラインのみがユーザーコンピューティングプロファイルを使用できます。

システム管理者の [構成] タブで、すべての名前空間に適用されるシステムコンピューティングプロファイルを作成できます。Cloud Data Fusion はデフォルトのコンピューティングプロファイルを割り当てます。

コンピューティングプロファイルを作成するときに、プロビジョナーを選択します。このプロビジョナーは、プロファイルがクラウドランタイムの詳細を作成して構成するために使用します。

システム設定

環境設定は、システム自体、名前空間、アプリケーション（パイプラインを含む）、パイプライン内の個別のプログラムなど、Cloud Data Fusion 内のさまざまなレベルに適用される事前定義された構成です。環境設定を使用すると、頻繁に使用される構成のデフォルト値を設定できます。これらのデフォルトは、下位レベルのパイプラインとプログラムに継承できるため、反復的な構成タスクを削減できます。詳細については、マクロ、環境設定、ランタイムの引数を管理するをご覧ください。

HTTP 呼び出しアクション

[システム管理] ページの HTTP 呼び出しアクションを使用すると、Cloud Data Fusion Studio インターフェースから直接、Cloud Data Fusion 独自の API または他の Google Cloud サービス API を操作できます。ただし、外部データソースを使用してデータ処理パイプラインを構築する場合は、より包括的なソリューションとして、HTTP プラグインとその HTTP 呼び出しエグゼキュータをパイプライン内で使用します。HTTP 呼び出しアクションとは若干異なりますが、基本的なコンセプトは同じです。

構成とユースケース

HTTP 呼び出しアクションは、主に Cloud Data Fusion 内の管理タスクや構成目的で使用されます。これにより、Cloud Data Fusion Studio から直接、Cloud Data Fusion API や HTTP API を公開する他のサービスとやり取りできます。 Google Cloud

構成

HTTP 呼び出しの詳細は次のとおりです。

URL: 呼び出すウェブサービスのターゲットエンドポイント。
メソッド: 使用する HTTP メソッド（GET、POST、PUT など）。
省略可: ヘッダー: リクエストに必要なカスタムヘッダー。
省略可: 本文: POST 呼び出しや PUT 呼び出しなど、リクエスト本文で送信されるデータ。

定義した HTTP 呼び出しを実行し、Cloud Data Fusion Studio 内でウェブサービスからのレスポンスを表示できます。

ユースケース

Cloud Data Fusion API 呼び出しをテストする。HTTP 呼び出しアクションを使用すると、ウェブインターフェースから直接 Cloud Data Fusion API の機能をテストまたは確認できます。このアクションは、API の動作を把握したり、潜在的な問題のトラブルシューティングを行ったりする際に役立ちます。
名前空間を管理する（上級者向け）。名前空間の管理専用の UI がありますが、HTTP 呼び出しアクションを使用して、Cloud Data Fusion API を直接呼び出して、名前空間の作成、削除、構成などの高度なタスクを行うことができます。
他のサービスとのインタラクション（制限付き） Google Cloud 使用している他の Google Cloud サービスに一般公開されている HTTP API がある場合は、HTTP 呼び出しアクションを使用してこれらのサービスとやり取りできます。ただし、これは一般的なユースケースではありません。

重要な考慮事項

セキュリティ: HTTP 呼び出しアクションを使用する際は、特に環境に影響する可能性のある機密データや Cloud Data Fusion API 呼び出しには注意してください。各 API 呼び出しを実行する前に、その影響について十分に理解してください。
制限事項: HTTP 呼び出しアクションは、主に管理タスクとテストを目的としています。Cloud Data Fusion 内でのデータ操作を含む複雑なデータ処理パイプラインの構築には適していません。
パイプラインの代替方法: 外部データソースまたはサービスをデータパイプラインに統合するには、パイプライン定義内で HTTP プラグインとそれに関連付けられた HTTP 呼び出しエグゼキュータを使用します。これにより、データ処理ワークフロー内で HTTP インタラクションをより堅牢かつ制御された方法で管理できます。

名前空間の管理

Cloud Data Fusion Studio で [名前空間の管理] をクリックすると、特定の名前空間の構成を管理できます。名前空間ごとに、次の要素を定義できます。

コンピューティングプロファイル: 名前空間の管理で設定されたプロファイルは、ユーザー コンピューティングプロファイルです。これらのユーザーコンピューティングプロファイルは、その名前空間内のパイプラインのみが使用できます。詳細については、コンピューティングプロファイルを管理するをご覧ください。
環境設定: 名前空間レベルで定義された環境設定は、名前空間、アプリケーション（パイプラインを含む）、パイプライン内の個々のプログラムに適用されます。詳細については、マクロ、環境設定、ランタイムの引数を管理するをご覧ください。
接続: Cloud Data Fusion では、データパイプラインのソースとシンクへの接続を再利用できます。接続は [名前空間の管理] ページで追加できます。詳細については、接続の作成と管理をご覧ください。
ドライバ: Cloud Data Fusion の一部のプラグインでは、名前空間に JDBC ドライバを追加する必要があります。たとえば、MySQL バッチソースプラグインを使用してパイプラインを実行する前に、サポートされている MySQL ドライバを名前空間に追加する必要があります。JDBC ドライバを名前空間にアップロードまたは削除するには、[名前空間の管理] ページから、または Hub から直接行います。詳細については、プラグインドライバをご覧ください。
ソースコントロール管理: デプロイされたパイプラインの開発プロセスを効率的に管理するために、ソースコントロール管理では、名前空間をソース管理システムのリポジトリに接続できます。詳細については、ソースコントロール管理を使用してパイプラインを管理するをご覧ください。
サービスアカウント: リソースへのアクセスを制御するために、Cloud Data Fusion の名前空間はデフォルトで Cloud Data Fusion API サービスエージェントを使用します。 Google Cloud

データの分離を適切に行うには、カスタマイズされた Identity and Access Management（IAM）サービスアカウント（Per Namespace Service Account と呼ばれる）を各名前空間に関連付けます。カスタマイズされた IAM サービスアカウントは名前空間ごとに異なる場合があり、パイプラインのプレビュー、Wrangler、パイプラインの検証など、Cloud Data Fusion でのパイプライン設計時のオペレーションのために、名前空間の間の Google Cloud リソースへのアクセスを制御できます。詳細については、名前空間サービスアカウントを使用したアクセス制御をご覧ください。

次のステップ

コンピューティングプロファイルの詳細を確認する。
マクロ、設定、ランタイムの引数の詳細を確認する。