テンプレートを使用して Dataproc クラスタを更新する
このページでは、Google API Explorer テンプレートを使用して Dataproc クラスタを更新し、クラスタ内のワーカーの数を変更する方法について説明します。クラスタのスケーリングによるワーカーの追加は、より大きなジョブを処理するためにワーカーを追加する必要がある場合によく行われます。
Dataproc クラスタを更新する他の方法については、以下をご覧ください。
準備
このクイックスタートは、すでに Dataproc クラスタの作成が完了していることを前提としています。 API Explorer、Google Cloud Console、 CLI の gcloud コマンドライン ツール、またはCloud クライアント ライブラリ を使用したクイックスタートを使用してクラスタを作成できます。クラスタの更新
クラスタ内のワーカーの数を更新するには、Google API Explorer の [Try this API] テンプレートに入力して実行します。
リクエストのパラメータ:
- プロジェクト ID を挿入します。
- クラスタが配置されるリージョンを指定します(「us-central1」を確認または置き換えます)。クラスタのリージョンは、CGoogle Cloud コンソールの Dataproc の [クラスタ] ページに表示されます。
- 更新する既存のクラスタの [clusterName] を指定します(「example-cluster」を必要に応じて置き換えます)。
- updateMask: 「config.worker_config.num_instances」。これは、更新する
numInstances
パラメータに対する Cluster リソースに関連する JSON PATH です(リクエスト本文の説明をご覧ください)。
リクエストの本文:
- config.workerConfig.numInstances: ("3": 新しいワーカーの数)。この値を変更して、ワーカーの数を変更できます。たとえば、標準クラスタのデフォルトのワーカー数が 2 の場合、3 を指定すると 1 ワーカーが追加されます。4 を追加すると 2 ワーカーが追加されます。標準の Dataproc クラスタには、少なくとも 2 つのワーカーが必要です。
[実行] をクリックします。API テンプレートを初めて実行する場合、Google アカウントを選択してログインし、Google API Explorer からアカウントへのアクセスを承認するよう求められます。リクエストが成功すると、JSON のレスポンスで、クラスタの更新が保留中であることが示されます。
クラスタ内のワーカーの数が更新されたことを確認するには、Google Cloud コンソールで Dataproc のクラスタページを開き、クラスタのワーカーノード総数列を表示します。クラスタの更新が完了してから更新された値を表示するには、ページの上部にある [更新] をクリックする必要がある場合があります。
クリーンアップ
このページで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、次の手順を行います。
- 他のクイックスタートの確認や、他のジョブを実行するためのクラスタが必要ない場合は、API Explorer、Google Cloud Console、gcloud CLI の gcloud コマンドライン ツールまたは Cloud クライアント ライブラリを使用したクイックスタートを使用してクラスタを削除できます。
次のステップ
クラスタは、このクイックスタート テンプレートを使用して以前の
workerConfig.numInstances
値に戻すことができます。Scala ジョブを記述して実行する方法を学習する。