テンプレートを使用して Dataproc クラスタを更新する

このページでは、Google API Explorer テンプレートを使用して Dataproc クラスタを更新し、クラスタ内のワーカーの数を変更する方法について説明します。クラスタのスケーリングによるワーカーの追加は、より大きなジョブを処理するためにワーカーを追加する必要がある場合によく行われます。

Dataproc クラスタを更新する他の方法については、以下をご覧ください。

準備

このクイックスタートは、すでに Dataproc クラスタの作成が完了していることを前提としています。 API ExplorerGoogle Cloud Console CLI の gcloud コマンドライン ツール、またはCloud クライアント ライブラリ を使用したクイックスタートを使用してクラスタを作成できます。

クラスタの更新

クラスタ内のワーカーの数を更新するには、Google API Explorer の [Try this API] テンプレートに入力して実行します。

  1. リクエストのパラメータ:

    1. プロジェクト ID を挿入します。
    2. クラスタが配置されるリージョンを指定します(「us-central1」を確認または置き換えます)。クラスタのリージョンは、CGoogle Cloud コンソールの Dataproc の [クラスタ] ページに表示されます。
    3. 更新する既存のクラスタの [clusterName] を指定します(「example-cluster」を必要に応じて置き換えます)。
    4. updateMask: 「config.worker_config.num_instances」。これは、更新する numInstances パラメータに対する Cluster リソースに関連する JSON PATH です(リクエスト本文の説明をご覧ください)。
  2. リクエストの本文:

    1. config.workerConfig.numInstances: ("3": 新しいワーカーの数)。この値を変更して、ワーカーの数を変更できます。たとえば、標準クラスタのデフォルトのワーカー数が 2 の場合、3 を指定すると 1 ワーカーが追加されます。4 を追加すると 2 ワーカーが追加されます。標準の Dataproc クラスタには、少なくとも 2 つのワーカーが必要です。
  3. [実行] をクリックします。API テンプレートを初めて実行する場合、Google アカウントを選択してログインし、Google API Explorer からアカウントへのアクセスを承認するよう求められます。リクエストが成功すると、JSON のレスポンスで、クラスタの更新が保留中であることが示されます。

  4. クラスタ内のワーカーの数が更新されたことを確認するには、Google Cloud コンソールで Dataproc のクラスタページを開き、クラスタのワーカーノード総数列を表示します。クラスタの更新が完了してから更新された値を表示するには、ページの上部にある [更新] をクリックする必要がある場合があります。

クリーンアップ

このページで使用したリソースについて、Google Cloud アカウントに課金されないようにするには、次の手順を行います。

  1. 他のクイックスタートの確認や、他のジョブを実行するためのクラスタが必要ない場合は、API ExplorerGoogle Cloud Console、gcloud CLI の gcloud コマンドライン ツールまたは Cloud クライアント ライブラリを使用したクイックスタートを使用してクラスタを削除できます。

次のステップ

  • クラスタは、このクイックスタート テンプレートを使用して以前の workerConfig.numInstances 値に戻すことができます。

  • Scala ジョブを記述して実行する方法を学習する。