Cloud Dataproc のバージョニング

Cloud Dataproc ではイメージを使用して、利便性の高い Google Cloud Platform コネクタと Apache Spark や Apache Hadoop のコンポーネントを 1 つのパッケージにまとめ、Cloud Dataproc クラスタにデプロイできます。このイメージには、クラスタの基本オペレーティング システム(Debian または Ubuntu)の他に、ジョブの実行に必要な Spark、Hadoop、Hive などのコア コンポーネントとオプション コンポーネントが含まれます。このイメージは、新しい改善点と機能のために定期的にアップグレードされます。Cloud Dataproc のバージョニングでは、クラスタを作成するときにソフトウェア バージョンのセットを選択できます。

バージョニングの仕組み

作成されたイメージには、以下の形式のイメージ バージョン番号が付けられます。

version_major.version_minor.version_sub_minor-os_distribution

現在、次の OS ディストリビューションが維持されています。

OS ディストリビューション コード OS ディストリビューション
debian9 Debian 9
ubuntu18 Ubuntu 18

以前にサポートされていた OS ディストリビューションについては、古いイメージ バージョンをご覧ください。

本番環境の場合や、特定のコンポーネントとの互換性が重要な場合は、major.minor イメージ バージョンを指定することをおすすめします。サブマイナーと OS ディストリビューションは、最新の週次リリースに自動的に設定されます。

バージョンの選択

新しい Cloud Dataproc クラスタを作成する際に、デフォルトでは利用可能な最新の Debian イメージ バージョンが使用されます。クラスタの作成時に Debian イメージ バージョンか Ubuntu イメージ バージョンのどちらかを選択できます(Cloud Dataproc のイメージ バージョン リストをご覧ください)。Debian ベースのイメージを指定する場合、イメージ バージョンの OS ディストリビューション コード接尾辞を省略できます。たとえば、1.3-debian9 イメージを選択するには「1.3」と指定します。Ubuntu ベースのイメージを選択する場合は、OS 接尾辞の使用が必要です。たとえば、「1.4-ubuntu18」と指定します。

gcloud コマンド

gcloud dataproc clusters create コマンドを使用して新しいクラスタを作成する際は、--image-version 引数でイメージ バージョンを指定できます。

Debian イメージの例:

gcloud dataproc clusters create new-cluster-name --image-version 1.4

Ubuntu イメージの例:

gcloud dataproc clusters create new-cluster-name --image-version 1.3-ubuntu18

最新のサブマイナー バージョンが使用されるように、サブマイナー バージョンの指定を省略することをおすすめします。ただし、必要に応じてサブマイナー バージョンを指定することもできます(例: 1.2.67)。

現在のバージョンは gcloud コマンドライン ツールで確認できます。

gcloud dataproc clusters describe cluster-name

REST API

SoftwareConfig imageVersion フィールドを cluster.create API リクエストの一部として指定できます。

POST /v1/projects/project-id/regions/global/clusters/
{
  "projectId": "project-id",
  "clusterName": "example-cluster",
  "config": {
    "configBucket": "",
    "gceClusterConfig": {
      "subnetworkUri": "default",
      "zoneUri": "us-central1-b"
    },
    "masterConfig": {
      ...
      }
    },
    "workerConfig": {
      ...
      }
    },
    "softwareConfig": {
      "imageVersion": "1.3"
    }
  }
}
  

Console

新しいクラスタを作成するときに、Cloud Dataproc の [クラスタの作成] フォームの一番下にある [詳細オプション] をクリックします。

[イメージ] フィールドに、クラスタの作成時に使用されるイメージが示されます。最初はデフォルトのイメージ(利用可能な最新の Debian のバージョン)が示されます。

[変更] をクリックすると、クラスタに使用できるイメージのリストが表示されます。標準イメージまたはカスタム イメージを選択します。

新しいバージョンを作成する場合

次の 1 つ以上を組み込むために新しいメジャー バージョンが定期的に作成されます。

  • 次のもののメジャー リリース:
    • Spark、Hadoop、その他のビッグデータ コンポーネント
    • Google Cloud コネクタ
  • Cloud Dataproc 機能に対するメジャー変更や更新

次の 1 つ以上を組み込むために新しいマイナー バージョンが定期的に作成されます。

  • 次のもののマイナー リリースと更新:
    • Spark、Hadoop、その他のビッグデータ コンポーネント
    • Google Cloud コネクタ
  • Cloud Dataproc 機能に対するマイナー変更や更新

新しいマイナー バージョンが作成されると、その Debian イメージがメジャー バージョンのデフォルトとなり、メジャー バージョンの最新リリースになります。

新しいサブマイナー バージョンが定期的に作成され、以下の 1 つ以上が組み込まれます。

  • イメージに含まれるコンポーネントのパッチやフィックス

イメージ バージョンと Cloud Dataproc のサポート

メジャーとマイナーのイメージ バージョンは、リリース後の一定期間にサポートされます。この期間中、そのイメージ バージョンを使用するクラスタがサポートの対象になります。サポート期間が終了すると、イメージ バージョンを使用するクラスタはサポートの対象ではなくなります。

イメージ バージョンをリリースしてからの月数 このイメージ バージョンでクラスタを作成できるか このイメージ バージョンを使用するクラスタはサポート対象か
0~12
12~24 ×
24+ × ×

サブマイナー バージョンではライフタイムやサポートが保証されません。

古いイメージ バージョン

以前サポートされていた OS ディストリビューション

以前サポートされていた OS ディストリビューションは次のとおりです。

OS ディストリビューション コード OS ディストリビューション 最終リリース日
deb8 Debian 8 2018 年 10 月 26 日

明示的な OS ディストリビューションがないイメージ バージョン

2018 年 8 月 16 日より前のイメージ バージョンはすべて Debian 8 でビルドされ、OS ディストリビューション コードが省略されています。次の形式で指定されています。

version_major.version_minor.version_sub_minor

0.1 と 0.2

一般提供になった Cloud Dataproc バージョン 1.0 より前にアルファ版またはベータ版としてリリースされたイメージ バージョンは、Cloud Dataproc サポート ポリシーの対象になりません。

バージョニングに関する重要な注意事項

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

Cloud Dataproc ドキュメント
ご不明な点がありましたら、Google のサポートページをご覧ください。