Cloud Dataproc の Anaconda コンポーネント

Cloud Dataproc クラスタを作成する際には、オプション コンポーネント機能を使用して、追加コンポーネントをインストールできます。このページでは Anaconda コンポーネントについて説明します。

Anaconda コンポーネントは Python ディストリビューションの 1 つであり、1,000 件を超える一般的なデータ サイエンス パッケージを備えたパッケージ マネージャーでもあります。このコンポーネントはすべてのクラスタノード上の /opt/conda/anaconda にインストールされ、Python のデフォルト インタープリタになります。

コンポーネントをインストールする

このコンポーネントは、Cloud Dataproc クラスタを作成するときにインストールします。Cloud Dataproc バージョン 1.3 以降で作成されたクラスタには、コンポーネントを追加できます。

Cloud Dataproc イメージの各リリースに含まれるコンポーネント バージョンについては、サポートされる Cloud Dataproc バージョンをご覧ください。

gcloud コマンド

Anaconda コンポーネントを組み込んで Cloud Dataproc クラスタを作成するには、--optional-components フラグを指定して gcloud dataproc clusters create cluster-name コマンドを使用します(イメージ バージョンには 1.3 以降)。

gcloud dataproc clusters create cluster-name \
    --optional-components=ANACONDA \
    --image-version=1.3 \
  ... other flags

REST API

Cloud Dataproc API を使用して Anaconda コンポーネントを指定するには、SoftwareConfig.Componentclusters.create リクエストの一部として使用します。

Console

GCP Console で、Cloud Dataproc のクラスタの作成 ページを開きます。ページ下部にある [詳細オプション] をクリックして [オプション コンポーネント] セクションを表示します。

[コンポーネントを選択] をクリックして [オプション コンポーネント] 選択パネルを開きます。クラスタにインストールするコンポーネントを 1 つ以上選択します。

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

Cloud Dataproc ドキュメント
ご不明な点がありましたら、Google のサポートページをご覧ください。