Komponen Anaconda opsional Dataproc

Anda dapat menginstal komponen tambahan seperti Anaconda saat membuat cluster Dataproc menggunakan fitur Komponen opsional. Halaman ini menjelaskan komponen Anaconda.

Komponen Anaconda adalah distribusi Python dan Pengelola Paket dengan lebih dari 1.000 paket data science yang populer. Komponen ini diinstal pada semua node cluster di /opt/conda/anaconda, dan menjadi penafsir Python default. Untuk informasi penginstalan tambahan, lihat Mengonfigurasi lingkungan Dataproc Python.

Menginstal komponen

Instal komponen saat Anda membuat cluster Dataproc. Lihat Versi Dataproc yang didukung untuk versi komponen yang disertakan dalam setiap rilis image Dataproc.

Perintah gcloud

Untuk membuat cluster Dataproc yang menyertakan komponen Anaconda, gunakan perintah gcloud dataproc cluster create cluster-name dengan flag --optional-components.

gcloud dataproc clusters create cluster-name \
    --region=region \
    --optional-components=ANACONDA \
    ... other args

REST API

Komponen Anaconda dapat ditentukan melalui Dataproc API menggunakan SoftwareConfig.Component sebagai bagian dari permintaan clusters.create.

Konsol

  1. Aktifkan komponen.
    • Di Konsol Google Cloud, buka halaman Buat cluster Dataproc. Panel Siapkan cluster dipilih.
    • Di bagian Components:
      • Di bagian Optional Components, pilih Anaconda dan komponen opsional lainnya untuk diinstal di cluster Anda.