Membuat ulang dan memperbarui cluster

Langkah-langkah untuk membuat ulang dan memperbarui cluster

Anda dapat menggunakan alat command line gcloud atau Dataproc API untuk menyalin konfigurasi dari cluster yang ada, mengupdate konfigurasi yang disalin, lalu membuat cluster baru dengan konfigurasi yang diupdate.

gcloud CLI

Contoh petunjuk menunjukkan pembaruan setelan versi gambar dalam konfigurasi cluster. Anda dapat mengubah contoh untuk memperbarui setelan konfigurasi cluster yang berbeda.

  1. Tetapkan variabel.
    export PROJECT=project-id
    export REGION=region
    export OLD_CLUSTER=old-cluster-name
    export NEW_CLUSTER=new-cluster-name
    export NEW_IMAGE_VERSION=image-version (for example, '2.2-debian12')
    
  2. Ekspor konfigurasi cluster yang ada (lama) ke file YAML.
    gcloud dataproc clusters export $OLD_CLUSTER \
        --project=$PROJECT \
        --region=$REGION > "${OLD_CLUSTER}-config.yaml"
  3. Perbarui konfigurasi. Contoh berikut menggunakan sed untuk memperbarui versi gambar.
    sed -E "s|(^[[:blank:]]+)imageVersion: .+|\1imageVersion: ${NEW_IMAGE_VERSION}|g" "${OLD_CLUSTER}-config.yaml" | sed -E '/^[[:blank:]]+imageUri: /d' > "${NEW_CLUSTER}-config-updated.yaml"
  4. Buat cluster baru dengan nama baru dan konfigurasi yang diperbarui.
    gcloud dataproc clusters import $NEW_CLUSTER \
        --project=$PROJECT \
        --region=$REGION \
        --source="${NEW_CLUSTER}-config-updated.yaml"
  5. Setelah mengonfirmasi bahwa workload Anda berjalan di cluster baru tanpa masalah, hapus cluster yang ada (lama). PENTING: Langkah ini akan menghapus semua data yang disimpan di HDFS dan di disk lokal di cluster Anda.
    gcloud dataproc clusters delete $OLD_CLUSTER \
        --project=$PROJECT \
        --region=$REGION

REST API

Contoh petunjuk menunjukkan pembaruan nama cluster dan setelan versi gambar dalam konfigurasi cluster. Anda dapat mengubah variabel contoh untuk memperbarui setelan konfigurasi cluster yang berbeda.

  1. Tetapkan variabel.
    export PROJECT=project-id
    export REGION=region
    export OLD_CLUSTER=old-cluster-name
    export NEW_CLUSTER=new-cluster-name
    export NEW_IMAGE_VERSION=image-version (for example, '2.2-debian12')
    
    
  2. Ekspor konfigurasi cluster yang ada (lama) ke file JSON.
    curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)"  "https://dataproc.googleapis.com/v1/projects/${PROJECT}/regions/${REGION}/clusters/${OLD_CLUSTER}?alt=json" > "${OLD_CLUSTER}-config.json"
  3. Perbarui konfigurasi. Contoh berikut menggunakan jq untuk memperbarui nama cluster dan versi image.
    jq ".clusterName = \"${NEW_CLUSTER}\" | .config.softwareConfig.imageVersion=\"${NEW_IMAGE_VERSION}\" | del(.config.workerConfig.imageUri) | del(.config.masterConfig.imageUri)" "${OLD_CLUSTER}-config.json" > "${NEW_CLUSTER}-config-updated.json"
  4. Impor konfigurasi cluster yang telah diperbarui untuk membuat cluster baru dengan konfigurasi yang diperbarui.
    curl -i -X POST  -H "Authorization: Bearer $(gcloud auth print-access-token)"  -H "Content-Type: application/json; charset=utf-8" -d "@${NEW_CLUSTER}-config-updated.json" "https://dataproc.googleapis.com/v1/projects/${PROJECT}/regions/${REGION}/clusters?alt=json"
  5. Setelah mengonfirmasi bahwa workload Anda berjalan di cluster baru tanpa masalah, hapus cluster yang ada (lama). PENTING: Langkah ini akan menghapus semua data yang disimpan di HDFS dan di disk lokal di cluster Anda.
    curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" "https://dataproc.googleapis.com/v1/projects/${PROJECT}/regions/${REGION}/clusters/${OLD_CLUSTER}"
    

Konsol

Konsol tidak mendukung pembuatan ulang cluster dengan mengimpor konfigurasi cluster.