Membuat ulang dan mengupdate cluster

Langkah-langkah untuk membuat ulang dan mengupdate cluster

Anda dapat menggunakan alat command line gcloud atau Dataproc API untuk menyalin konfigurasi dari cluster yang ada, memperbarui konfigurasi yang disalin, lalu membuat cluster baru dengan konfigurasi yang diperbarui.

gcloud CLI

Contoh petunjuk ini menunjukkan cara mengupdate setelan versi gambar dalam konfigurasi cluster. Anda dapat mengubah contoh ini untuk memperbarui setelan konfigurasi cluster yang berbeda.

  1. Menetapkan variabel.
    export PROJECT=project-id
    export REGION=region
    export OLD_CLUSTER=old-cluster-name
    export NEW_CLUSTER=new-cluster-name
    export NEW_IMAGE_VERSION=image-version (for example, '2.2-debian12')
    
  2. Mengekspor konfigurasi cluster yang ada (lama) ke file YAML.
    gcloud dataproc clusters export $OLD_CLUSTER \
        --project=$PROJECT \
        --region=$REGION > "${OLD_CLUSTER}-config.yaml"
  3. Perbarui konfigurasi. Contoh berikut menggunakan sed untuk mengupdate versi image.
    sed -E "s|(^[[:blank:]]+)imageVersion: .+|\1imageVersion: ${NEW_IMAGE_VERSION}|g" "${OLD_CLUSTER}-config.yaml" | sed -E '/^[[:blank:]]+imageUri: /d' > "${NEW_CLUSTER}-config-updated.yaml"
  4. Buat cluster baru dengan nama baru dan konfigurasi yang diperbarui.
    gcloud dataproc clusters import $NEW_CLUSTER \
        --project=$PROJECT \
        --region=$REGION \
        --source="${NEW_CLUSTER}-config-updated.yaml"
  5. Setelah mengonfirmasi workload Anda berjalan di cluster baru tanpa masalah, hapus cluster yang ada (lama). PENTING: Langkah ini akan menghapus semua data yang disimpan di HDFS dan di disk lokal di cluster Anda.
    gcloud dataproc clusters delete $OLD_CLUSTER \
        --project=$PROJECT \
        --region=$REGION

REST API

Contoh petunjuk ini menunjukkan cara mengupdate nama cluster dan setelan versi gambar dalam konfigurasi cluster. Anda dapat mengubah contoh variabel untuk memperbarui setelan konfigurasi cluster yang berbeda.

  1. Menetapkan variabel.
    export PROJECT=project-id
    export REGION=region
    export OLD_CLUSTER=old-cluster-name
    export NEW_CLUSTER=new-cluster-name
    export NEW_IMAGE_VERSION=image-version (for example, '2.2-debian12')
    
    
  2. Ekspor konfigurasi cluster yang ada (lama) ke file JSON.
    curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)"  "https://dataproc.googleapis.com/v1/projects/${PROJECT}/regions/${REGION}/clusters/${OLD_CLUSTER}?alt=json" > "${OLD_CLUSTER}-config.json"
  3. Perbarui konfigurasi. Contoh berikut menggunakan jq untuk memperbarui nama cluster dan versi image.
    jq ".clusterName = \"${NEW_CLUSTER}\" | .config.softwareConfig.imageVersion=\"${NEW_IMAGE_VERSION}\" | del(.config.workerConfig.imageUri) | del(.config.masterConfig.imageUri)" "${OLD_CLUSTER}-config.json" > "${NEW_CLUSTER}-config-updated.json"
  4. Impor konfigurasi cluster yang diupdate untuk membuat cluster baru dengan konfigurasi yang diupdate.
    curl -i -X POST  -H "Authorization: Bearer $(gcloud auth print-access-token)"  -H "Content-Type: application/json; charset=utf-8" -d "@${NEW_CLUSTER}-config-updated.json" "https://dataproc.googleapis.com/v1/projects/${PROJECT}/regions/${REGION}/clusters?alt=json"
  5. Setelah mengonfirmasi workload Anda berjalan di cluster baru tanpa masalah, hapus cluster yang ada (lama). PENTING: Langkah ini akan menghapus semua data yang disimpan di HDFS dan di disk lokal di cluster Anda.
    curl -X DELETE -H "Authorization: Bearer $(gcloud auth print-access-token)" "https://dataproc.googleapis.com/v1/projects/${PROJECT}/regions/${REGION}/clusters/${OLD_CLUSTER}"
    

Konsol

Konsol tidak mendukung pembuatan ulang cluster dengan mengimpor konfigurasi cluster.