Memulai ulang resource persisten

Anda dapat memulai ulang resource persisten yang berada dalam status RUNNING atau ERROR. Dengan memulai ulang resource persisten, Anda dapat memulihkan dari error yang tidak dapat dipulihkan oleh resource persisten itu sendiri. Anda juga dapat memulai ulang resource persisten untuk mendapatkan cluster yang lebih baru secara manual. Halaman ini menunjukkan cara memulai ulang resource persisten menggunakan Konsol Google Cloud dan REST API.

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan guna memulai ulang resource persisten, minta administrator untuk memberi Anda peran IAM Vertex AI Administrator (roles/aiplatform.admin) di project Anda. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat Mengelola akses ke project, folder, dan organisasi.

Peran yang telah ditentukan ini berisi izin aiplatform.persistentResources.update, yang diperlukan untuk memulai ulang resource persisten.

Anda mungkin juga bisa mendapatkan izin ini dengan peran khusus atau peran bawaan lainnya.

Memulai ulang resource persisten

Pilih salah satu tab berikut untuk mengetahui petunjuk cara memulai ulang resource persisten. Pastikan tidak ada tugas pelatihan yang berjalan di resource persisten.

Konsol

Untuk memulai ulang resource persisten di konsol Google Cloud, lakukan hal berikut:

  1. Di konsol Google Cloud, buka halaman Persistent resources.

    Buka Resource persisten

  2. Di samping nama resource persisten yang ingin Anda mulai ulang, klik elipsis vertikal ().

  3. Klik Mulai ulang.

  4. Klik Konfirmasi.

gcloud

Sebelum menggunakan salah satu data perintah di bawah, lakukan penggantian berikut:

  • PROJECT_ID: Project ID resource persisten yang ingin Anda mulai ulang.
  • LOCATION: Region resource persisten yang ingin Anda mulai ulang.
  • PERSISTENT_RESOURCE_ID: ID resource persisten yang ingin Anda mulai ulang.

Jalankan perintah berikut:

Linux, macOS, atau Cloud Shell

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID \
    --project=PROJECT_ID \
    --region=LOCATION

Windows (PowerShell)

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID `
    --project=PROJECT_ID `
    --region=LOCATION

Windows (cmd.exe)

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ^
    --project=PROJECT_ID ^
    --region=LOCATION

Anda akan melihat respons seperti berikut:

Using endpoint [https://us-central1-aiplatform.googleapis.com/]
Request to reboot the PersistentResource [projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource] has been sent.

You may view the status of your persistent resource with the command

  $ gcloud ai persistent-resources describe projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource

REST

Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:

  • PROJECT_ID: Project ID resource persisten yang ingin Anda mulai ulang.
  • LOCATION: Region resource persisten yang ingin Anda mulai ulang.
  • PERSISTENT_RESOURCE_ID: ID resource persisten yang ingin Anda mulai ulang.

Metode HTTP dan URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources/PERSISTENT_RESOURCE_ID:reboot

Untuk mengirim permintaan, perluas salah satu opsi berikut:

Anda akan melihat respons JSON seperti berikut:

response: 
  {
    "name": "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource/operations/1234567890123456789",
    "metadata": {
      "@type": "type.googleapis.com/google.cloud.aiplatform.v1.RebootPersistentResourceOperationMetadata",
      "genericMetadata": {
        "createTime": "2024-03-18T17:31:54.955004Z",
        "updateTime": "2024-03-18T17:31:55.204817Z",
        "state": "RUNNING",
        "worksOn": [
          "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource"
        ]
      },
      "progressMessage": "Waiting for persistent resource shut down."
    }
  }

Memulai ulang resource persisten adalah operasi yang berjalan lama, selama resource persisten tidak dapat dihapus. Operasi ini berisi kolom progressMessage yang diisi dengan status error jika terjadi. Setelah operasi menunjukkan "done: true", periksa status resource persisten. Jika resource persisten berada dalam status RUNNING, mulai ulang berhasil dan siap menjalankan tugas pelatihan.

Batasan

Berikut adalah batasan untuk memulai ulang resource persisten:

  • Dalam beberapa kasus, kapasitas resource yang langka dapat hilang saat memulai ulang resource persisten. Retensi resource penuh tidak dijamin.
  • Mulai ulang tidak tersedia di Ray di Vertex AI.
  • Resource persisten yang berisi kumpulan pekerja yang diskalakan otomatis akan dimulai ulang dengan jumlah replika minimum.

Langkah selanjutnya