Riavvia una risorsa permanente

Puoi riavviare qualsiasi risorsa permanente nello stato RUNNING o ERROR. Il riavvio di una risorsa permanente ti consente di ripristinare gli errori non può recuperare da solo. Puoi anche riavviare una risorsa permanente per ottenere manualmente cluster più aggiornati. In questa pagina viene spiegato come riavvia una risorsa permanente utilizzando la console Google Cloud e l'API REST.

Ruoli obbligatori

Per ottenere l'autorizzazione necessaria per riavviare una risorsa persistente, chiedi all'amministratore di concederti il ruolo IAM Amministratore Vertex AI (roles/aiplatform.admin) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestire l'accesso a progetti, cartelle e organizzazioni.

Questo ruolo predefinito contiene l'autorizzazione aiplatform.persistentResources.update necessaria per riavviare una risorsa persistente.

Potresti anche riuscire a ottenere questa autorizzazione con ruoli personalizzati e altri ruoli predefiniti.

Riavviare una risorsa permanente

Seleziona una delle seguenti schede per istruzioni su come riavviare un risorsa. Assicurati che non ci siano job di addestramento in esecuzione sulla risorsa permanente.

Console

Per riavviare una risorsa permanente nella console Google Cloud, segui questi passaggi:

  1. Nella console Google Cloud, vai alla pagina Risorse permanenti.

    Vai a Risorse permanenti

  2. Accanto al nome della risorsa persistente che vuoi riavviare, fai clic su i tre puntini verticali ().

  3. Fai clic su Riavvia.

  4. Fai clic su Conferma.

gcloud

Prima di utilizzare uno qualsiasi dei dati di comando riportati di seguito, effettua le seguenti sostituzioni:

  • PROJECT_ID: l'ID del progetto e la risorsa che vuoi riavviare.
  • LOCATION: la regione della risorsa permanente che vuoi riavviare.
  • PERSISTENT_RESOURCE_ID: l'ID del risorsa permanente che vuoi riavviare.

Esegui la persone che seguo :

Linux, macOS o Cloud Shell

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID \
    --project=PROJECT_ID \
    --region=LOCATION

Windows (PowerShell)

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID `
    --project=PROJECT_ID `
    --region=LOCATION

Windows (cmd.exe)

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ^
    --project=PROJECT_ID ^
    --region=LOCATION

Dovresti ricevere una risposta simile alla seguente:

Using endpoint [https://us-central1-aiplatform.googleapis.com/]
Request to reboot the PersistentResource [projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource] has been sent.

You may view the status of your persistent resource with the command

  $ gcloud ai persistent-resources describe projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource

REST

Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:

  • PROJECT_ID: l'ID del progetto e la risorsa che vuoi riavviare.
  • LOCATION: la regione della risorsa permanente che vuoi riavviare.
  • PERSISTENT_RESOURCE_ID: l'ID del risorsa permanente che vuoi riavviare.

Metodo HTTP e URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources/PERSISTENT_RESOURCE_ID:reboot

Per inviare la richiesta, espandi una delle seguenti opzioni:

Dovresti ricevere una risposta JSON simile alla seguente:

response: 
  {
    "name": "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource/operations/1234567890123456789",
    "metadata": {
      "@type": "type.googleapis.com/google.cloud.aiplatform.v1.RebootPersistentResourceOperationMetadata",
      "genericMetadata": {
        "createTime": "2024-03-18T17:31:54.955004Z",
        "updateTime": "2024-03-18T17:31:55.204817Z",
        "state": "RUNNING",
        "worksOn": [
          "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource"
        ]
      },
      "progressMessage": "Waiting for persistent resource shut down."
    }
  }

Il riavvio di una risorsa permanente è un un'operazione a lunga esecuzione, durante il quale non è possibile eliminare la risorsa permanente. L'operazione contiene Campo progressMessage che viene compilato con uno stato di errore, se presente. Dopo il giorno l'operazione indica "done: true", controlla lo stato della risorsa permanente. Se la risorsa permanente è nello stato RUNNING, il riavvio è andato a buon fine ed è possibile eseguire i job di addestramento.

Limitazioni

Di seguito sono riportate le limitazioni per il riavvio di una risorsa permanente:

  • In alcuni casi, è possibile perdere la capacità delle risorse scarse quando il riavvio di una risorsa permanente. Non è garantita la conservazione completa delle risorse.
  • Il riavvio non è disponibile su Ray su Vertex AI.
  • Le risorse permanenti contenenti pool di worker con scalabilità automatica si riavviano con numero minimo di repliche.

Passaggi successivi