Reinicie um recurso persistente

Pode reiniciar qualquer recurso persistente que esteja no estado RUNNING ou ERROR. O reinício de um recurso persistente permite-lhe recuperar de erros dos quais o recurso persistente não consegue recuperar sozinho. Também pode reiniciar um recurso persistente para obter manualmente clusters mais atualizados. Esta página mostra como reiniciar um recurso persistente através da consola Google Cloud e da API REST.

Funções necessárias

Para receber a autorização de que precisa para reiniciar um recurso persistente, peça ao seu administrador que lhe conceda a função de administrador do Vertex AI (roles/aiplatform.admin) do IAM no seu projeto. Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.

Esta função predefinida contém a autorização aiplatform.persistentResources.update , que é necessária para reiniciar um recurso persistente.

Também pode obter esta autorização com funções personalizadas ou outras funções predefinidas.

Reinicie um recurso persistente

Selecione um dos seguintes separadores para ver instruções sobre como reiniciar um recurso persistente. Certifique-se de que não existem tarefas de preparação em execução no recurso persistente.

Consola

Para reiniciar um recurso persistente na Google Cloud consola, faça o seguinte:

  1. Na Google Cloud consola, aceda à página Recursos persistentes.

    Aceda a Recursos persistentes

  2. Junto ao nome do recurso persistente que quer reiniciar, clique nas reticências verticais ().

  3. Clique em Reiniciar.

  4. Clique em Confirm.

gcloud

Antes de usar qualquer um dos dados de comandos abaixo, faça as seguintes substituições:

  • PROJECT_ID: o ID do projeto do recurso persistente que quer reiniciar.
  • LOCATION: a região do recurso persistente que quer reiniciar.
  • PERSISTENT_RESOURCE_ID: o ID do recurso persistente que quer reiniciar.

Execute o seguinte comando:

Linux, macOS ou Cloud Shell

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID \
    --project=PROJECT_ID \
    --region=LOCATION

Windows (PowerShell)

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID `
    --project=PROJECT_ID `
    --region=LOCATION

Windows (cmd.exe)

gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ^
    --project=PROJECT_ID ^
    --region=LOCATION

Deve receber uma resposta semelhante à seguinte:

Using endpoint [https://us-central1-aiplatform.googleapis.com/]
Request to reboot the PersistentResource [projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource] has been sent.

You may view the status of your persistent resource with the command

  $ gcloud ai persistent-resources describe projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource

REST

Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:

  • PROJECT_ID: o ID do projeto do recurso persistente que quer reiniciar.
  • LOCATION: a região do recurso persistente que quer reiniciar.
  • PERSISTENT_RESOURCE_ID: o ID do recurso persistente que quer reiniciar.

Método HTTP e URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources/PERSISTENT_RESOURCE_ID:reboot

Para enviar o seu pedido, expanda uma destas opções:

Deve receber uma resposta JSON semelhante à seguinte:

response: 
  {
    "name": "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource/operations/1234567890123456789",
    "metadata": {
      "@type": "type.googleapis.com/google.cloud.aiplatform.v1.RebootPersistentResourceOperationMetadata",
      "genericMetadata": {
        "createTime": "2024-03-18T17:31:54.955004Z",
        "updateTime": "2024-03-18T17:31:55.204817Z",
        "state": "RUNNING",
        "worksOn": [
          "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource"
        ]
      },
      "progressMessage": "Waiting for persistent resource shut down."
    }
  }

O reinício de um recurso persistente é uma operação de longa duração, durante a qual não é possível eliminar o recurso persistente. A operação contém um campo progressMessage que é preenchido com um estado de erro se ocorrer um. Depois de a operação indicar "done: true", verifique o estado do recurso persistente. Se o recurso persistente estiver no estado RUNNING, o reinício é bem-sucedido e está pronto para executar tarefas de preparação.

Limitações

Seguem-se as limitações para reiniciar um recurso persistente:

  • Em alguns casos, é possível perder a capacidade de recursos escassos quando reiniciar um recurso persistente. A retenção total de recursos não é garantida.
  • O reinício não está disponível no Ray no Vertex AI.
  • Os recursos persistentes que contêm pools de trabalhadores com escalamento automático são reiniciados com o número mínimo de réplicas.

O que se segue?