RUNNING
ou ERROR
.
O reinício de um recurso persistente permite-lhe recuperar de erros dos quais o recurso persistente não consegue recuperar sozinho. Também pode reiniciar um recurso persistente para obter manualmente clusters mais atualizados. Esta página mostra como
reiniciar um recurso persistente através da consola Google Cloud e da API REST.
Funções necessárias
Para receber a autorização de que
precisa para reiniciar um recurso persistente,
peça ao seu administrador que lhe conceda a função de
administrador do Vertex AI (roles/aiplatform.admin
)
do IAM no seu projeto.
Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.
Esta função predefinida contém a autorização
aiplatform.persistentResources.update
, que é necessária para
reiniciar um recurso persistente.
Também pode obter esta autorização com funções personalizadas ou outras funções predefinidas.
Reinicie um recurso persistente
Selecione um dos seguintes separadores para ver instruções sobre como reiniciar um recurso persistente. Certifique-se de que não existem tarefas de preparação em execução no recurso persistente.
Consola
Para reiniciar um recurso persistente na Google Cloud consola, faça o seguinte:
Na Google Cloud consola, aceda à página Recursos persistentes.
Junto ao nome do recurso persistente que quer reiniciar, clique nas reticências verticais (
).Clique em Reiniciar.
Clique em Confirm.
gcloud
Antes de usar qualquer um dos dados de comandos abaixo, faça as seguintes substituições:
- PROJECT_ID: o ID do projeto do recurso persistente que quer reiniciar.
- LOCATION: a região do recurso persistente que quer reiniciar.
- PERSISTENT_RESOURCE_ID: o ID do recurso persistente que quer reiniciar.
Execute o seguinte comando:
Linux, macOS ou Cloud Shell
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID \ --project=PROJECT_ID \ --region=LOCATION
Windows (PowerShell)
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ` --project=PROJECT_ID ` --region=LOCATION
Windows (cmd.exe)
gcloud ai persistent-resources reboot PERSISTENT_RESOURCE_ID ^ --project=PROJECT_ID ^ --region=LOCATION
Deve receber uma resposta semelhante à seguinte:
Using endpoint [https://us-central1-aiplatform.googleapis.com/] Request to reboot the PersistentResource [projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource] has been sent. You may view the status of your persistent resource with the command $ gcloud ai persistent-resources describe projects/sample-project/locations/us-central1/persistentResources/test-persistent-resource
REST
Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:
- PROJECT_ID: o ID do projeto do recurso persistente que quer reiniciar.
- LOCATION: a região do recurso persistente que quer reiniciar.
- PERSISTENT_RESOURCE_ID: o ID do recurso persistente que quer reiniciar.
Método HTTP e URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/persistentResources/PERSISTENT_RESOURCE_ID:reboot
Para enviar o seu pedido, expanda uma destas opções:
Deve receber uma resposta JSON semelhante à seguinte:
response:{ "name": "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource/operations/1234567890123456789", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.RebootPersistentResourceOperationMetadata", "genericMetadata": { "createTime": "2024-03-18T17:31:54.955004Z", "updateTime": "2024-03-18T17:31:55.204817Z", "state": "RUNNING", "worksOn": [ "projects/123456789012/locations/us-central1/persistentResources/test-persistent-resource" ] }, "progressMessage": "Waiting for persistent resource shut down." } }
O reinício de um recurso persistente é uma
operação de longa duração,
durante a qual não é possível eliminar o recurso persistente. A operação contém um campo progressMessage
que é preenchido com um estado de erro se ocorrer um. Depois de a operação indicar "done: true"
, verifique o estado do recurso persistente. Se o recurso persistente estiver no estado RUNNING
, o reinício é bem-sucedido e está pronto para executar tarefas de preparação.
Limitações
Seguem-se as limitações para reiniciar um recurso persistente:
- Em alguns casos, é possível perder a capacidade de recursos escassos quando reiniciar um recurso persistente. A retenção total de recursos não é garantida.
- O reinício não está disponível no Ray no Vertex AI.
- Os recursos persistentes que contêm pools de trabalhadores com escalamento automático são reiniciados com o número mínimo de réplicas.
O que se segue?
- Saiba mais acerca do recurso persistente.
- Crie e use um recurso persistente.
- Executar tarefas de preparação num recurso persistente.
- Receba informações sobre um recurso persistente.
- Elimine um recurso persistente.