Ativar o controle de manutenção avançado para nós de locatário individual


O controle de manutenção avançado para locatário individual permite controlar eventos de manutenção planejadas para grupos de nós de locatário individual e minimizar interrupções relacionadas à manutenção. Esse recurso está disponível apenas para grupos de nós de locatário individual. Para usar esse recurso com as máquinas virtuais atuais, primeiro é preciso mover as VMs para grupos de nós de locatário individual que tenham o controle de manutenção avançado ativado.

Com o controle de manutenção avançado do recurso de locatário individual, é possível fazer o seguinte:

  • Verifique se há eventos de manutenção programados para um nó de locatário individual com 28 dias de antecedência.
  • Acione a manutenção imediatamente ou programe-a para depois. Se você acionar a manutenção imediatamente, ela ocorrerá dentro de 24 horas a partir do momento em que a solicitação for acionada.

Veja a seguir o processo para criar um grupo de nós de locatário individual com controle de manutenção avançado:

  1. Ative o controle de manutenção avançado em grupos de nós compatíveis de locatário individual. Esse recurso está disponível apenas para grupos de nós de locatário individual. Para usar esse recurso com suas VMs ou cargas de trabalho de locatário individual, primeiro você precisa migrá-las para grupos de nós de locatário individual com o controle de manutenção avançado ativado.

  2. Verifique a manutenção futura dos nós de locatário individual. A manutenção de um nó de locatário individual acontece no máximo a cada 28 dias. É possível verificar o evento de manutenção de um nó 28 dias antes do início da janela de manutenção de 24 horas em que a manutenção está programada para esse nó.

  3. Se a manutenção estiver programada para um nó de locatário individual e antes do início da janela de manutenção programada, será possível:

    • Acione a manutenção imediatamente ou programe-a para depois. Se você optar por acionar a manutenção imediatamente, ela ocorrerá dentro de 24 horas a partir do momento em que a solicitação for acionada. A data e a hora programadas que você escolher precisam ser anteriores ao horário de início da janela de manutenção inicial.

    • Se você não acionar a manutenção imediatamente ou programá-la para mais tarde, a manutenção acontecerá dentro do tempo fornecido na janela de manutenção inicial.

É possível fazer o escalonamento automático de grupos de nós de locatário individual com o controle de manutenção avançado ativado. Registros de auditoria são gerados em todos os casos.

Limitações

Estas são as limitações do controle de manutenção avançada para o recurso de locatário individual no estágio de pré-lançamento:

  • Famílias de máquinas: esse recurso é compatível apenas com as famílias de VMs M1, M2, M3, C2 e N2. Ele não é compatível com as famílias de VMs N1 e N2D.
  • SSDs e GPUs locais: as GPUs e SSDs locais não são compatíveis com esse recurso.
  • Políticas de manutenção: esse recurso é compatível com a política de manutenção padrão (migração em tempo real) no estágio de pré-lançamento. Outras políticas de manutenção, como reinicialização no local (BYOLv1) e migração no grupo de nós (BYOLv2), não são compatíveis.
  • Nós: esse recurso aceita no máximo 20 nós por projeto e por zona.
  • Controle de manutenção avançado para grupos atuais de nós de locatário individual: no estágio de visualização, não é possível ativar grupos de nós de locatário individual atuais para controle de manutenção avançado. Se você quiser executar as cargas de trabalho atuais em grupos de nós de locatário individual com o controle de manutenção avançado ativado, primeiro crie um novo grupo de nós com esse controle ativado e migre a carga de trabalho para esse grupo. de dois minutos. Da mesma forma, para desativar o controle de manutenção avançado, é preciso migrar seus nós de locatário individual para grupos de nós de locatário individual que não tenham o controle de manutenção avançado ativado.
  • Impacto nas políticas de manutenção atuais: quando você ativa esse recurso, ele substitui todas as janelas de manutenção atuais associadas aos nós de locatário individual.

Custos

Não há custo extra para usar o controle de manutenção avançado em nós de locatário individual.

Antes de começar

  • Antes de provisionar VMs em um nó de locatário individual, verifique sua cota. Dependendo do número e do tamanho dos nós reservados, talvez seja necessário solicitar um aumento de cota.
  • Configure a autenticação, caso ainda não tenha feito isso. A autenticação é o processo de verificação da sua identidade para acesso a serviços e APIs do Google Cloud. Para executar códigos ou amostras de um ambiente de desenvolvimento local, autentique-se no Compute Engine da seguinte maneira.

    Selecione a guia para como planeja usar as amostras nesta página:

    Console

    Quando você usa o console do Google Cloud para acessar os serviços e as APIs do Google Cloud, não é necessário configurar a autenticação.

    gcloud

    1. Instale a Google Cloud CLI e inicialize-a executando o seguinte comando:

      gcloud init
    2. Defina uma região e uma zona padrão.

    REST

    Para usar as amostras da API REST nesta página em um ambiente de desenvolvimento local, use as credenciais fornecidas para a CLI gcloud.

      Instale a Google Cloud CLI e inicialize-a executando o seguinte comando:

      gcloud init

Ativar o controle de manutenção avançado em um nó de locatário individual

O controle de manutenção avançado para locatário individual é um recurso opcional durante a fase de prévia. Esse recurso está disponível apenas para grupos de nós de locatário individual. Para usar esse recurso com suas VMs ou cargas de trabalho de locatário individual, primeiro você precisa migrá-las para grupos de nós de locatário individual com o controle de manutenção avançado ativado.

Console

É possível ativar o controle de manutenção avançado ao criar um grupo de nós selecionando a opção Ativar a manutenção avançada de locatário individual em Definir configurações de manutenção. Para mais informações, consulte Criar um grupo de nós de locatário individual.

gcloud

Para criar uma VM em um grupo de nós de locatário individual, use o comando gcloud beta compute sole-tenancy node-groups create.

A flag --maintenance-interval=RECURRENT no comando a seguir especifica que o nó de locatário individual está ativado para o controle de manutenção avançado.

gcloud compute sole-tenancy node-groups create NODE_GROUP_NAME \
--node-template=NODE_TEMPLATE_NAME \
--zone=NODE_GROUP_ZONE \
--target-size=NODE_GROUP_SIZE \
--maintenance-interval=RECURRENT

Substitua:

  • NODE_GROUP_NAME: o nome do grupo de nós.

  • NODE_TEMPLATE_NAME: o nome do modelo de nó a ser usado para criar esse grupo;

  • NODE_GROUP_SIZE: o número de nós a serem criados no grupo;

  • NODE_GROUP_ZONE: a zona em que o grupo de nós será criado. Precisa ser a mesma região do modelo de nó em que você está baseando o grupo de nós.

REST

Para criar um grupo de nós de locatário individual com base em um modelo de nó criado anteriormente, use o método nodeGroups.insert.

O parâmetro maintenanceInterval no comando a seguir especifica que o nó de locatário individual está ativado para o controle de manutenção avançado.

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/NODE_GROUP_ZONE/nodeGroups
{
"name": "NODE_GROUP_NAME",
"nodeTemplate": "NODE_TEMPLATE_URL",
"zone": "NODE_GROUP_ZONE",
"size": "NODE_GROUP_SIZE",
"maintenanceInterval": "RECURRENT"
}

Substitua:

  • PROJECT_ID: o nome do projeto em que o grupo de nós existe.

  • NODE_GROUP_ZONE: a zona do grupo de nós.

  • NODE_GROUP_NAME: o nome do grupo de nós.

  • NODE_TEMPLATE_URL: o URL do modelo de nó a ser usado para criar esse grupo.

  • NODE_GROUP_SIZE: o número de nós a serem criados no grupo;

A flag no nível do nó substitui todas as flags de VM atribuídas anteriormente. Portanto, ativar o controle de manutenção avançado substitui todas as flags de manutenção anterior.

Conferir se há manutenções futuras

A manutenção de um nó de locatário individual acontece no máximo a cada 28 dias. Você poderá verificar o evento de manutenção de um nó 28 dias antes do início da janela de manutenção de 24 horas, em que a manutenção está programada para acontecer nesse nó.

Console

Depois de ativar um grupo de nós de locatário individual para controle de manutenção avançado, você verá os próximos eventos de manutenção da seguinte maneira:

  1. No Console do Google Cloud, acesse a página Nós de locatário individual.

    Acesse Nós de locatário individual

  2. Clique em Grupos de nós para ver uma lista de grupos de nós de locatário individual.

  3. Para qualquer grupo de nós de locatário individual, veja as colunas Status de manutenção e Tempo de manutenção na tabela para manutenção futura. Como a manutenção é definida no nível do nó, as informações de manutenção mostradas aqui são a próxima manutenção programada para qualquer um dos nós dentro do grupo de nós.

  4. Para ver informações de manutenção de cada nó em um grupo de nós de locatário individual, clique no Nome do grupo de nós para abrir a página de detalhes. Para cada nó no grupo de nós, as colunas Status da manutenção e Tempo de manutenção na tabela exibem as informações de manutenção futura.

gcloud

Para listar os nós de um grupo de nós de locatário individual com as informações de manutenção, use o comando gcloud beta compute sole-tenancy node-groups list-nodes.

gcloud compute sole-tenancy node-groups list-nodes NODE_GROUP_NAME \
--format "table(name, status, node_type, instances, server_id, upcoming_maintenance)"

Substitua NODE_GROUP_NAME pelo nome do grupo do nó.

REST

Para listar os nós de um grupo de nós de locatário individual com as informações de manutenção, use o método nodeGroups.listNodes.

POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/NODE_GROUP_ZONE/nodeGroups/NODE_GROUP_ID/listNodes

Substitua:

  • PROJECT_ID: o nome do projeto em que o grupo de nós existe.

  • NODE_GROUP_ZONE: a zona do grupo de nós.

  • NODE_GROUP_ID: o ID do grupo de nós.

Esta é a resposta do método nodeGroups.listNodes:

{
  …
  "items": [
    …
    {
      "name": string,
      "status": string,
      …
      "upcomingMaintenance": {
        "canReschedule": boolean,
        "maintenanceType": enum, // SCHEDULED | UNSCHEDULED
        "windowStartTime": string, // RFC 3339 timestamp string
        "windowEndTime": string, // RFC 3339 timestamp string
        "latestWindowStartTime": string, // RFC 3339 timestamp string
        "maintenanceStatus": enum // PENDING | ONGOING
      },
      …
    },
    …
  ],
  …
}

Veja a seguir os detalhes do evento de manutenção do grupo de nós:

Nome do parâmetro Descrição
windowStartTime Horário de início da janela de manutenção.
windowEndTime Horário de término da janela de manutenção.
latestWindowStartTime Horário de início da janela de manutenção inicial. É possível acionar a manutenção imediatamente ou programá-la para uma data e hora posterior somente antes do latestWindowStartTime.
maintenanceType O tipo de manutenção que será realizada:
- Programada: a manutenção está programada para este nó.
- Não programada: a manutenção representa atualizações críticas com muito menos avisos.
canReschedule Se a manutenção pode ser reprogramada.
maintenanceStatus Status da operação de manutenção atual:
- Pendente: a operação de manutenção ainda não foi iniciada, mas está programada.
- Em andamento: a janela de manutenção foi iniciada.

Se não vir nenhum evento de manutenção, isso significa que não há manutenção futura para nenhum nó no grupo de nós.

Acione a manutenção imediatamente ou programe a manutenção de um nó

Depois de saber quais nós em um grupo de nós de locatário individual estão programados para manutenção, você pode executar um dos seguintes procedimentos:

  • Acione a manutenção imediatamente. Se você optar por acionar a manutenção imediatamente, ela ocorrerá dentro de 24 horas a partir do momento em que a solicitação for acionada.

  • Programe a manutenção para mais tarde com base nos seus requisitos.

Se você não acionar a manutenção imediatamente ou programá-la para uma data e hora posterior, a manutenção ocorrerá dentro da janela de manutenção inicial. Depois que a manutenção de um nó for iniciada, não será possível pausá-la ou reprogramá-la.

Console

Para acionar a manutenção de um nó imediatamente, faça o seguinte:

  1. No Console do Google Cloud, acesse a página Nós de locatário individual.

    Acesse "nós de locatário individual"

  2. Clique em Grupos de nós.

  3. Clique no nome do grupo de nós para abrir a página de detalhes.

  4. Selecione o nó em que você quer acionar a manutenção imediatamente e clique em Iniciar agora.

Você verá uma mensagem de confirmação e a manutenção ocorrerá dentro de 24 horas a partir do momento em que você acionar a solicitação.

Para programar a manutenção de um nó, faça o seguinte:

  1. No Console do Google Cloud, acesse a página Nós de locatário individual.

    Acesse Nós de locatário individual

  2. Clique em Grupos de nós para ver uma lista de grupos de nós de locatário individual.

  3. Clique no Nome do grupo de nós para abrir a página de detalhes.

  4. Selecione o nó para que você quer programar a manutenção e clique em Programar manutenção.

  5. No painel Programar manutenção exibido, selecione uma data e hora de sua escolha. É possível programar a manutenção de um nó a qualquer momento antes do horário de início da janela de manutenção inicial.

Você verá uma mensagem de confirmação, e a manutenção ocorrerá dentro de 24 horas a partir do momento do acionamento da solicitação.

gcloud

Use o comando gcloud beta compute sole-tenancy node-groups perform-maintenance para iniciar ou programar a manutenção de um nó de locatário individual:

gcloud beta compute sole-tenancy node-groups perform-maintenance NODE_GROUP_NAME \
--zone=NODE_GROUP_ZONE \
--nodes=NODE_NAMES \
--window-start-time=WINDOW_START_TIME

Substitua:

  • NODE_GROUP_NAME: o nome do grupo de nós.

  • NODE_GROUP_ZONE: a zona do grupo de nós.

  • NODE_NAMES: o nome do nó em que você quer realizar a manutenção.

  • WINDOW_START_TIME: data e hora de início da manutenção. Se você quiser que a manutenção comece o mais rápido possível, omita essa flag.

REST

Use o método nodeGroups.performMaintenance para iniciar ou programar a manutenção de um nó de locatário individual:

POST
https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/NODE_GROUP_ZONE/nodeGroups/NODE_GROUP_ID/performMaintenance
{
"nodes": "NODE_NAMES" // [Required] The user needs to list at least 1 node
"windowStartTime":  "WINDOW_START_TIME" // [Optional] RFC 3339 timestamp string
}

Substitua:

  • PROJECT_ID: o nome do projeto em que o grupo de nós existe.

  • NODE_GROUP_ZONE: a zona do grupo de nós.

  • NODE_GROUP_ID: o ID do grupo de nós.

  • NODE_NAMES: o nome do nó em que você quer realizar a manutenção.

  • WINDOW_START_TIME: data e hora de início da manutenção. Omita esse campo se você quiser que a manutenção comece o mais rápido possível.

O campo Status de manutenção de um nó mostra o seguinte status durante o processo de manutenção:

  • Pendente: a operação de manutenção ainda não foi iniciada, mas está programada.
  • Em andamento: a janela de manutenção foi iniciada. O evento de manutenção permanece Em andamento até que a manutenção do nó seja concluída.

Verificar se a manutenção foi concluída

Para consultar o status de manutenção de um nó, use o comando gcloud beta compute sole-tenancy node-groups list-nodes ou o método nodeGroups.listNodes. Para mais informações, consulte Verificar o status de manutenção.

  • A manutenção é bem-sucedida: se a manutenção de um nó de locatário individual for bem-sucedida, a notificação de manutenção será removida. Quando você consulta o nome do grupo de nós, a seção upcomingMaintenance não está mais presente no nó. É possível ver um log de eventos do sistema no Cloud Logging.
  • A manutenção falhou: se a manutenção não for concluída no período de 24 horas, o evento de manutenção permanecerá como Em andamento até que a manutenção seja concluída com êxito para o nó. Após a conclusão, a notificação de manutenção é removida.

Às vezes, a solicitação de gatilho de manutenção para a data e a hora de sua escolha poderá ser rejeitada se os limites internos do Google Cloud no controle de manutenção avançado para nós de locatário individual tiverem excedido a data e a hora especificadas. Nesse caso, é preciso selecionar outra data e hora para a manutenção do nó. O status de manutenção deste nó é Em andamento e permanece assim até que a manutenção seja concluída.

Alterar a data e a hora da manutenção programada

É possível modificar a data e a hora da manutenção programada de um nó de locatário individual usando o mesmo procedimento usado para acionar ou programar a manutenção de um nó.