Nós de reparo automático

Nesta página, mostramos como configurar o reparo automático de nós no Google Kubernetes Engine (GKE).

Visão geral

O recurso de reparo automático de nó do GKE ajuda a manter a integridade e execução dos nós do cluster. Quando ativado, o GKE verifica periodicamente o estado de integridade de cada nó no cluster. Se um nó falhar em verificações de integridade consecutivas durante um período prolongado, o GKE iniciará um processo de reparo para esse nó.

Critérios de reparo

O GKE usa o status de integridade para determinar se um nó precisa ser reparado. Se um nó gerar um relatório com um status Ready, ele será considerado íntegro. O GKE acionará uma ação de reparo se um nó gerar relatórios consecutivos de status não íntegro por um determinado período. Um status não íntegro pode significar que:

  • um nó apresenta um status NotReady em verificações consecutivas por um determinado período (aproximadamente 10 minutos);
  • um nó não apresenta status algum durante um determinado período (aproximadamente 10 minutos);
  • o disco de inicialização do nó não tem mais espaço por um período prolongado (aproximadamente 30 minutos).

Processo de reparo de nós

Se o GKE detectar que um nó requer reparo, o nó será diminuído e recriado. O GKE aguarda uma hora para que a diminuição seja concluída. Se a diminuição não for concluída, o nó será encerrado e um novo nó será criado.

Se vários nós precisarem de conserto, o GKE poderá consertar nós em paralelo. O GKE equilibra o número de reparos, dependendo do tamanho do cluster e do número de nós corrompidos. O GKE consertará mais nós em paralelo em um cluster maior, mas menos nós à medida que o número de nós não íntegros aumentar.

Se você desativar o reparo automático de nós a qualquer momento durante o processo de reparo, os reparos em andamento não serão cancelados e continuarão em qualquer nó atualmente em reparo.

Histórico de reparo de nós

O GKE gera uma entrada de registro para eventos de reparo automatizados. Use o comando gcloud container operations list para verificar esses registros.

Como ativar o reparo automático de nós

O reparo automático de nós é ativado por pool de nós. Quando um cluster é criado, o reparo automático do pool de nós padrão dele pode ser ativado ou desativado. Ao criar mais pools de nós, é possível fazer o mesmo para eles, seja qual for a configuração de reparo automático feita no pool padrão.

É possível criar um cluster ou pool de nós com o reparo automático de nós ativado, Basta usar a ferramenta gcloud ou o Console do Google Cloud.

Como criar um cluster com o reparo automático de nós ativado

gcloud

gcloud container clusters create cluster-name --zone compute-zone \
  --enable-autorepair

Console

  1. Acesse o menu do Google Kubernetes Engine no Console do Cloud.

    Acessar o menu do Google Kubernetes Engine

  2. Clique no botão Criar cluster.

  3. Configure o cluster como quiser.

  4. No painel de navegação, no pool de nós que você quer modificar, clique em Nós.

  5. Selecione a caixa de seleção Ativar conserto automático.

  6. Clique em Criar.

Como criar um pool de nós com reparo automático ativado

gcloud

gcloud container node-pools create pool-name --cluster cluster-name \
  --zone compute-zone \
  --enable-autorepair

Console

  1. Acesse o menu do Google Kubernetes Engine no Console do Cloud.

    Acessar o menu do Google Kubernetes Engine

  2. Clique no botão "Editar" do cluster, que se parece com um lápis.

  3. No menu Pools de nós, clique em Adicionar pool de nós.

  4. Configure seu pool de nós como quiser. Em seguida, clique em Mais opções para o pool de nós.

  5. Selecione Ativar reparo automático.

  6. Clique em Salvar para salvar a configuração do pool de nós.

  7. Clique em Salvar novamente para modificar o cluster.

Como ativar o reparo automático em um pool de nós atual

gcloud

gcloud container node-pools update pool-name --cluster cluster-name \
  --zone compute-zone \
  --enable-autorepair

Console

  1. Acesse o menu do Google Kubernetes Engine no Console do Cloud.

    Acessar o menu do Google Kubernetes Engine

  2. Clique no botão de edição do cluster, que tem a forma de um lápis.

  3. No menu Pools de nós, clique em Mais opções para o pool de nós que você quer modificar.

  4. Selecione Ativar reparo automático.

  5. Clique em Salvar para salvar a configuração do pool de nós.

  6. Clique em Salvar novamente para modificar o cluster.

Como desativar o reparo automático de nós

É possível desativar o reparo automático de nós para um pool de nós atual usando o gcloud ou o Console do Google Cloud.

gcloud

gcloud container node-pools update pool-name --cluster cluster-name \
  --zone compute-zone \
  --no-enable-autorepair

Console

  1. Acesse o menu do Google Kubernetes Engine no Console do Cloud.

    Acessar o menu do Google Kubernetes Engine

  2. Clique no botão de edição do cluster, que tem a forma de um lápis.

  3. No menu Pools de nós, clique em Mais opções para o pool de nós que você quer modificar.

  4. Desmarque Ativar reparo automático.

  5. Clique em Salvar para salvar a configuração do pool de nós.

  6. Clique em Salvar novamente para modificar o cluster.

A seguir