Nós de reparação automática

Veja nesta página como configurar o reparo automático do nó no Google Kubernetes Engine.

Visão geral

O recurso de reparo automático do nó do GKE ajuda a manter a integridade e execução dos nós do cluster. Quando ativado, o GKE faz verificações periódicas no estado de integridade de cada nó no cluster. Se um nó falhar em verificações de integridade consecutivas durante um período prolongado, o GKE iniciará um processo de reparo para esse nó.

Critérios de reparo

O GKE usa o status de saúde do nó para determinar se um nó precisa ser reparado. Um nó com status Ready é considerado íntegro. O GKE acionará uma ação de reparo se um nó enviar relatórios de status não íntegro consecutivos por um determinado período. Um status não íntegro pode significar que:

  • um status NotReady foi apresentado consecutivamente nas verificações de um nó por um determinado período (aproximadamente 10 minutos);
  • um nó não apresenta status algum durante um determinado período (aproximadamente 10 minutos);
  • o disco de inicialização do nó não tem mais espaço por um período prolongado (aproximadamente 30 minutos).

Processo de reparo de nós

Se o GKE detectar que um nó requer reparo, o nó será esvaziado e recriado. O esvaziamento poderá não ser bem-sucedido se o nó não responder ou estiver em estado não íntegro a ponto de não processar o comando de esvaziamento.

Se vários nós precisarem de reparo, o GKE poderá repará-los em paralelo. O GKE limita o número de reparos dependendo do tamanho do cluster (clusters maiores têm um limite maior) e do número de nós quebrados no cluster (o limite diminuirá se muitos nós estiverem quebrados). Se o reparo automático de nós for desativado durante o processo, os reparos em andamento não serão cancelados. Eles ainda serão concluídos para cada nó que estiver em reparo.

O GKE gera uma entrada nos seus registros de operação para qualquer evento de reparo automatizado. Para verificar os registros, use o comando gcloud container operations list.

Como ativar o reparo automático de nós

O reparo automático de nós é ativado por pool de nós. Quando um cluster é criado, o reparo automático do pool de nós padrão dele pode ser ativado ou desativado. Ao criar mais pools de nós, é possível fazer o mesmo para eles, seja qual for a configuração de reparo automático feita no pool padrão.

gcloud

Para criar um cluster ou pool de nós com o reparo automático ativado, especifique a opção --enable-autorepair usando a ferramenta de linha de comando gcloud.

Para criar um cluster com reparo automático ativado, execute o comando abaixo:

gcloud container clusters create [CLUSTER_NAME] --zone [COMPUTE_ZONE] \
--enable-autorepair

Para criar um pool de nós com reparo automático ativado:

gcloud container node-pools create [POOL_NAME] --cluster [CLUSTER_NAME] \
--zone [COMPUTE_ZONE] --enable-autorepair

Para ativar o reparo automático para um pool de nós existente:

gcloud container node-pools update [POOL_NAME] --cluster [CLUSTER_NAME] \
--zone [COMPUTE_ZONE] --enable-autorepair

Console

Para criar um cluster em que o pool de nós padrão tenha o reparo automático de nós ativado, siga as etapas a seguir:

  1. Acesse o menu do Google Kubernetes Engine no console do GCP.

    Acessar o menu do Google Kubernetes Engine

  2. Clique em Criar cluster.

  3. Escolha Cluster padrão ou um modelo apropriado para sua carga de trabalho.

  4. Configure o cluster como quiser.

  5. Clique em Edição avançada. Selecione Ativar reparo automático.

  6. Clique em Criar.

Para criar um pool de nós com o reparo automático de nós ativado:

  1. Acesse o menu do Google Kubernetes Engine no console do GCP.

    Acessar o menu do Google Kubernetes Engine

  2. Clique no botão "Editar" do cluster, que se parece com um lápis.

  3. No menu Pools de nós, clique em Adicionar pool de nós.

  4. Configure seu pool de nós como quiser. Em seguida, clique em Edição avançada para o pool de nós.

  5. Selecione Ativar reparo automático.

  6. Clique em Salvar para salvar a configuração do pool de nós.

  7. Clique em Salvar novamente para modificar o cluster.

Para ativar o reparo automático de nós em um pool de nós existente:

  1. Acesse o menu do Google Kubernetes Engine no console do GCP.

    Acessar o menu do Google Kubernetes Engine

  2. Clique no botão de edição do cluster, que tem a forma de um lápis.

  3. No menu Pool de nós, clique em Edição avançada para o pool de nós que quiser modificar.

  4. Selecione Ativar reparo automático.

  5. Clique em Salvar para salvar a configuração do pool de nós.

  6. Clique em Salvar novamente para modificar o cluster.

Como desativar o reparo automático de nós

gcloud

Para desativar o reparo automático em um determinado pool de nós, execute o comando a seguir:

gcloud container node-pools update [POOL_NAME] --cluster [CLUSTER_NAME] \
--zone [COMPUTE_ZONE] --no-enable-autorepair

Console

Para desativar o reparo automático de nós em um pool de nós existente, siga as etapas a seguir:

  1. Acesse o menu do Google Kubernetes Engine no console do GCP.

    Acessar o menu do Google Kubernetes Engine

  2. Clique no botão de edição do cluster, que tem a forma de um lápis.

  3. No menu Pool de nós, clique em Edição avançada para o pool de nós que quiser modificar.

  4. Desmarque Ativar reparo automático.

  5. Clique em Salvar para salvar a configuração do pool de nós.

  6. Clique em Salvar novamente para modificar o cluster.

Próximas etapas

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação do Kubernetes Engine