Janelas e exclusões de manutenção

Nesta página, você lerá sobre janelas de manutenção e exclusões de manutenção. Com elas, é possível controlar o momento em que a manutenção do cluster, como os upgrades automáticos, pode ou não ocorrer nos clusters do Google Kubernetes Engine. Por exemplo, uma empresa de varejo pode limitar a manutenção para ocorrer apenas à noite durante a semana e impedir a manutenção automatizada durante um importante evento de vendas do setor.

Visão geral

As janelas e exclusões de manutenção agora permitem o controle detalhado sobre o momento em que a manutenção automática pode ocorrer nos clusters.

Uma janela de manutenção é um período arbitrário e repetitivo em que a manutenção automática é permitida.

Uma exclusão de manutenção é uma janela de tempo arbitrária e não repetitiva em que a manutenção automática é proibida. Um cluster pode ter até três exclusões de manutenção por vez.

As janelas e exclusões de manutenção podem ser configuradas de forma separada e independente. É possível configurar várias exclusões de manutenção.

Exemplos de manutenção automática

O Google realiza tarefas de manutenção nos clusters conforme necessário ou quando você faz uma alteração de configuração que recria nós ou redes no cluster. Por exemplo:

Alguns desses tipos de manutenção, como upgrades de cluster e de nós, podem ser difíceis de prever e planejar. Um cluster zonal não pode ser modificado enquanto seu plano de controle é atualizado, incluindo a implantação de cargas de trabalho. Cada um dos outros tipos de alterações listados acima pode causar interrupções temporárias enquanto move as cargas de trabalho de cada nó durante a recriação.

Janelas de manutenção

Com as janelas de manutenção, é possível controlar o momento em que as atualizações automáticas de planos de controle e nós podem ocorrer para reduzir as possíveis interrupções temporárias nas cargas de trabalho. As janelas de manutenção são úteis para os seguintes tipos de cenários, entre outros:

  • Fora dos horários de pico: minimize a chance de inatividade programando os upgrades automáticos fora dos horários de pico, quando o tráfego é reduzido.
  • Em serviço: garanta que os upgrades aconteçam durante as horas de trabalho para que alguém possa monitorá-los e gerenciar problemas imprevistos.
  • Upgrades de vários clusters: implemente upgrades em vários clusters em diferentes regiões, uma de cada vez, em intervalos especificados.

Além dos upgrades automáticos, é possível que o Google precise realizar outras tarefas de manutenção de vez em quando. Se possível, ele respeita a janela de manutenção de um cluster.

Se as tarefas forem executadas fora da janela de manutenção, o GKE tentará pausar a operação e retomá-la durante a próxima janela de manutenção.

O GKE se reserva o direito de lançar upgrades de emergência não planejados fora das janelas de manutenção. Além disso, os upgrades obrigatórios de software obsoleto ou desatualizado podem ocorrer automaticamente fora das janelas de manutenção.

É possível configurar uma janela de manutenção para um cluster novo ou atual.

Advertências para janelas de manutenção

Janelas e exclusões de manutenção podem causar atrasos nos patches de segurança. O GKE se reserva o direito de ignorar as políticas de manutenção por vulnerabilidades críticas de segurança. Antes de ativar as janelas de manutenção, entenda os seguintes alertas.

Outras manutenções do Google Cloud

Clusters e cargas de trabalho do GKE também podem ser afetados pela manutenção automática em outros serviços dependentes, como o Compute Engine. As janelas e exclusões de manutenção não afetam a manutenção automática em outros serviços.

Reparos e redimensionamentos automatizados

O GKE executa reparos automáticos nos planos de controle. Isso inclui processos como o aumento do plano de controle para um tamanho apropriado ou a reinicialização do plano de controle para resolver problemas. A maioria dos reparos ignora as janelas e exclusões de manutenção porque a não realização dos reparos pode resultar em clusters inoperantes. O reparo de planos de controle não pode ser desativado.

Os nós também têm a funcionalidade de reparo automático, mas pode ser desativada.

Janelas de manutenção e recriação de nós

Ao ativar ou modificar recursos ou opções, como os que afetam a rede entre os planos de controle e os nós, os nós são recriados para aplicar a nova configuração. Alguns exemplos de atributos que fazem com que os nós sejam recriados são estes:

Se você usar janelas de manutenção e ativar ou modificar um atributo ou opção que exija a recriação de nós, a nova configuração será aplicada a eles somente durante uma janela de manutenção. Caso prefira não esperar, atualize o pool de nós manualmente para a mesma versão que está sendo usada. Para isso, basta definir a sinalização --cluster-version como a mesma versão do GKE em execução nos nós. Se você escolher essa solução alternativa, use o comando gcloud.

Uma janela de manutenção por cluster

Só é possível configurar uma única janela de manutenção por cluster. A configuração de uma nova janela de manutenção substitui a anterior.

Fusos horários para janelas de manutenção

Ao configurar e visualizar janelas de manutenção, os horários são mostrados de maneira diferente, dependendo da ferramenta usada:

Ao configurar janelas de manutenção

Quando você configura janelas de manutenção usando a sinalização --maintenance-window anterior, não pode especificar um fuso horário. O UTC é usado com o comando gcloud ou com a API, e o Console do Google Cloud exibe os horários de acordo com o fuso horário local.

Ao usar as sinalizações mais detalhadas, como --maintenance-window-start, é possível especificar o fuso horário como parte do valor. Se você omitir o fuso horário, o fuso horário local será usado. Os horários são sempre armazenados em UTC.

Ao visualizar janelas de manutenção

Ao visualizar informações sobre o cluster, os carimbos de data/hora das janelas de manutenção podem ser exibidos em UTC ou no fuso horário local, dependendo de como você estiver visualizando as informações:

  • Ao usar o Console do Google Cloud para ver informações sobre o cluster, os horários são sempre exibidos no fuso horário local.
  • Ao usar gcloud para visualizar informações sobre o cluster, os horários são sempre exibidos em UTC.

Exclusões de manutenção

Com as exclusões de manutenção, é possível impedir a manutenção automática durante um período específico. Por exemplo, muitas empresas de varejo têm diretrizes comerciais que proíbem alterações de infraestrutura durante as festas de final de ano.

É possível adicionar, no máximo, três exclusões. É preciso permitir que o Google tenha tempo suficiente para ordenar os clusters de modo que eles permaneçam em uma configuração compatível.

As exclusões não têm recorrência. Em vez disso, crie cada instância de uma exclusão periódica separadamente.

É possível configurar uma exclusão de manutenção para um cluster novo ou atual.

A seguir