Visão geral da administração do cluster


Esta página oferece uma visão geral rápida do gerenciamento de clusters do GKE para administradores.

Se você é um desenvolvedor que executa cargas de trabalho no GKE, talvez não precise realizar a maioria dessas tarefas. Para uma introdução à implantação de cargas de trabalho no GKE, consulte Implantação de cargas de trabalho.

Antes de ler esta página, você precisa conhecer os seguintes conceitos e conceitos básicos do Kubernetes:

Quais ferramentas eu uso?

Como administrador, você usa várias ferramentas para trabalhar com clusters do GKE.

  • Para controlar a configuração e as características gerais de um cluster, use ferramentas e APIsGoogle Cloud , incluindo a Google Cloud CLI e o console do Google Cloud. Essas tarefas incluem criar, atualizar, visualizar e excluir clusters e controlar quem pode acessar o cluster usando o Identity and Access Management (IAM). Você também pode usar outras ferramentas e serviços Google Cloud , como serviços de observabilidade para monitoramento, geração de registros e envio de alertas.

  • Para controlar o comportamento interno de um cluster, use a API Kubernetes e a interface de linha de comando kubectl. As tarefas em que você pode precisar usar kubectl incluem a implantação de cargas de trabalho, a aplicação de políticas de controle de acesso baseado em papéis (RBAC, na sigla em inglês) do Kubernetes e a especificação de regras de política de rede do Kubernetes. Leia mais sobre como configurar o kubectl para uso com clusters do GKE em Instalar o kubectl e configurar o acesso ao cluster.

  • Para provisionar clusters e cargas de trabalho de forma declarativa, use o Terraform. Saiba mais sobre como usar o Terraform com o GKE em Provisionar recursos do GKE com o Terraform.

Administração básica do cluster

As tarefas básicas de administração de clusters incluem a configuração de clusters, upgrades de clusters e configuração de nós. Se você usar o modo Autopilot padrão para seus clusters (recomendado), o GKE vai processar a maior parte disso para você: os upgrades de cluster e a configuração de nó são gerenciados pelo GKE. Se você usa o modo padrão, apenas os upgrades são gerenciados pelo GKE, e você precisa configurar os nós. Leia mais sobre quando você pode precisar escolher o modo padrão para clusters em Modos de operação do GKE.

As tarefas básicas de administração de cluster são específicas dos clusters do GKE no Google Cloud e normalmente não envolvem o próprio sistema do Kubernetes. Execute essas tarefas inteiramente usando o console do Google Cloud, a CLI do Google Cloud, a API do GKE ou o provedor Google Cloud do Terraform.

Como conferir clusters

É possível conferir informações básicas sobre seus clusters no console do Google Cloud e usando a CLI do Google Cloud ou a API GKE. Isso inclui se um cluster está em execução e a configuração atual dele, além de listar todos os clusters. Para mais detalhes, consulte Gerenciar clusters.

Para informações mais detalhadas sobre o estado e a integridade do cluster, use as ferramentas e os recursos de observabilidade.

Upgrades de nós e clusters

Por padrão, os clusters e os nós são atualizados automaticamente. Saiba mais sobre como configurar como os upgrades funcionam em cada cluster, incluindo quando eles podem ou não ocorrer.

Configuração no nível do cluster

As tarefas de configuração no nível de cluster incluem a criação e exclusão de clusters e nós do GKE. Também é possível atualizar algumas configurações do cluster, como quando as tarefas de manutenção do cluster podem ocorrer.

Saiba mais sobre a configuração de clusters na Visão geral da configuração de clusters.

Configuração de nós

Se você usa o Autopilot para seus clusters, não precisa se preocupar com a configuração de nós, porque o GKE configura os nós para você. Os nós do cluster do Autopilot são totalmente gerenciados pelo GKE e todos usam o mesmo sistema operacional de nó (SO), cos_containerd.

No entanto, se você precisar usar o modo padrão para qualquer cluster, o GKE oferece diversas opções para os nós do cluster. Por exemplo, você pode criar um ou mais pools de nós, que são grupos de nós no cluster que compartilham uma configuração em comum. O cluster precisa ter pelo menos um pool de nós. Além disso, quando você cria o cluster, um pool de nós chamado default é criado por padrão. Leia mais sobre o gerenciamento de pools de nós no GKE em Adicionar e gerenciar pools de nós.

Outras opções de configuração de nós para clusters padrão incluem a escolha de um SO que não seja padrão, o uso de VMs spot efeméras e a escolha de uma plataforma de CPU mínima para novos nós. Os usuários do Autopilot também podem especificar uma plataforma de CPU mínima para cargas de trabalho com uso intensivo de computação, mas apenas no escopo da carga de trabalho.

Mesmo com clusters padrão, não é possível mudar as regras iptables ou outras configurações no nível do nó gerenciadas pelo GKE. O nó pode ficar inacessível ou ser acidentalmente exposto quando as alterações manuais reverterem para a configuração declarativa do cluster.

Como configurar redes de cluster

Um aspecto importante da administração de clusters é ativar e controlar vários recursos de rede para o cluster, como opções de endereço IP para clusters padrão, se os nós do cluster podem ser acessados de redes públicas (os nós que não podem ser acessados de redes públicas são conhecidos como nós particulares) e políticas de acesso à rede.

Muitos recursos de rede são definidos durante a criação do cluster e muitos deles não podem ser alterados sem recriar o cluster. Quando você cria um cluster usando uma interfaceGoogle Cloud , ative os recursos de rede que quer usar. Devido a esse comportamento, se você não for um administrador de rede, talvez precise trabalhar em conjunto com os administradores de rede ao configurar clusters prontos para produção.

Alguns recursos de rede que podem ser ativados com ferramentas Google Cloud , como a aplicação de políticas de rede, também exigem mais configurações usando APIs do Kubernetes.

Saiba mais sobre a rede do GKE em Visão geral da rede.

Observabilidade do cluster

Outra parte importante da administração de clusters é configurar e usar ferramentas de observabilidade para entender a integridade da sua infraestrutura e dos seus aplicativos e manter a disponibilidade e a confiabilidade deles. Por padrão, os clusters do GKE são configurados para fazer o seguinte:

O GKE também oferece recursos de observabilidade que ajudam a usar os dados coletados, incluindo painéis padrão e personalizados, alertas, monitoramento de objetivos de nível de serviço (SLO) e análise de registros.

Saiba mais sobre como configurar e usar a observabilidade do GKE em Observabilidade do GKE.

Como configurar a segurança do cluster

O GKE inclui recursos de segurança específicos do Google Cloude do Kubernetes que podem ser usados com seu cluster. É possível gerenciar a segurança no nível doGoogle Cloud, como o IAM, usando o console do Google Cloud. Gerencie os recursos de segurança dentro do cluster, como o controle de acesso baseado em função (RBAC, na sigla em inglês) do Kubernetes, usando as APIs do Kubernetes e outras interfaces.

Para saber mais sobre os recursos de segurança disponíveis no GKE, consulte a Visão geral de segurança e Aumentar a segurança do cluster. Os clusters do GKE Autopilot implementam muitos desses recursos de segurança as práticas recomendadas para aumentá-la automaticamente. Para mais informações, consulte Recursos de segurança no GKE Autopilot.

Otimizar os custos

As ferramentas do GKE permitem que você confira os custos do cluster e tenha certeza de que está usando os recursos Google Cloud pagos da maneira mais eficiente. É possível conferir as métricas de uso da CPU, da memória e do disco em diferentes períodos e usar essas métricas para otimizar o uso de recursos, por exemplo, se você tiver clusters subutilizados ou superutilizados que precisem ser redimensionados. Também é possível usar o escalonamento automático para reduzir o tamanho do cluster durante os horários de pico e usar insights e recomendações para identificar clusters inativos, além de outras práticas recomendadas.

Se você estiver usando o GKE Enterprise, também poderá conferir métricas para otimizar custos em toda a frota e em equipes individuais.

Como configurar a recuperação de desastres

Para garantir que suas cargas de trabalho de produção permaneçam disponíveis no caso de um evento de interrupção de serviço, prepare um plano de recuperação de desastres (DR). Para saber mais sobre o planejamento de DR, consulte o guia de planejamento de recuperação de desastres.

A configuração do Kubernetes e os volumes permanentes não serão armazenados em backup, a menos que você execute uma ação explícita. Para fazer backup e restaurar a configuração do Kubernetes e os volumes permanentes nos clusters do GKE, use o Backup para GKE.

A seguir