Visão geral da administração do cluster

Autopilot Padrão

No Google Kubernetes Engine (GKE), você define a configuração e as características de um cluster usando as ferramentas e APIs do Google Cloud, incluindo a Google Cloud CLI e o console do Google Cloud. Essas tarefas incluem criar, atualizar e excluir clusters, adicionar ou remover nós e controlar quem pode acessar o cluster usando o Identity and Access Management (IAM).

Para controlar o comportamento interno do cluster, use a API Kubernetes e a interface de linha de comando kubectl. Também é possível configurar muitos aspectos do comportamento de um cluster usando o console do Google Cloud.

Administração básica do cluster

As tarefas básicas de administração de cluster são específicas dos clusters do GKE no Google Cloud e normalmente não envolvem o próprio sistema do Kubernetes. Execute essas tarefas inteiramente usando o Console do Google Cloud, a Google Cloud CLI ou a API do GKE.

Upgrades de nós e clusters

Por padrão, os clusters e os pools de nós são atualizados automaticamente. Saiba mais sobre como configurar como os upgrades funcionam em cada cluster, inclusive quando eles podem ou não ocorrer.

Configuração no nível do cluster

As tarefas de configuração no nível de cluster incluem a criação e exclusão de clusters e nós do GKE. É possível controlar quando as tarefas de manutenção do cluster podem ocorrer e configurar o escalonamento automático no nível do cluster.

Configuração de nós

O GKE oferece diversas opções para seus nós do cluster. Por exemplo, você pode criar um ou mais pools de nós, que são grupos de nós dentro do cluster que compartilham uma configuração em comum. Seu cluster deve ter pelo menos um pool de nós. Além disso, quando você cria o cluster, um pool de nós chamado default é criado.

Para clusters padrão, é possível definir outras opções de nó por pool, incluindo:

Reparos automáticos: aplicados aos clusters do Autopilot
Spot VMs
SSDs locais
Plataforma mínima de CPU

Configurar o monitoramento de clusters

O Google recomenda usar o Serviço gerenciado para Prometheus do Google Cloud para monitorar seus aplicativos e infraestrutura do Kubernetes.

O Serviço gerenciado para Prometheus é a solução de várias nuvens totalmente gerenciada do Google Cloud para métricas do Prometheus. Ele permite monitorar e receber alertas globalmente sobre as cargas de trabalho usando o Prometheus, sem precisar gerenciar e operar manualmente o Prometheus em grande escala.

O Serviço gerenciado para Prometheus coleta métricas dos exportadores do Prometheus e permite que você consulte os dados globalmente usando o PromQL, o que significa que é possível continuar usando todos os painéis existentes do Grafana, alertas baseados em PromQL e fluxos de trabalho. Ele é compatível com várias nuvens e nuvens híbridas, pode monitorar cargas de trabalho do Kubernetes e de VM, retém dados por 24 meses e mantém a portabilidade permanecendo compatível com o Prometheus upstream. Também é possível complementar o monitoramento do Prometheus consultando mais de 1.500 métricas gratuitas no Cloud Monitoring, incluindo métricas gratuitas do sistema do GKE usando PromQL.

Para mais informações sobre como configurar o monitoramento de clusters, consulte os seguintes guias:

Como configurar redes de cluster

Outro aspecto da administração dos clusters é habilitar e controlar vários recursos de rede para eles. A maioria desses recursos é definida durante criação do cluster: quando você cria um cluster usando uma interface do Google Cloud, ative os recursos de rede que quer usar. Alguns desses recursos podem exigir mais configurações usando as interfaces do Kubernetes, como a interface de linha de comando kubectl.

Por exemplo, para ativar a aplicação da política de rede no cluster do GKE, primeiro é necessário ativar o recurso usando o console do Cloud ou a Google Cloud CLI. Em seguida, especifique as regras de política de rede reais usando a API de política de rede do Kubernetes ou a interface de linha de comando kubectl. Para clusters do Autopilot, a política de rede é desativada por padrão, mas é possível ativar esse recurso.

Para mais informações sobre como ativar recursos de rede no GKE, consulte os seguintes guias:

Como configurar a segurança do cluster

O GKE inclui recursos de segurança específicos do Google Cloud e do Kubernetes que podem ser usados com seu cluster. É possível gerenciar a segurança no nível do Google Cloud, como o IAM, usando o console do Google Cloud. Gerencie os recursos de segurança dentro do cluster, como o controle de acesso baseado em papéis, usando as APIs do Kubernetes e outras interfaces.

Para saber mais sobre os recursos de segurança disponíveis no GKE, consulte a Visão geral de segurança e Aumentar a segurança do cluster. Os clusters do GKE Autopilot implementam muitos desses recursos de segurança as práticas recomendadas para aumentá-la automaticamente. Para mais informações, consulte Recursos de segurança no GKE Autopilot.

Como configurar a recuperação de desastres

Para garantir que suas cargas de trabalho de produção permaneçam disponíveis no caso de um evento de interrupção de serviço, prepare um plano de recuperação de desastres (DR). Para saber mais sobre o planejamento de DR, consulte o guia de planejamento de recuperação de desastres.

A configuração do Kubernetes e os volumes permanentes não serão armazenados em backup, a menos que você execute uma ação explícita. Para fazer backup e restaurar a configuração do Kubernetes e os volumes permanentes nos clusters do GKE, use o Backup para GKE.