Guia de confiabilidade do Google Kubernetes Engine

Last reviewed 2023-07-19 UTC

O Google Kubernetes Engine (GKE) é um sistema para operação em escala de aplicativos conteinerizados na nuvem. O GKE implanta, gerencia e provisiona recursos para aplicativos em contêineres. O ambiente do GKE consiste em instâncias do Compute Engine agrupadas para formar um cluster.

Práticas recomendadas

  • Práticas recomendadas para operar contêineres: como usar mecanismos de geração de registros, garantir que os contêineres sejam sem estado e imutáveis, monitorar aplicativos e fazer sondagens de atividade e prontidão.
  • Práticas recomendadas para criar contêineres: como empacotar um aplicativo único por contêiner, processar identificadores de processos (PIDs, na sigla em inglês), otimizar o cache de criação do Docker e criar imagens menores para acelerar os tempos de upload e download.
  • Práticas recomendadas para a rede do Google Kubernetes Engine: use clusters nativos de VPC para facilitar o escalonamento, planeje endereços IP, escalone a conectividade do cluster, use o Google Cloud Armor para bloquear ataques distribuídos de negação de serviço (DDoS), implemente o balanceamento de carga nativo de contêiner para reduzir a latência, use a funcionalidade de verificação de integridade dos balanceadores de carga de aplicativo externos para realizar um failover adequado e use os clusters regionais para aumentar a disponibilidade dos aplicativos em um cluster.
  • Preparar aplicativos do Kubernetes baseados na nuvem: aprenda as práticas recomendadas para planejar a capacidade de aplicativos, expandir os aplicativos horizontalmente ou verticalmente, definir limites de recursos em relação às solicitações de recursos de memória e CPU, tornar os contêineres enxutos para uma inicialização mais rápida de aplicativos. e limitar a interrupção de Pod definindo um Pod Disruption Budget (PDB). Além disso, entenda como configurar sondagens de atividade e prontidão para uma inicialização elegante de aplicativos, garantir encerramentos não interruptivos e implementar espera exponencial em solicitações repetidas para evitar picos de tráfego que sobrecarregam o aplicativo.
  • Práticas recomendadas para multilocação no GKE: como projetar uma arquitetura de cluster multilocatário com alta disponibilidade e confiabilidade, usar a medição de uso do Google Kubernetes Engine (GKE) para métricas de uso por locatário e fornecer registros específicos ao locatário e forneça monitoramento específico para locatários.