Acerca das cargas de trabalho do modo Autopilot no GKE Standard


Pode usar ComputeClasses para executar cargas de trabalho do Google Kubernetes Engine (GKE) Autopilot nos seus clusters do modo padrão do GKE. Esta página descreve os métodos que pode usar para executar as suas cargas de trabalho no modo de piloto automático e ajuda a decidir quando executar uma carga de trabalho num modo específico.

Estas informações destinam-se às seguintes pessoas:

  • Arquitetos de nuvem que querem otimizar os custos operacionais nas organizações.
  • Administradores de plataformas que querem reduzir os custos gerais da gestão manual da infraestrutura.
  • Engenheiros de fiabilidade de sites (EFS) que querem transferir a manutenção, as atualizações e o dimensionamento da infraestrutura para o Google Cloud quando possível. Google Cloud

Já deve estar familiarizado com os seguintes conceitos:

Acerca do GKE Autopilot

O Autopilot é um modo de funcionamento no GKE em que a Google gere a sua infraestrutura de nós, o escalonamento, a segurança e as funcionalidades pré-configuradas. O modo de piloto automático está otimizado para executar a maioria das cargas de trabalho de produção num ambiente que aplica as definições recomendadas para segurança, fiabilidade, desempenho e escalabilidade. Para decidir entre o modo Autopilot e o modo Standard com base nos seus requisitos, consulte o artigo Acerca dos modos de funcionamento do GKE.

Pode usar o modo de condução autónoma das seguintes formas:

  • Crie um cluster que use o modo Autopilot: A Google gere todo o cluster e aplica as práticas recomendadas para automatização, fiabilidade, segurança e custos.
  • Execute cargas de trabalho no modo Autopilot em clusters Standard: implementa ComputeClasses do Autopilot e seleciona-as em cargas de trabalho. A Google gere os nós que o GKE cria para essas cargas de trabalho específicas. Controla o cluster e pode executar os seus próprios conjuntos de nós juntamente com os nós que o GKE gere.

Acerca do modo de piloto automático para ComputeClasses

Uma ComputeClass é um recurso personalizado do Kubernetes que define uma lista de configurações de nós, como tipos de máquinas ou definições de funcionalidades. Pode selecionar ComputeClasses específicas nas especificações de carga de trabalho do Kubernetes. Quando uma carga de trabalho que seleciona uma ComputeClass precisa de um novo nó, o GKE tenta aprovisionar o nó com uma das configurações que a ComputeClass declara. O GKE experimenta cada configuração na ComputeClass por ordem e recorre à configuração seguinte se a criação do nó falhar. Para mais informações, consulte o artigo Acerca das ComputeClasses personalizadas.

Para executar cargas de trabalho do Autopilot nos clusters do GKE Standard, ative o modo Autopilot numa ComputeClass e selecione essa ComputeClass em cargas de trabalho específicas. A Google gere todos os novos nós que o GKE aprovisiona para estas cargas de trabalho, de forma semelhante à forma como a Google gere os nós em clusters do Autopilot. A maioria das vantagens e funcionalidades de segurança do modo Autopilot aplica-se a essas cargas de trabalho e aos nós anfitriões.

As ComputeClasses do modo Autopilot oferecem aos administradores de clusters flexibilidade adicional para escolher o nível de controlo que querem sobre cargas de trabalho e infraestrutura específicas no cluster, como das seguintes formas:

  • Pode permitir que o GKE faça a gestão total de cargas de trabalho específicas executando-as no modo Autopilot.
  • Mantém o controlo total sobre as cargas de trabalho e a infraestrutura que não usam o modo Autopilot, como os conjuntos de nós criados manualmente.
  • Pode definir uma ComputeClass do Autopilot como a predefinição para o seu cluster ou espaço de nomes, para que as cargas de trabalho sejam executadas no modo Autopilot, a menos que peçam explicitamente uma opção diferente.

Estas opções permitem que os administradores de clusters decidam o nível e o âmbito com que usam o Autopilot.

As ComputeClasses do modo Autopilot oferecem aos administradores de clusters flexibilidade adicional para escolher o nível de controlo que querem sobre cargas de trabalho e infraestrutura específicas no cluster, como das seguintes formas:

  • Pode permitir que o GKE faça a gestão total de cargas de trabalho específicas executando-as no modo Autopilot.
  • Mantém o controlo total sobre as cargas de trabalho e a infraestrutura que não usam o modo Autopilot, como os conjuntos de nós criados manualmente.
  • Pode definir uma ComputeClass do Autopilot como a predefinição para o seu cluster ou espaço de nomes, para que as cargas de trabalho sejam executadas no modo Autopilot, a menos que peçam explicitamente uma opção diferente.

Estas opções permitem que os administradores de clusters decidam o nível e o âmbito com que usam o Autopilot.

Vantagens das ComputeClasses do Autopilot em clusters padrão

A execução de algumas das suas cargas de trabalho no modo de piloto automático oferece vantagens como as seguintes:

  • Reduza os custos de gestão da infraestrutura: a Google atualiza, mantém, configura e otimiza nós específicos por si.
  • Use o modelo de preços do Autopilot: as cargas de trabalho que usam uma ComputeClass do Autopilot são faturadas através do modelo de preços do Autopilot. Este modelo de preços inclui a faturação por pod para cargas de trabalho que não pedem hardware específico. Para mais informações, consulte a secção Preços.
  • Melhore o posicionamento da escalabilidade e da segurança: As cargas de trabalho do Autopilot beneficiam de vantagens como o acesso à plataforma de computação otimizada para contentores, restrições de segurança predefinidas melhoradas e o dimensionamento automático de nós com base em pedidos de recursos. Os nós dessas cargas de trabalho usam funcionalidades como atualizações automáticas de nós e reparações automáticas.
  • Melhore a fiabilidade: o contrato de nível de serviço (SLA) do GKE inclui um objetivo ao nível do serviço (SLO) de tempo de atividade do pod para o Autopilot.

Muitas destas vantagens também são oferecidas pelos clusters do Autopilot, que também oferecem uma experiência mais gerida do que os clusters padrão e incluem várias vantagens de segurança, rede e gestão de recursos. Para mais informações, consulte o artigo Vista geral do Autopilot.

Seleção de hardware nas ComputeClasses do Autopilot

Nas ComputeClasses do modo automático, pode selecionar hardware específico para os seus nós (como GPUs ou tipos de máquinas) ou permitir que o GKE coloque pods numa plataforma de computação de uso geral otimizada para contentores. A opção de uso geral é recomendada para a maioria das cargas de trabalho de produção que não requerem hardware específico para serem executadas bem.

A tabela seguinte descreve estas opções de configuração, como escolher uma numa ComputeClass e como esta escolha afeta o seu modelo de faturação:

Tabela 1. Seleção de hardware em ComputeClasses do Autopilot
Requisito de carga de trabalho Configuração da ComputeClass recomendada Modelo de faturação
Cargas de trabalho de utilização geral

Use uma ComputeClass do Autopilot que tenha a regra de prioridade podFamily para executar cargas de trabalho que não requerem hardware específico na plataforma de computação otimizada para contentores do Autopilot. Esta plataforma funciona bem para cargas de trabalho de fins gerais, como as seguintes:

  • Servidores Web
  • Empregos orientados por eventos
  • Processamento em lote
  • Pipelines de CI/CD

As ComputeClasses do Autopilot incorporadas disponíveis para clusters Standard usam a regra de prioridade podFamily.

Modelo de faturação baseado em agrupamentos
Cargas de trabalho que precisam de hardware específico

Use uma ComputeClass que use qualquer regra de configuração de hardware disponível, como a regra machineFamily ou a regra gpus.

Modelo de faturação baseado em nós

Configuração do Autopilot em ComputeClasses

Pode usar o modo Autopilot num cluster Standard usando uma ComputeClass do Autopilot integrada fornecida pelo GKE ou ativando o Autopilot em qualquer ComputeClass personalizada que criar. As secções seguintes descrevem cada opção.

ComputeClasses do Autopilot incorporadas

O GKE configura classes de computação do Autopilot específicas para si. Pode selecionar estas classes do Autopilot incorporadas em qualquer cluster elegível. As ComputeClasses do Autopilot integradas nos clusters Standard usam a regra de prioridade podFamily para executar pods na plataforma de computação otimizada para contentores. Para mais informações, consulte o artigo Acerca das ComputeClasses integradas no GKE.

Custom Autopilot ComputeClasses

Pode ativar o Autopilot em qualquer ComputeClass personalizado que gere. Esta opção é útil se as suas cargas de trabalho tiverem requisitos de hardware específicos. O campo autopilot no recurso personalizado ComputeClass permite-lhe ativar ou desativar o Autopilot numa ComputeClass específica.

Para ativar o Autopilot numa ComputeClass existente, tem de a eliminar, atualizar a configuração e, em seguida, recriar a ComputeClass no cluster. As alterações aplicam-se a todos os novos nós que o GKE cria para cargas de trabalho que implementa depois de atualizar a ComputeClass do Autopilot.

Para mais informações sobre como ativar o Autopilot nas suas classes de computação personalizadas, consulte o artigo Selecione hardware específico para os seus pods do Autopilot.

Preços

Os preços do GKE Autopilot aplicam-se aos nós e às cargas de trabalho que o GKE cria para uma ComputeClass do Autopilot. A tabela seguinte descreve o modelo de faturação que se aplica a diferentes configurações de ComputeClass do Autopilot nos seus clusters do modo padrão.

Tabela 3. Preços das ComputeClasses do Autopilot
Modelos de faturação para diferentes configurações da ComputeClass
Modelo de faturação baseado em agrupamentos O modelo de faturação baseado em pods aplica-se a classes de computação do Autopilot que usam a regra de prioridade podFamily em vez de selecionar máquinas ou hardware específicos. As ComputeClasses do Autopilot integradas, que usam a regra podFamily, usam o modelo de faturação baseado em pods.
Modelo de faturação baseado em nós O modelo de faturação baseado em nós aplica-se a classes de computação do Autopilot que pedem explicitamente configurações de nós específicas, como instâncias N2 ou GPUs.

Os preços do Autopilot aplicam-se apenas às cargas de trabalho e aos nós que usam uma ComputeClass do Autopilot. O cluster do modo Standard e todos os outros conjuntos de nós que executar continuam a usar os preços do modo Standard do GKE.

Definições pré-configuradas para nós geridos pelo Autopilot

Antes de ativar o modo Autopilot nas ComputeClasses, saiba o que esperar dos nós que o GKE cria para executar as cargas de trabalho do Autopilot. A Google configura funcionalidades específicas e restrições de segurança nos nós do Autopilot. Como resultado, as cargas de trabalho que são implementadas e funcionam corretamente nos seus nós do modo Standard podem ser rejeitadas pelo modo Autopilot se não cumprirem os requisitos de segurança do Autopilot.

A tabela seguinte descreve as configurações de funcionalidades que substituem as definições correspondentes no seu cluster padrão. Se uma configuração não estiver nesta tabela, os nós do Autopilot usam a definição do cluster Standard. Por exemplo, a federação de identidade da carga de trabalho para o GKE não está nesta tabela, o que significa que a definição de federação de identidade da carga de trabalho para o GKE do cluster Standard aplica-se aos nós do Autopilot que o GKE cria.

Tabela 4. Definições pré-configuradas para nós do Autopilot
Funcionalidade Definição padrão ao nível do cluster Definição de nó gerido pelo Autopilot
Atualizações e manutenção de nós

Configurável:

Pré-configurado:

  • Reparação automática de nós: ativada
  • Atualização automática de nós: ativada
  • Estratégia de atualização de nós: atualizações rápidas com parâmetros pré-configurados
Escala automática Configurável: Perfil de escala automática Pré-configurado: perfil de escala automática optimize-utilization
Trabalhar em rede Nativo de VPC ou baseado em rotas Requer um cluster nativo de VPC
Segurança

Configurável:

Pré-configurado:

Sistema operativo do nó

Configurável:

Pré-configurado:

Disco de arranque do nó

Configurável:

Configurável:

  • Tipo de disco de arranque: usa o valor no campo ComputeClass storage.bootDiskType. Se este campo não estiver definido, o GKE define o tipo de disco de arranque da seguinte forma:
    • Se a ComputeClass usar regras podFamily, o GKE usa um disco pd-balanced.
    • Se a ComputeClass não usar regras podFamily, o GKE usa o tipo de disco de arranque predefinido para o cluster.
  • Tamanho do disco de arranque: o GKE usa o valor no campo compute class storage.bootDiskSize. Se este campo não estiver definido, o GKE define o tamanho do disco de arranque da seguinte forma:
Metadados do nó

Pedidos de recursos para cargas de trabalho do Autopilot

Para que as cargas de trabalho do Autopilot sejam executadas de forma eficiente, o GKE aplica determinados valores mínimos e máximos para pedidos de CPU, memória e armazenamento efémero nos seus pods. O GKE também aplica pedidos predefinidos a pods que não pedem explicitamente um destes recursos. Os valores específicos dos requisitos de recursos mínimos, máximos e predefinidos nas cargas de trabalho do GKE Autopilot variam consoante o tipo de hardware que os seus pods usam.

Para o armazenamento efémero, o valor predefinido se não pedir armazenamento efémero é o mesmo para todas as ComputeClasses e seleções de hardware. Para mais informações, consulte Pedidos de recursos predefinidos.

A tabela seguinte fornece links para os requisitos de CPU e memória dos seus pedidos de pods, consoante o tipo de hardware:

Tabela 5. Requisitos de CPU e memória do Autopilot
Tipo do recurso Pedidos mínimos e máximos Pedidos predefinidos
Pods de uso geral
podFamily regra de prioridade
Consulte a linha "Uso geral" na tabela Mínimos e máximos para ComputeClasses. Consulte a linha "Geral" na tabela Pedidos predefinidos para ComputeClasses.
GPUs e TPUs Depende do tipo e da quantidade de acelerador de hardware. Para mais informações, consulte Mínimos e máximos para a ComputeClass do acelerador. Depende do tipo e da quantidade de acelerador de hardware. Para mais informações, consulte Pedidos predefinidos para aceleradores.
Tipos de máquinas e famílias de máquinas específicos do Compute Engine
  • Mínimo: sem valores mínimos para CPU ou memória.
  • Máximo: o valor máximo é a capacidade de recursos da instância do Compute Engine.
Para qualquer tipo de máquina ou família de máquinas do Compute Engine, os pedidos predefinidos encontram-se na linha "Uso geral" na tabela Pedidos predefinidos para ComputeClasses.

O que se segue?