Esta página foi traduzida pela API Cloud Translation.

Acerca das cargas de trabalho do modo Autopilot no GKE Standard

Autopilot Padrão

Pode usar ComputeClasses para executar cargas de trabalho do Google Kubernetes Engine (GKE) Autopilot nos seus clusters do modo padrão do GKE. Este documento descreve os métodos que pode usar para executar as suas cargas de trabalho no modo de piloto automático e ajuda a decidir quando executar uma carga de trabalho num modo específico.

Estas informações destinam-se às seguintes pessoas:

Arquitetos de nuvem que querem otimizar os custos operacionais nas organizações.
Administradores de plataformas que querem reduzir os custos gerais da gestão manual da infraestrutura.
Engenheiros de fiabilidade de sites (SREs) que querem transferir a manutenção, as atualizações e o dimensionamento da infraestrutura para o Google Cloud quando possível. Google Cloud

Já deve estar familiarizado com os seguintes conceitos:

Acerca do GKE Autopilot

O Autopilot é um modo de funcionamento no GKE em que a Google gere a sua infraestrutura de nós, o escalonamento, a segurança e as funcionalidades pré-configuradas. O modo de piloto automático está otimizado para executar a maioria das cargas de trabalho de produção num ambiente que aplica as definições recomendadas para segurança, fiabilidade, desempenho e escalabilidade. Para decidir entre o modo Autopilot e o modo Standard com base nos seus requisitos, consulte o artigo Acerca dos modos de funcionamento do GKE.

Pode usar o modo de condução autónoma das seguintes formas:

Crie um cluster que use o modo Autopilot: A Google gere todo o cluster e aplica as práticas recomendadas para automatização, fiabilidade, segurança e custos.
Execute cargas de trabalho no modo Autopilot em clusters Standard: implementa ComputeClasses do Autopilot e seleciona-as em cargas de trabalho. A Google gere os nós que o GKE cria para essas cargas de trabalho específicas. Controla o cluster e pode executar os seus próprios conjuntos de nós juntamente com os nós que o GKE gere.

Acerca do modo de piloto automático para ComputeClasses

Uma ComputeClass é um recurso personalizado do Kubernetes que define uma lista de configurações de nós, como tipos de máquinas ou definições de funcionalidades. Pode selecionar ComputeClasses específicas nas especificações de carga de trabalho do Kubernetes. Quando uma carga de trabalho que seleciona uma ComputeClass precisa de um novo nó, o GKE tenta aprovisionar o nó com uma das configurações que a ComputeClass declara. O GKE experimenta cada configuração na ComputeClass por ordem e recorre à configuração seguinte se a criação do nó falhar. Para mais informações, consulte o artigo Acerca das ComputeClasses personalizadas.

Para executar cargas de trabalho do Autopilot nos clusters do GKE Standard, ative o modo Autopilot numa ComputeClass e selecione essa ComputeClass em cargas de trabalho específicas. A Google gere todos os novos nós que o GKE aprovisiona para estas cargas de trabalho, de forma semelhante à forma como a Google gere os nós em clusters do Autopilot. A maioria das vantagens e funcionalidades de segurança do modo Autopilot aplica-se a essas cargas de trabalho e aos nós anfitriões.

As ComputeClasses do modo de piloto automático oferecem aos administradores de clusters flexibilidade adicional para escolher o nível de controlo que querem sobre cargas de trabalho e infraestrutura específicas no cluster, como das seguintes formas:

Pode permitir que o GKE faça a gestão total de cargas de trabalho específicas executando-as no modo Autopilot.
Mantém o controlo total sobre as cargas de trabalho e a infraestrutura que não usam o modo Autopilot, como os conjuntos de nós criados manualmente.
Pode definir uma ComputeClass do Autopilot como a predefinição para o seu cluster ou espaço de nomes, para que as cargas de trabalho sejam executadas no modo Autopilot, a menos que peçam explicitamente uma opção diferente.

Estas opções permitem que os administradores de clusters decidam o nível e o âmbito com que usam o Autopilot.

Vantagens das ComputeClasses do piloto automático em clusters padrão

A execução de algumas das suas cargas de trabalho no modo de piloto automático oferece vantagens como as seguintes:

Reduza os custos de gestão da infraestrutura: a Google atualiza, mantém, configura e otimiza nós específicos por si.
Use o modelo de preços do Autopilot: as cargas de trabalho que usam uma ComputeClass do Autopilot são faturadas através do modelo de preços do Autopilot. Este modelo de preços inclui a faturação por pod para cargas de trabalho que não pedem hardware específico. Para mais informações, consulte a secção Preços.
Melhore o posicionamento da escalabilidade e da segurança: As cargas de trabalho do Autopilot beneficiam de vantagens como o acesso à plataforma de computação otimizada para contentores, restrições de segurança predefinidas melhoradas e o dimensionamento automático de nós com base em pedidos de recursos. Os nós dessas cargas de trabalho usam funcionalidades como atualizações automáticas de nós e reparações automáticas.
Melhore a fiabilidade: o contrato de nível de serviço (SLA) do GKE inclui um objetivo ao nível do serviço (SLO) de tempo de atividade do pod para o Autopilot.

Muitas destas vantagens também são oferecidas pelos clusters do Autopilot, que também oferecem uma experiência mais gerida do que os clusters padrão e incluem várias vantagens de segurança, rede e gestão de recursos. Para mais informações, consulte o artigo Vista geral do Autopilot.

Seleção de hardware nas ComputeClasses do Autopilot

Nas ComputeClasses do modo automático, pode selecionar hardware específico para os seus nós (como GPUs ou tipos de máquinas) ou permitir que o GKE coloque pods numa plataforma de computação de uso geral otimizada para contentores. A opção de uso geral é recomendada para a maioria das cargas de trabalho de produção que não requerem hardware específico para serem executadas bem.

A tabela seguinte descreve estas opções de configuração, como escolher uma numa ComputeClass e como esta escolha afeta o seu modelo de faturação:

**Tabela 1.** Seleção de hardware em ComputeClasses do Autopilot
Requisito de carga de trabalho	Configuração da ComputeClass recomendada	Modelo de faturação
Cargas de trabalho de utilização geral	Use uma ComputeClass do Autopilot que tenha a regra de prioridade `podFamily` para executar cargas de trabalho que não exijam hardware específico na plataforma de computação otimizada para contentores do Autopilot. Esta plataforma funciona bem para cargas de trabalho de fins gerais, como as seguintes: Servidores Web Empregos orientados por eventos Processamento em lote Pipelines de CI/CD As ComputeClasses do Autopilot incorporadas disponíveis para clusters Standard usam a regra de prioridade `podFamily`.	Modelo de faturação baseado em agrupamentos
Cargas de trabalho que precisam de hardware específico	Use uma ComputeClass que use qualquer regra de configuração de hardware disponível, como a regra `machineFamily` ou a regra `gpus`.	Modelo de faturação baseado em nós

Configuração do Autopilot em ComputeClasses

Pode usar o modo Autopilot num cluster Standard usando uma ComputeClass do Autopilot integrada fornecida pelo GKE ou ativando o Autopilot em qualquer ComputeClass personalizada que criar. As secções seguintes descrevem cada opção.

ComputeClasses do Autopilot incorporadas

O GKE configura classes de computação específicas do Autopilot para si. Pode selecionar estas classes do Autopilot incorporadas em qualquer cluster elegível. As ComputeClasses do Autopilot integradas nos clusters Standard usam a regra de prioridade podFamily para executar pods na plataforma de computação otimizada para contentores. Para mais informações, consulte o artigo Acerca das ComputeClasses integradas no GKE.

Custom Autopilot ComputeClasses

Pode ativar o Autopilot em qualquer ComputeClass personalizado que gere. Esta opção é útil se as suas cargas de trabalho tiverem requisitos de hardware específicos. O campo autopilot no recurso personalizado ComputeClass permite-lhe ativar ou desativar o Autopilot numa ComputeClass específica.

Para ativar o Autopilot numa ComputeClass existente, tem de a eliminar, atualizar a configuração e, em seguida, recriar a ComputeClass no cluster. As alterações aplicam-se a todos os novos nós que o GKE cria para cargas de trabalho que implementa depois de atualizar a ComputeClass do Autopilot.

Para mais informações sobre como ativar o Autopilot nas suas ComputeClasses personalizadas, consulte o artigo Selecione hardware específico para os seus pods do Autopilot.

Preços

Os preços do GKE Autopilot aplicam-se aos nós e às cargas de trabalho que o GKE cria para uma ComputeClass do Autopilot. A tabela seguinte descreve o modelo de faturação que se aplica a diferentes configurações de ComputeClass do Autopilot nos seus clusters do modo padrão.

**Tabela 3.** Preços das ComputeClasses do Autopilot
Modelos de faturação para diferentes configurações da ComputeClass
Modelo de faturação baseado em agrupamentos	O modelo de faturação baseado em pods aplica-se a classes de computação do Autopilot que usam a regra de prioridade `podFamily` em vez de selecionar máquinas ou hardware específicos. As ComputeClasses do Autopilot integradas, que usam a regra `podFamily`, usam o modelo de faturação baseado em pods.
Modelo de faturação baseado em nós	O modelo de faturação baseado em nós aplica-se a classes de computação do Autopilot que pedem explicitamente configurações de nós específicas, como instâncias N2 ou GPUs.

Os preços do Autopilot aplicam-se apenas às cargas de trabalho e aos nós que usam uma ComputeClass do Autopilot. O cluster do modo Standard e todos os outros conjuntos de nós que executar continuam a usar os preços do modo Standard do GKE.

Definições pré-configuradas para nós geridos pelo Autopilot

Antes de ativar o modo Autopilot nas ComputeClasses, saiba o que esperar dos nós que o GKE cria para executar as cargas de trabalho do Autopilot. A Google configura funcionalidades específicas e restrições de segurança nos nós do Autopilot. Como resultado, as cargas de trabalho que são implementadas e funcionam corretamente nos seus nós do modo Standard podem ser rejeitadas pelo modo Autopilot se não cumprirem os requisitos de segurança do Autopilot.

A tabela seguinte descreve as configurações de funcionalidades que substituem as definições correspondentes no seu cluster padrão. Se uma configuração não estiver nesta tabela, os nós do Autopilot usam a definição do cluster Standard. Por exemplo, a federação de identidade da carga de trabalho para o GKE não está nesta tabela, o que significa que a definição de federação de identidade da carga de trabalho para o GKE do cluster Standard aplica-se aos nós do Autopilot que o GKE cria.

**Tabela 4.** Definições pré-configuradas para nós do Autopilot
Funcionalidade	Definição padrão ao nível do cluster	Definição de nó gerido pelo Autopilot
Atualizações e manutenção de nós	Configurável: Reparação automática de nós Atualização automática de nós Estratégia de atualização de nós	Pré-configurado: Reparação automática de nós: ativada Atualização automática de nós: ativada Estratégia de atualização de nós: atualizações rápidas com parâmetros pré-configurados
Escala automática	Configurável: Perfil de escala automática	Pré-configurado: perfil de escala automática `optimize-utilization`
Redes	Nativo de VPC ou baseado em rotas	Requer um cluster nativo de VPC
Segurança	Configurável: Conta de serviço de IAM do nó Âmbitos de acesso Arranque seguro	Pré-configurado: Conta de serviço do IAM do nó: usa a conta de serviço para o aprovisionamento automático de nós. Âmbitos de acesso: usa os âmbitos de acesso para o aprovisionamento automático dos nós. Arranque seguro: ativado Restrições de segurança dos nós: configurações de segurança do Autopilot incorporadas, aplicadas com base no melhor esforço.
Sistema operativo do nó	Configurável: Imagem do nó Configuração do sistema de nós Modo cgroup do Linux	Pré-configurado: Imagem do nó: SO otimizado para contentores com o containerd Configuração do sistema do nó: configurável apenas com o campo `nodeSystemConfig` ComputeClass. Modo cgroup: v2
Disco de arranque do nó	Configurável: Tipo de disco de arranque Tamanho do disco de arranque	Configurável: Tipo de disco de arranque: usa o valor no campo ComputeClass `storage.bootDiskType`. Se este campo não estiver definido, o GKE define o tipo de disco de arranque da seguinte forma: Se o ComputeClass usar regras `podFamily`, o GKE usa um disco `pd-balanced`. Se a ComputeClass não usar regras `podFamily`, o GKE usa o tipo de disco de arranque predefinido para o cluster. Tamanho do disco de arranque: o GKE usa o valor no campo compute class `storage.bootDiskSize`. Se este campo não estiver definido, o GKE define o tamanho do disco de arranque da seguinte forma: Se definir um tamanho predefinido do disco de arranque para o aprovisionamento automático de nós, o GKE usa esse valor. Se não definir um tamanho do disco de arranque predefinido para o aprovisionamento automático de nós, o GKE usa o tamanho predefinido do cluster.
Metadados do nó	Etiquetas do Resource Manager para políticas de firewall: as atualizações às etiquetas ao nível do cluster não afetam os nós existentes.	Etiquetas do Resource Manager para políticas de firewall: as atualizações às etiquetas ao nível do cluster afetam os nós existentes.

Pedidos de recursos para cargas de trabalho do Autopilot

Para que as cargas de trabalho do Autopilot sejam executadas de forma eficiente, o GKE aplica determinados valores mínimos e máximos para pedidos de CPU, memória e armazenamento efémero nos seus pods. O GKE também aplica pedidos predefinidos a pods que não pedem explicitamente um destes recursos. Os valores específicos dos requisitos de recursos mínimos, máximos e predefinidos nas cargas de trabalho do GKE Autopilot variam consoante o tipo de hardware que os seus pods usam.

Para o armazenamento efémero, o valor predefinido se não pedir armazenamento efémero é o mesmo para todas as ComputeClasses e seleções de hardware. Para mais informações, consulte Pedidos de recursos predefinidos.

A tabela seguinte fornece links para os requisitos de CPU e memória dos seus pedidos de pods, consoante o tipo de hardware:

**Tabela 5.** Requisitos de CPU e memória do Autopilot
Tipo do recurso	Pedidos mínimos e máximos	Pedidos predefinidos
Pods de uso geral `podFamily` regra de prioridade	Consulte a linha "Uso geral" na tabela Mínimos e máximos para ComputeClasses.	Consulte a linha "Geral" na tabela Pedidos predefinidos para ComputeClasses.
GPUs e TPUs	Depende do tipo e da quantidade de acelerador de hardware. Para mais informações, consulte Mínimos e máximos para a ComputeClass do acelerador.	Depende do tipo e da quantidade de acelerador de hardware. Para mais informações, consulte Pedidos predefinidos para aceleradores.
Tipos de máquinas e famílias de máquinas específicos do Compute Engine	Mínimo: sem valores mínimos para CPU ou memória. Máximo: o valor máximo é a capacidade de recursos da instância do Compute Engine.	Para qualquer tipo de máquina ou família de máquinas do Compute Engine, os pedidos predefinidos encontram-se na linha "Uso geral" da tabela Pedidos predefinidos para ComputeClasses.