Pode usar ComputeClasses para executar cargas de trabalho do Google Kubernetes Engine (GKE) Autopilot nos seus clusters do modo padrão do GKE. Esta página descreve os métodos que pode usar para executar as suas cargas de trabalho no modo de piloto automático e ajuda a decidir quando executar uma carga de trabalho num modo específico.
Estas informações destinam-se às seguintes pessoas:
- Arquitetos de nuvem que querem otimizar os custos operacionais nas organizações.
- Administradores de plataformas que querem reduzir os custos gerais da gestão manual da infraestrutura.
- Engenheiros de fiabilidade de sites (EFS) que querem transferir a manutenção, as atualizações e o dimensionamento da infraestrutura para o Google Cloud quando possível. Google Cloud
Já deve estar familiarizado com os seguintes conceitos:
Acerca do GKE Autopilot
O Autopilot é um modo de funcionamento no GKE em que a Google gere a sua infraestrutura de nós, o escalonamento, a segurança e as funcionalidades pré-configuradas. O modo de piloto automático está otimizado para executar a maioria das cargas de trabalho de produção num ambiente que aplica as definições recomendadas para segurança, fiabilidade, desempenho e escalabilidade. Para decidir entre o modo Autopilot e o modo Standard com base nos seus requisitos, consulte o artigo Acerca dos modos de funcionamento do GKE.
Pode usar o modo de condução autónoma das seguintes formas:
- Crie um cluster que use o modo Autopilot: A Google gere todo o cluster e aplica as práticas recomendadas para automatização, fiabilidade, segurança e custos.
- Execute cargas de trabalho no modo Autopilot em clusters Standard: implementa ComputeClasses do Autopilot e seleciona-as em cargas de trabalho. A Google gere os nós que o GKE cria para essas cargas de trabalho específicas. Controla o cluster e pode executar os seus próprios conjuntos de nós juntamente com os nós que o GKE gere.
Acerca do modo de piloto automático para ComputeClasses
Uma ComputeClass é um recurso personalizado do Kubernetes que define uma lista de configurações de nós, como tipos de máquinas ou definições de funcionalidades. Pode selecionar ComputeClasses específicas nas especificações de carga de trabalho do Kubernetes. Quando uma carga de trabalho que seleciona uma ComputeClass precisa de um novo nó, o GKE tenta aprovisionar o nó com uma das configurações que a ComputeClass declara. O GKE experimenta cada configuração na ComputeClass por ordem e recorre à configuração seguinte se a criação do nó falhar. Para mais informações, consulte o artigo Acerca das ComputeClasses personalizadas.
Para executar cargas de trabalho do Autopilot nos clusters do GKE Standard, ative o modo Autopilot numa ComputeClass e selecione essa ComputeClass em cargas de trabalho específicas. A Google gere todos os novos nós que o GKE aprovisiona para estas cargas de trabalho, de forma semelhante à forma como a Google gere os nós em clusters do Autopilot. A maioria das vantagens e funcionalidades de segurança do modo Autopilot aplica-se a essas cargas de trabalho e aos nós anfitriões.
As ComputeClasses do modo Autopilot oferecem aos administradores de clusters flexibilidade adicional para escolher o nível de controlo que querem sobre cargas de trabalho e infraestrutura específicas no cluster, como das seguintes formas:
- Pode permitir que o GKE faça a gestão total de cargas de trabalho específicas executando-as no modo Autopilot.
- Mantém o controlo total sobre as cargas de trabalho e a infraestrutura que não usam o modo Autopilot, como os conjuntos de nós criados manualmente.
- Pode definir uma ComputeClass do Autopilot como a predefinição para o seu cluster ou espaço de nomes, para que as cargas de trabalho sejam executadas no modo Autopilot, a menos que peçam explicitamente uma opção diferente.
Estas opções permitem que os administradores de clusters decidam o nível e o âmbito com que usam o Autopilot.
As ComputeClasses do modo Autopilot oferecem aos administradores de clusters flexibilidade adicional para escolher o nível de controlo que querem sobre cargas de trabalho e infraestrutura específicas no cluster, como das seguintes formas:
- Pode permitir que o GKE faça a gestão total de cargas de trabalho específicas executando-as no modo Autopilot.
- Mantém o controlo total sobre as cargas de trabalho e a infraestrutura que não usam o modo Autopilot, como os conjuntos de nós criados manualmente.
- Pode definir uma ComputeClass do Autopilot como a predefinição para o seu cluster ou espaço de nomes, para que as cargas de trabalho sejam executadas no modo Autopilot, a menos que peçam explicitamente uma opção diferente.
Estas opções permitem que os administradores de clusters decidam o nível e o âmbito com que usam o Autopilot.
Vantagens das ComputeClasses do Autopilot em clusters padrão
A execução de algumas das suas cargas de trabalho no modo de piloto automático oferece vantagens como as seguintes:
- Reduza os custos de gestão da infraestrutura: a Google atualiza, mantém, configura e otimiza nós específicos por si.
- Use o modelo de preços do Autopilot: as cargas de trabalho que usam uma ComputeClass do Autopilot são faturadas através do modelo de preços do Autopilot. Este modelo de preços inclui a faturação por pod para cargas de trabalho que não pedem hardware específico. Para mais informações, consulte a secção Preços.
- Melhore o posicionamento da escalabilidade e da segurança: As cargas de trabalho do Autopilot beneficiam de vantagens como o acesso à plataforma de computação otimizada para contentores, restrições de segurança predefinidas melhoradas e o dimensionamento automático de nós com base em pedidos de recursos. Os nós dessas cargas de trabalho usam funcionalidades como atualizações automáticas de nós e reparações automáticas.
- Melhore a fiabilidade: o contrato de nível de serviço (SLA) do GKE inclui um objetivo ao nível do serviço (SLO) de tempo de atividade do pod para o Autopilot.
Muitas destas vantagens também são oferecidas pelos clusters do Autopilot, que também oferecem uma experiência mais gerida do que os clusters padrão e incluem várias vantagens de segurança, rede e gestão de recursos. Para mais informações, consulte o artigo Vista geral do Autopilot.
Seleção de hardware nas ComputeClasses do Autopilot
Nas ComputeClasses do modo automático, pode selecionar hardware específico para os seus nós (como GPUs ou tipos de máquinas) ou permitir que o GKE coloque pods numa plataforma de computação de uso geral otimizada para contentores. A opção de uso geral é recomendada para a maioria das cargas de trabalho de produção que não requerem hardware específico para serem executadas bem.
A tabela seguinte descreve estas opções de configuração, como escolher uma numa ComputeClass e como esta escolha afeta o seu modelo de faturação:
Requisito de carga de trabalho | Configuração da ComputeClass recomendada | Modelo de faturação |
---|---|---|
Cargas de trabalho de utilização geral | Use uma ComputeClass do Autopilot que tenha a
regra de prioridade
As
ComputeClasses do Autopilot incorporadas
disponíveis para clusters Standard usam a
regra de prioridade |
Modelo de faturação baseado em agrupamentos |
Cargas de trabalho que precisam de hardware específico | Use uma ComputeClass que use qualquer regra de configuração de hardware disponível, como a regra |
Modelo de faturação baseado em nós |
Configuração do Autopilot em ComputeClasses
Pode usar o modo Autopilot num cluster Standard usando uma ComputeClass do Autopilot integrada fornecida pelo GKE ou ativando o Autopilot em qualquer ComputeClass personalizada que criar. As secções seguintes descrevem cada opção.
ComputeClasses do Autopilot incorporadas
O GKE configura classes de computação do Autopilot específicas para si. Pode
selecionar estas classes do Autopilot incorporadas
em qualquer cluster elegível. As ComputeClasses do Autopilot integradas nos clusters Standard usam a regra de prioridade podFamily
para executar pods na plataforma de computação otimizada para contentores. Para mais informações, consulte o artigo
Acerca das ComputeClasses integradas no GKE.
Custom Autopilot ComputeClasses
Pode ativar o Autopilot em qualquer ComputeClass personalizado que gere.
Esta opção é útil se as suas cargas de trabalho tiverem requisitos de hardware específicos.
O campo autopilot
no recurso personalizado ComputeClass
permite-lhe ativar ou desativar o Autopilot numa ComputeClass específica.
Para ativar o Autopilot numa ComputeClass existente, tem de a eliminar, atualizar a configuração e, em seguida, recriar a ComputeClass no cluster. As alterações aplicam-se a todos os novos nós que o GKE cria para cargas de trabalho que implementa depois de atualizar a ComputeClass do Autopilot.
Para mais informações sobre como ativar o Autopilot nas suas classes de computação personalizadas, consulte o artigo Selecione hardware específico para os seus pods do Autopilot.
Preços
Os preços do GKE Autopilot aplicam-se aos nós e às cargas de trabalho que o GKE cria para uma ComputeClass do Autopilot. A tabela seguinte descreve o modelo de faturação que se aplica a diferentes configurações de ComputeClass do Autopilot nos seus clusters do modo padrão.
Modelos de faturação para diferentes configurações da ComputeClass | |
---|---|
Modelo de faturação baseado em agrupamentos | O modelo de faturação baseado em pods aplica-se a classes de computação do Autopilot que usam a regra de prioridade podFamily em vez de selecionar máquinas ou hardware específicos. As
ComputeClasses do Autopilot integradas,
que usam a regra podFamily , usam o modelo de faturação
baseado em pods. |
Modelo de faturação baseado em nós | O modelo de faturação baseado em nós aplica-se a classes de computação do Autopilot que pedem explicitamente configurações de nós específicas, como instâncias N2 ou GPUs. |
Os preços do Autopilot aplicam-se apenas às cargas de trabalho e aos nós que usam uma ComputeClass do Autopilot. O cluster do modo Standard e todos os outros conjuntos de nós que executar continuam a usar os preços do modo Standard do GKE.
Definições pré-configuradas para nós geridos pelo Autopilot
Antes de ativar o modo Autopilot nas ComputeClasses, saiba o que esperar dos nós que o GKE cria para executar as cargas de trabalho do Autopilot. A Google configura funcionalidades específicas e restrições de segurança nos nós do Autopilot. Como resultado, as cargas de trabalho que são implementadas e funcionam corretamente nos seus nós do modo Standard podem ser rejeitadas pelo modo Autopilot se não cumprirem os requisitos de segurança do Autopilot.
A tabela seguinte descreve as configurações de funcionalidades que substituem as definições correspondentes no seu cluster padrão. Se uma configuração não estiver nesta tabela, os nós do Autopilot usam a definição do cluster Standard. Por exemplo, a federação de identidade da carga de trabalho para o GKE não está nesta tabela, o que significa que a definição de federação de identidade da carga de trabalho para o GKE do cluster Standard aplica-se aos nós do Autopilot que o GKE cria.
Funcionalidade | Definição padrão ao nível do cluster | Definição de nó gerido pelo Autopilot |
---|---|---|
Atualizações e manutenção de nós |
Configurável: |
Pré-configurado:
|
Escala automática | Configurável: Perfil de escala automática | Pré-configurado: perfil de escala automática optimize-utilization |
Trabalhar em rede | Nativo de VPC ou baseado em rotas | Requer um cluster nativo de VPC |
Segurança |
Configurável:
|
Pré-configurado:
|
Sistema operativo do nó |
Configurável: |
Pré-configurado:
|
Disco de arranque do nó |
Configurável: |
Configurável:
|
Metadados do nó |
|
|
Pedidos de recursos para cargas de trabalho do Autopilot
Para que as cargas de trabalho do Autopilot sejam executadas de forma eficiente, o GKE aplica determinados valores mínimos e máximos para pedidos de CPU, memória e armazenamento efémero nos seus pods. O GKE também aplica pedidos predefinidos a pods que não pedem explicitamente um destes recursos. Os valores específicos dos requisitos de recursos mínimos, máximos e predefinidos nas cargas de trabalho do GKE Autopilot variam consoante o tipo de hardware que os seus pods usam.
Para o armazenamento efémero, o valor predefinido se não pedir armazenamento efémero é o mesmo para todas as ComputeClasses e seleções de hardware. Para mais informações, consulte Pedidos de recursos predefinidos.
A tabela seguinte fornece links para os requisitos de CPU e memória dos seus pedidos de pods, consoante o tipo de hardware:
Tipo do recurso | Pedidos mínimos e máximos | Pedidos predefinidos |
---|---|---|
Pods de uso geralpodFamily regra de prioridade |
Consulte a linha "Uso geral" na tabela Mínimos e máximos para ComputeClasses. | Consulte a linha "Geral" na tabela Pedidos predefinidos para ComputeClasses. |
GPUs e TPUs | Depende do tipo e da quantidade de acelerador de hardware. Para mais informações, consulte Mínimos e máximos para a ComputeClass do acelerador. | Depende do tipo e da quantidade de acelerador de hardware. Para mais informações, consulte Pedidos predefinidos para aceleradores. |
Tipos de máquinas e famílias de máquinas específicos do Compute Engine |
|
Para qualquer tipo de máquina ou família de máquinas do Compute Engine, os pedidos predefinidos encontram-se na linha "Uso geral" na tabela Pedidos predefinidos para ComputeClasses. |
O que se segue?
- Implemente cargas de trabalho no modo Autopilot em clusters Standard
- Acerca das ComputeClasses personalizadas