Com a ativação do Autopilot nos contêineres, você executa as cargas de trabalho da sua empresa em escala de forma segura, mesmo com pouca ou nenhuma experiência em Kubernetes.
Receba um cluster zonal ou do Autopilot sem custos financeiros por mês. Além disso, novos clientes recebem US$ 300 em créditos para testar o GKE.
Recursos
O Autopilot do GKE é um modo de operações práticas que gerencia a computação do cluster, sem necessidade de configuração e monitoramento. Com o dimensionamento automático da capacidade e o preço por pod, você evita o superprovisionamento, o pagamento excessivo e a subutilização. Com a computação otimizada para contêineres do Autopilot, você tem computação escalonável vertical e horizontalmente quase em tempo real, que fornece a capacidade necessária, quando necessário, com o melhor preço e desempenho.
Com suporte para clusters de até 65 mil nós, integração com o Hipercomputador de IA e suporte a GPU e TPU, o GKE facilita a execução de ML, HPC e outras cargas de trabalho que se beneficiam de aceleradores de hardware especializados.
Os recursos de inferência do GKE com técnicas de escalonamento e balanceamento de carga compatíveis com IA generativa ajudam a reduzir os custos de veiculação em mais de 30%, a latência de cauda em 60% e a aumentar a capacidade de processamento em até 40% em comparação com outras ofertas gerenciadas e de código aberto do Kubernetes.
O GKE oferece segurança em escala com práticas recomendadas integradas, infraestrutura em conformidade e alertas em tempo real, para que você possa mitigar rapidamente ameaças de segurança e problemas de conformidade em uma visualização unificada.
Com o apoio de uma equipe de segurança do Google com mais de 750 especialistas, a postura de segurança integrada do GKE inclui aplicação de patches e reforço da proteção, isolamento e segmentação, Confidential GKE Node, gerenciamento de identidade e acesso e integrações com o Cloud Logging e o Cloud Monitoring.
Além disso, com o GKE Sandbox, você pode adicionar uma segunda camada de defesa entre as cargas de trabalho conteinerizadas no GKE para aumentar a segurança delas.
As frotas e as equipes podem ser usadas para organizar clusters e cargas de trabalho e atribuir recursos a várias equipes com facilidade para melhorar a velocidade e delegar propriedade. Usando os escopos, é possível definir subconjuntos de recursos da frota por equipe, com cada escopo associado a um ou mais clusters de membros da frota.
É possível escolher vários clusters para separar serviços entre ambientes, níveis, localidades, equipes ou provedores de infraestrutura. As frotas se esforçam para facilitar ao máximo o gerenciamento de vários clusters.
O GKE executa o Kubernetes certificado e adota padrões abertos para permitir que os clientes executem os aplicativos sem modificações nos investimentos de hardware no local ou na nuvem pública.
Com os clusters anexados do GKE, é possível registrar ou anexar qualquer cluster do Kubernetes em conformidade que você tenha criado no ambiente de gerenciamento do GKE. Anexar um cluster oferece gerenciamento e controle do GKE, bem como acesso a recursos adicionais como Config Sync, Cloud Service Mesh e Frotas.
Como funciona
Em cada cluster do GKE, o GKE gerencia o ciclo de vida do plano de controle do Kubernetes, desde a criação até a exclusão do cluster. Com o GKE Autopilot, o GKE também pode gerenciar seus nós, incluindo provisionamento, escalonamento e programação automatizados. Ou você pode escolher ter mais controle e gerenciar os nós por conta própria.
Usos comuns
Crie uma plataforma de desenvolvimento empresarial para entrega rápida e confiável de apps
O Google Cloud oferece um conjunto abrangente de serviços gerenciados e ambientes de execução que atuam como elementos básicos para sua plataforma, para que você possa encontrar a combinação certa de serviços para seus casos de uso. A integração profunda do GKE com o ecossistema do Google Cloud, a escalonabilidade incomparável e a postura de segurança integrada o tornam uma base ideal para sua plataforma.
Crie uma plataforma de desenvolvimento empresarial para entrega rápida e confiável de apps
O Google Cloud oferece um conjunto abrangente de serviços gerenciados e ambientes de execução que atuam como elementos básicos para sua plataforma, para que você possa encontrar a combinação certa de serviços para seus casos de uso. A integração profunda do GKE com o ecossistema do Google Cloud, a escalonabilidade incomparável e a postura de segurança integrada o tornam uma base ideal para sua plataforma.
Implantar inferência de IA generativa com o GKE
O GKE não apenas fornece uma plataforma para IA, mas também simplifica e automatiza as operações do Kubernetes com IA. Com suporte para até 65 mil nós e integração com o AI Hypercomputer, você pode treinar e escalonar seus maiores modelos de IA generativa no GKE.
Além disso, os recursos de inferência com reconhecimento de IA generativa do GKE oferecem custos de disponibilização até 30% menores, latência de cauda 60% menor e capacidade de processamento 40% maior do que o OSS K8s.
Implantar inferência de IA generativa com o GKE
O GKE não apenas fornece uma plataforma para IA, mas também simplifica e automatiza as operações do Kubernetes com IA. Com suporte para até 65 mil nós e integração com o AI Hypercomputer, você pode treinar e escalonar seus maiores modelos de IA generativa no GKE.
Além disso, os recursos de inferência com reconhecimento de IA generativa do GKE oferecem custos de disponibilização até 30% menores, latência de cauda 60% menor e capacidade de processamento 40% maior do que o OSS K8s.
Implantar e orquestrar aplicativos multiagente
A IA agêntica se concentra na orquestração e execução de agentes que usam LLMs como um "cérebro" para realizar ações por meio de ferramentas.
O GKE é a plataforma aberta definitiva para oferecer suporte a agentes e orquestrar sua computação, para que você possa adotar a próxima geração de cargas de trabalho de IA baseadas em agentes.
Implantar e orquestrar aplicativos multiagente
A IA agêntica se concentra na orquestração e execução de agentes que usam LLMs como um "cérebro" para realizar ações por meio de ferramentas.
O GKE é a plataforma aberta definitiva para oferecer suporte a agentes e orquestrar sua computação, para que você possa adotar a próxima geração de cargas de trabalho de IA baseadas em agentes.
Preços
Como funcionam os preços do GKE | Depois que os créditos gratuitos forem usados, o custo total será baseado no modo de operação do cluster e nas taxas de gerenciamento de clusters e de transferência de dados de entrada aplicáveis. | |
---|---|---|
Serviço | Descrição | Preço (US$) |
Nível gratuito | O nível gratuito do GKE oferece US$ 74,40 em créditos mensais para cada conta de faturamento aplicada a clusters zonais e do Autopilot. | Grátis |
Taxa de gerenciamento de clusters | Inclui gerenciamento totalmente automatizado do ciclo de vida dos clusters, escalonamento automático de pods e clusters, visibilidade de custos, otimização automatizada de custos da infraestrutura e recursos de gerenciamento multicluster, sem custo extra. | US$ 0,10 por cluster a cada hora |
Computação | Ao usar o Autopilot, você paga apenas pela CPU, memória e recursos de computação provisionados para seus pods. Para pools de nós e classes de computação que não usam o Autopilot, você recebe cobranças pelas instâncias do Compute Engine dos nós até que eles sejam excluídos. | Consulte os preços do Compute Engine |
Saiba mais sobre os preços do GKE Confira todos os detalhes de preços.
Como funcionam os preços do GKE
Depois que os créditos gratuitos forem usados, o custo total será baseado no modo de operação do cluster e nas taxas de gerenciamento de clusters e de transferência de dados de entrada aplicáveis.
O nível gratuito do GKE oferece US$ 74,40 em créditos mensais para cada conta de faturamento aplicada a clusters zonais e do Autopilot.
Grátis
Taxa de gerenciamento de clusters
Inclui gerenciamento totalmente automatizado do ciclo de vida dos clusters, escalonamento automático de pods e clusters, visibilidade de custos, otimização automatizada de custos da infraestrutura e recursos de gerenciamento multicluster, sem custo extra.
US$ 0,10
por cluster a cada hora
Ao usar o Autopilot, você paga apenas pela CPU, memória e recursos de computação provisionados para seus pods.
Para pools de nós e classes de computação que não usam o Autopilot, você recebe cobranças pelas instâncias do Compute Engine dos nós até que eles sejam excluídos.
Consulte os preços do Compute Engine
Saiba mais sobre os preços do GKE Confira todos os detalhes de preços.
Caso de negócios
10 anos e contando: por que a Signify escolheu o GKE
Com o GKE como base, a plataforma Philips Hue escalonou a infraestrutura para oferecer suporte a um aumento de 1.150% em transações e comandos na última década.
Desbloqueie a inovação em IA no GKE
A Moloco, provedora de publicidade com tecnologia de IA, consegue tempos de treinamento de modelo 10 vezes mais rápidos com TPUs no GKE.
Com as TPUs no GKE, a HubX reduz a latência em até 66%, o que melhora a experiência do usuário e aumenta as taxas de conversão.
A LiveX AI alcança mais de 50% de redução no TCO, 25% de aceleração no tempo de lançamento no mercado e 66% de redução no custo operacional com o Autopilot do GKE.