Execute cargas de trabalho de IA/ML otimizadas com os recursos de orquestração da plataforma do Google Kubernetes Engine (GKE). Com o Google Kubernetes Engine (GKE), é possível implementar uma plataforma de IA/ML robusta e pronta para produção com todos os benefícios do Kubernetes gerenciado e os seguintes recursos:

  • Orquestração de infraestrutura compatível com GPUs e TPUs para treinamento e disponibilização de cargas de trabalho em escala.
  • Integração flexível com frameworks de processamento de dados e computação distribuída
  • Suporte para várias equipes na mesma infraestrutura para maximizar a utilização de recursos
Esta página oferece uma visão geral dos recursos de IA/ML do GKE e como começar a executar cargas de trabalho otimizadas de IA/ML no GKE com GPUs, TPUs e frameworks, como TGI do Hugging Face, vLLM e JetStream.

Recursos de documentação

Encontre guias de início rápido, consulte referências de chaves e receba ajuda para problemas comuns.
Conheça o treinamento autoguiado do Google Cloud Skills Boost, os casos de uso, as arquiteturas de referência e os exemplos de código com exemplos de como usar e conectar os serviços do Google Cloud.

Vídeos relacionados