Execute cargas de trabalho de IA/ML otimizadas com os recursos de orquestração da plataforma do Google Kubernetes Engine (GKE). Com o Google Kubernetes Engine (GKE), é possível implementar uma plataforma de IA/ML robusta e pronta para produção com todos os benefícios do Kubernetes gerenciado e os seguintes recursos:

  • Orquestração de infraestrutura compatível com GPUs e TPUs para treinamento e disponibilização de cargas de trabalho em escala.
  • Integração flexível com frameworks de processamento de dados e computação distribuída
  • Suporte para várias equipes na mesma infraestrutura para maximizar a utilização de recursos
Esta página oferece uma visão geral dos recursos de IA/ML do GKE e como começar a executar cargas de trabalho otimizadas de IA/ML no GKE com GPUs, TPUs e frameworks, como TGI do Hugging Face, vLLM e JetStream.

Recursos de documentação

Encontre guias de início rápido, consulte referências de chaves e receba ajuda para problemas comuns.
Conheça o treinamento autoguiado do Google Cloud Skills Boost, os casos de uso, as arquiteturas de referência e os exemplos de código com exemplos de como usar e conectar os serviços do Google Cloud.

Vídeos relacionados

*Summary:* Mike Orosz, CISO at Vertiv, shares how the critical infrastructure solutions provider enhanced its security operations workflows with Google Cloud. Using Google Security Operations, Vertiv has accelerated and automated threat detection,

Discover essential strategies for safeguarding sensitive data in AI applications on this episode of Serverless Expeditions. Join Martin Omander and Aron Eidelman as they explore key concepts, best practices, and tools for protecting data throughout

BigQuery pipe syntax documentation → https://goo.gle/4dFaZrB Pipe syntax examples and reference guide → https://goo.gle/3U1wcF3 Blog: Introducing pipe syntax in BigQuery and Cloud Logging → https://goo.gle/3ZUr75l Writing complex SQL queries can be