使用 Google Kubernetes Engine (GKE) 平台编排功能运行经过优化的 AI/机器学习工作负载。借助 Google Kubernetes Engine (GKE),您可以实现一个可直接用于生产环境的强大 AI/机器学习平台,并具备托管式 Kubernetes 的所有优势和以下功能:

  • 支持使用 GPU 和 TPU 大规模训练和服务工作负载的基础设施编排。
  • 与分布式计算和数据处理框架灵活集成。
  • 在同一基础设施上支持多个团队,以最大限度地提高资源利用率。
本页面简要介绍了 GKE 的 AI/机器学习功能,以及如何使用 GPU、TPU 以及 Hugging Face TGI、vLLM 和 JetStream 等框架在 GKE 上运行经过优化的 AI/机器学习工作负载。
免费开始使用

获享 $300 免费赠金开始概念验证

  • 体验 Gemini 2.0 Flash Thinking
  • 免费使用热门产品(包括 AI API 和 BigQuery)的每月用量
  • 不会自动收费,无需承诺
查看免费产品优惠

继续探索 20 多种提供“始终免费”用量的产品

使用适用于常见应用场景(包括 AI API、虚拟机、数据仓库等)的 20 多种免费产品。

探索 Google Cloud Skills Boost 中的自主培训、应用场景、参考架构和代码示例,并了解有关如何使用和连接 Google Cloud 服务的示例。

相关视频