Gemma 是来自 Google DeepMind 的全新的开放模型系列,现已在 GKE 中推出!
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
使用 Google Kubernetes Engine (GKE) 平台编排功能运行经过优化的 AI/机器学习工作负载。借助 Google Kubernetes Engine (GKE),您可以实现一个可直接用于生产环境的强大 AI/机器学习平台,并具备托管式 Kubernetes 的所有优势和以下功能:
- 支持使用 GPU 和 TPU 大规模训练和服务工作负载的基础设施编排。
- 与分布式计算和数据处理框架灵活集成。
- 在同一基础设施上支持多个团队,以最大限度地提高资源利用率。
本页面简要介绍了 GKE 的 AI/机器学习功能,以及如何开始使用 GPU、TPU 和 Hugging Face TGI、vLLM 和 JetStream 等框架在 GKE 上运行经过优化的 AI/机器学习工作负载。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2024-11-25。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2024-11-25。"],[],[]]