使用 Hugging Face TGI 在 Cloud Run GPU 上运行 LLM 推理
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
以下示例展示了如何运行后端服务,该服务运行 Hugging Face 文本生成推理 (TGI) 工具包,该工具包用于部署和应用大语言模型 (LLM)。
如需查看完整示例,请参阅在 Cloud Run 上部署包含 TGI DLC 的 Llama 3.1 8B。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-02-14。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-02-14。"],[],[]]