预配吞吐量概览
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
本页面介绍了预分配吞吐量是什么以及何时使用它。
预配吞吐量简介
预配置吞吐量是一种按固定费用收取的月度或周度订阅服务,可为 Vertex AI 上受支持的生成式 AI 模型预留吞吐量。如需预留吞吐量,您必须指定模型以及模型运行的可用位置。
何时使用预配吞吐量
如果您的用例符合以下任何注意事项,请考虑使用预分配吞吐量:
- 您要构建实时生成式 AI 生产应用,例如聊天机器人和代理。
- 您的关键工作负载始终需要高吞吐量。吞吐量测量取决于模型。
- 您希望为应用用户提供一致且可预测的体验。
- 您希望通过支付每月或每周固定价格来控制超额费用,从而实现确定性的生成式 AI 费用。
预配的吞吐量是使用生成式 AI 模型的两种方式之一。第二种方式是按用量付费,也称为按需付费。
后续步骤
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-03-12。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-03-12。"],[],[]]