单可用区预配吞吐量
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
借助单可用区预配吞吐量功能,您可以在仅有一个
可用区的特定区域预留吞吐量。此选项可为需要进行机器学习处理的应用场景中的 Gemini 模型提供可预测的性能。
如需查看支持的模型及区域的列表,请参阅部署和端点。如需查看支持机器学习处理的区域及模型的列表,请参阅机器学习处理。
单可用区预配吞吐量功能的特性
本部分概述了单可用区预配吞吐量功能的主要特性:
价格及计量单位与标准预配吞吐量保持一致:单可用区预配吞吐量使用与标准预配吞吐量相同的吞吐量计量单位 (GSU)、价格和条款。
单可用区预配吞吐量支持区域内机器学习处理:所有请求都在购买区域内处理,包括超出所购买吞吐量金额部分的流量。此部分流量将使用相应区域中的缓冲容量,按随用随付费率计费。
您可以控制超额流量:您可以像使用标准预配吞吐量一样,用相同的标头控制溢出流量。
您可以监控订单:您可以使用现有的预配吞吐量监控功能来监控单可用区预配吞吐量订单。
限制
单可用区预配吞吐量存在以下局限性:
购买单可用区预配吞吐量
如需获得购买单可用区预配吞吐量方面的帮助,请与您的 Google Cloud 客户代表联系。
后续步骤
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-08-04。
[[["易于理解","easyToUnderstand","thumb-up"],["解决了我的问题","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["很难理解","hardToUnderstand","thumb-down"],["信息或示例代码不正确","incorrectInformationOrSampleCode","thumb-down"],["没有我需要的信息/示例","missingTheInformationSamplesINeed","thumb-down"],["翻译问题","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["最后更新时间 (UTC):2025-08-04。"],[],[],null,[]]