价格

Cloud Speech-to-Text 每月根据服务成功处理的音频时长进行计费,时长以 15 秒为增量计算(不足 15 秒按 15 秒计算)。

要在 Cloud Console 中查看当前结算状态(包括使用情况和当前帐单),请参阅“结算”页面。如需详细了解如何管理您的帐号,请参阅 Cloud Billing 文档结算和付款支持

价格表

功能 标准模型
(除视频和增强型电话以外的所有模型)
高级模型*
(视频和增强型电话)
0-60 分钟 60 分钟以上 - 100 万分钟 0-60 分钟 60 分钟以上 - 100 万分钟
语音识别(不启用数据日志记录功能 - 默认) 免费 $0.006/15 秒** 免费 $0.009/15 秒**
语音识别(启用数据日志记录功能,可选择启用) 免费 $0.004/15 秒** 免费 $0.006/15 秒**

* 高级模型目前仅提供美国英语版本。

** 每个请求的时长均以 15 秒为增量向上取整到最近的数字。

有两个主要因素影响 Cloud Speech-to-Text 的使用费:

  • 您使用的识别模型的类型(标准模型或高级模型)
  • 您是否选择启用了数据日志记录功能

Cloud Speech-to-Text 可使用多种不同类型的机器学习模型来识别语音。其中两种模型提供了更高的识别性能,分别是增强型电话和视频模型。这些模型均为特定用例量身定制,如果能合理使用,将能产生更优质量的结果。

客户可启用数据日志记录功能,以允许 Google 记录发送给 Cloud Speech-to-Text 的音频数据。这些数据可以帮助 Google 改进语音转录所用的机器学习模型。选择启用数据日志记录功能的客户可以获享更低的 Cloud Speech-to-Text 价格。

此价格适用于个人系统(例如手机、平板电脑、笔记本、台式机)上的应用。要在嵌入式设备(例如汽车、电视机、家电或音响设备)上使用 Speech-to-Text API,请与我们联系以获取批准并了解价格。

每个请求的时长均以 15 秒为增量向上取整到最近的数字。例如,如果您发出三个单独的请求(每个请求包含 7 秒音频),系统会按 45 秒(3 × 15 秒)的音频向您收取 $0.018 美元的费用。以 15 秒为增量向上取整到最近的数字时,秒数的小数部分也会纳入考虑范围。也就是说,15.14 秒将向上取整为 30 秒进行计费。

每月用量上限为 100 万分钟。如果您每月处理的音频时长超过 100 万分钟,请详细向我们介绍您的需求。为此,请为您的项目提交 Cloud Speech-to-Text 配额申请

Google Cloud Platform 费用

如果您将要识别的音频文件存储在 Google Cloud Storage 中,或者在使用 Cloud Speech-to-Text 的同时还使用了其他 Google Cloud Platform 资源(例如 Google App Engine 实例),那么您还需要支付使用这些服务所产生的费用。请使用 Google Cloud Platform 价格计算器确定当前费率下的其他费用。

此页内容是否有用?请给出您的反馈和评价:

发送以下问题的反馈:

此网页
Cloud Speech API 文档