价格

Speech-to-Text 基于服务成功处理的音频数量(以向上舍入为 15 秒的增量计量)按月收费。

下面的价格表适用于个人系统(例如手机、平板电脑、笔记本电脑和桌面设备)上的应用。如需在嵌入式设备(例如汽车、电视机、家电或音响设备)上使用 Speech-to-Text API,请与我们联系以获取批准并了解价格。

您可以在 Cloud Console 中查看当前结算状态,包括用量和当前帐单。如需详细了解如何管理您的帐号,请参阅 Cloud Billing 文档结算和付款支持

价格表

功能 标准模型
(除增强型视频和电话之外的所有模型)
增强型模型
(视频、电话)
0-60 分钟 60 分钟以上 - 100 万分钟 0-60 分钟 60 分钟以上 - 100 万分钟
语音识别(不启用数据日志记录功能 - 默认) 免费 $0.006/15 秒** 免费 $0.009/15 秒**
语音识别(启用数据日志记录功能) 免费 $0.004/15 秒** 免费 $0.006/15 秒**

** 每个请求的时长均以 15 秒为增量向上取整到最近的数字。

价格要素

Speech-to-Text 的价格取决于以下因素:

增强型模型

Speech-to-Text 提供多种可用于语音识别的机器学习模型。其中两种模型(增强型电话模型和视频模型)是为各自的使用场景量身定制的,可提供更高的识别性能;如果合理使用,将能产生更优品质的结果。如需了解增强型模型是否支持您的语言,请参阅受支持的语言页面。

数据日志记录

通过选择启用数据日志记录,您可以允许 Google 记录发送至 Speech-to-Text 的音频数据。这些数据可帮助 Google 改进语音转录所用的机器学习模型。选择启用数据日志记录功能的客户可以获享更低的 Speech-to-Text 价格。

多通道

每个音频通道均单独结算。如果您发送包含多个通道的请求,则系统将根据所处理的所有通道中的音频总时长向您收取费用。该时间计费与每月使用量限额的跟踪方式不同。用量限额不考虑多个通道,仅由音频文件的时长决定。例如,如果您发送了一个包含 30 秒音频和 4 个通道的请求,系统将向您收取 120 秒的费用,但只有 30 秒会计入您的每月配额。如需了解详情,请参阅配额和限制页面。

价格计算

每个请求的时长均以 15 秒为增量向上取整到最近的数字。例如,如果您发出三个单独的请求,每个请求包含 7 秒音频,系统会按 45 秒(3 × 15 秒)的音频向您收取 $0.018 美元的费用。以 15 秒为增量向上舍入到最近的数字时,秒数的小数部分也会纳入考虑。也就是说,15.14 秒将向上取整为 30 秒进行计费。

每月用量上限为 100 万分钟。如果您每月使用的音频超过 100 万分钟,请详细向我们告知您的需求。为此,请为您的项目提交 Speech-to-Text 配额申请

Google Cloud Platform 费用

如果您在 Google Cloud Storage 中存储要识别的音频文件,或者使用 Speech-to-Text 的同时还使用了其他 Google Cloud Platform 资源(例如 Google App Engine 实例),则您还需要支付使用这些服务所产生的费用。请使用 Google Cloud Platform 价格计算器确定当前费率下的其他费用。