Speech-to-Text 价格

Speech-to-Text 基于服务成功处理的音频数量(以 1 秒为增量计算)每月计费。 如果 API 返回响应,则表示请求中发送的音频已成功处理。这包括空响应,这表示 API 已处理了音频,但无法转录音频。导致服务器错误的请求不会被视为成功处理,因此不会产生任何费用。

您可以在 Google Cloud 控制台中查看当前结算状态,包括用量和当前账单。如需详细了解如何管理您的账号,请参阅 Cloud Billing 文档结算和付款支持

价格表

下表中的价格适用于 Speech-to-Text V1 API 每月处理的音频分钟数。

Category 模型 价格
0-60 分钟/月 60 分钟以上/月
语音识别(不进行数据日志记录 - 默认) 标准 1 免费 $0.024 / 分钟 **
医疗 2 免费 $0.078 / 分钟 **
语音识别(选择启用数据日志记录) 标准 1 免费 $0.016 / 分钟 **

下表中的价格适用于 Speech-to-Text V2 API 每月处理的音频分钟数。

Category 模型 价格
0-50 万分钟 / 月 每月 50 万-100 万分钟 每月 100 万-200 万分钟 每月 200 万分钟以上
语音识别(默认) 标准 1 $0.016 / 分钟 ** $0.010 / 分钟 ** $0.008 / 分钟 ** $0.004 / 分钟 **
医疗 2 $0.078 / 分钟 ** $0.078 / 分钟 ** $0.078 / 分钟 ** $0.078 / 分钟 **
动态批量语音识别 标准 1 $0.003 / 分钟 ** $0.003 / 分钟 ** $0.003 / 分钟 ** $0.003 / 分钟 **

Standard1 模型包括:defaultcommand_and_searchlatest_shortlatest_longphone_callvideochirp(仅限 Speech-to-Text V2)。
Medical2 模型包括:medical_conversationmedical_dictation

** 每个请求的时长均以 1 秒为增量向上取整到最近的数字。

价格要素

Speech-to-Text 的价格取决于以下因素:

* 要识别的音频中的声道数量。 * 您发送的音频的长度和数量。 * 您所使用的识别模型。 * 您使用的批处理方法。 * 您所使用的 API 版本。

多通道

每个音频通道均单独结算。如果您发送包含多个通道的请求,则系统将根据所处理的所有通道中的音频总时长向您收取费用。该时间计费与每月使用量限额的跟踪方式不同。用量限额不考虑多个通道,仅由音频文件的时长决定。例如,如果您发送了一个包含 30 秒音频和 4 个通道的请求,系统将向您收取 120 秒的费用,但只有 30 秒会计入您的每月配额。如需了解详情,请参阅配额和限制页面。

动态批次

Speech-to-Text V2 API 有一个使用动态批处理的选项。动态批处理处理音频的紧急程度较低。如果您启用了动态批次,则需要按折扣费率付费。

大型工作负载

对于工作负载非常庞大的客户,可能还享有额外的批量折扣。如需了解详情,请与销售人员联系

Google Cloud Platform 费用

如果您在 Google Cloud Storage 中存储要识别的音频文件,或者使用 Speech-to-Text 的同时还使用了其他 Google Cloud Platform 资源(例如 Google App Engine 实例),则您还需要支付使用这些服务所产生的费用。请使用 Google Cloud Platform 价格计算器确定当前费率下的其他费用。

后续步骤

申请自定义报价

Google Cloud 采用随用随付的价格模式,您只需为实际使用的服务付费。请与我们的销售团队联系,获取为贵组织量身定制的报价。
与销售人员联系