设置 Speech-to-Text

Speech-to-Text 是一种由 Google 的人工智能 (AI) 技术提供支持的 API。您可以将音频数据发送到 Speech-to-Text,然后接收该音频数据的文字转录作为响应。

如需详细了解如何构造 Speech-to-Text 请求,请参阅请求页面。

概览

您必须先在 Google Cloud Console 中启用该 API,然后才能开始向 Speech-to-Text 发送请求。本页面中的步骤将引导您完成以下操作:

  • 在项目上启用 Speech-to-Text。
  • 确保已针对 Speech-to-Text 启用结算功能。
  • (可选)创建新的 Google Cloud Storage 存储桶以存储您的音频数据。

准备工作

访问该服务的方法有两种:使用 REST API,或使用 Speech-to-Text 控制台。我们提供代码示例,展示如何向 REST API 发出请求并接收响应。您可以按照 Speech-to-Text 快速入门方法指南中的说明,了解如何使用这些示例。如果您希望只需编写极少量的代码便可使用 Speech-to-Text,则可以使用 Cloud Speech-to-Text 控制台

本指南将引导您完成开始向 REST API 发送请求所需的步骤。如果您刚接触编码,我们建议您从 Google Cloud Platform 中的分步控制台教程开始,然后再开始学习本快速入门。

为 Speech-to-Text 设置 Google Cloud 项目

  1. 登录 Google Cloud 控制台

  2. 转到项目选择器页面

    您可以选择现有项目,也可以创建一个新项目。如需详细了解如何创建项目,请参阅创建和管理项目

  3. 如果您创建新项目,则系统会提示您将一个结算账号关联到该项目。如果您使用的是现有项目,请确保已启用结算功能。

    了解如何确认项目已启用结算功能

  4. 选择项目并将其关联到结算账号后,您就可以启用 Speech-to-Text API。转到页面顶部的搜索产品和资源栏,然后输入“speech”。从结果列表中选择 Cloud Speech-to-Text API

  5. 要在不将其与项目关联的情况下试用 Speech-to-Text,请选择试用此 API 选项。如需启用 Speech-to-Text API 以用于您的项目,请点击启用

  6. (可选)启用数据日志记录。选择启用数据日志记录,即表示您允许 Google 记录您发送到 Speech-to-Text 的所有音频数据。此数据将用于改进 Speech-to-Text 模型。选择启用数据日志记录功能的用户可以获享更低的产品价格。如需了解详情,请参阅价格和数据日志记录条款及条件页面。

可选:创建 Cloud Storage 存储桶

如需转录超过 60 秒的音频或文件大小大于 10 MB 的音频,您必须先将音频数据存储在 Cloud Storage 存储桶中,然后才能使用 Speech-to-Text 进行转录。以下步骤将引导您完成创建新存储桶的过程。

  • 在 Google Cloud 控制台中,进入 Cloud Storage 存储桶页面。

    进入“存储桶”页面

  • 点击创建存储分区
  • 创建存储分区页面上,输入您的存储分区信息。要转到下一步,请点击继续
    • 指定存储分区的名称中,输入唯一的存储分区名称。请勿在存储分区名称中添加敏感信息,因为存储分区命名空间是全局性的,公开可见。
    • 对于选择数据存储位置,执行以下操作:
      • 选择位置类型选项。
      • 选择位置选项。
    • 对于为数据选择一个默认存储类别,请选择一个存储类别
    • 对于选择如何控制对象的访问权限,请选择访问权限控制选项。
    • 对于高级设置(可选),请指定加密方法保留政策存储分区标签
  • 点击创建
  • 停用 Speech-to-Text API

    如果您将来不再需要使用 Speech-to-Text API,请完成以下步骤。

    1. 导航到 Google Cloud 信息中心,然后点击 API 框中的转到 API 概览链接。
    2. 选择 Cloud Speech-to-Text API
    3. 点击 Cloud Speech-to-Text API 页面顶部的停用 API 按钮。

    后续步骤

    了解如何使用客户端库gcloud命令行Speech-to-Text 界面向 Speech-to-Text API 发送转录请求。