使用控制台根据文本创建音频

此快速入门为您介绍 Cloud Text-to-Speech 控制台。在本快速入门中,您将根据文本创建音频,并了解如何为自己的应用播放、下载和更新此音频。

如需详细了解 Text-to-Speech 中的基本概念,请阅读 Text-to-Speech 基础知识

准备工作

您必须先在 Google Cloud 控制台中启用此 API,然后才能开始使用 Text-to-Speech 控制台。以下步骤将引导您完成后续操作:

  • 在项目上启用 Text-to-Speech。
  • 确保已为 Text-to-Speech 启用结算功能。

设置您的 Google Cloud 项目

  1. 登录 Google Cloud 控制台

  2. 转到项目选择器页面

    您可以选择现有项目,也可以创建一个新项目。如需详细了解如何创建项目,请参阅 Google Cloud Platform 文档

  3. 如果您创建新项目,则系统会提示您将一个结算账号关联到该项目。如果您使用的是现有项目,请确保已启用结算功能。

    了解如何确认项目已启用结算功能

  4. 选择项目并将其关联到结算账号后,您就可以启用 Text-to-Speech API。转到页面顶部的搜索产品和资源栏,然后输入“文字转语音”

  5. 从结果列表中选择 Cloud Text-to-Speech API

  6. 如果您想先试用 Text-to-Speech 而不将其与项目关联,请选择试用此 API 选项。如需启用 Text-to-Speech API 以与项目搭配使用,请点击启用

根据文本创建音频

使用 Google Cloud 控制台根据文本创建音频:

输入文本或 SSML

  1. 打开 Text-to-Speech 合成页面。

    “Text-to-Speech 合成”页面的屏幕截图。

  2. 输入您的文本或 SSML。您可以合成纯文本,也可以使用语音合成标记语言 (SSML) 以便可在音频响应中进行更多自定义操作。

  3. 选择文本或 SSML 的语言。这是将用于合成的语言。

  4. 选择要用于合成的语音。请注意,语音功能、特征和费用各不相同。

高级设置(可选)

  1. (可选)展开高级设置部分,以配置您将创建的音频的更多属性。

  2. 指定合成音频的其他特征,例如语音音高

    “Text-to-Speech 合成”页面第 2 部分的屏幕截图。

  3. 点击底部的合成以创建合成音频。

查看音频

合成音频可能需要几秒钟到几分钟才能创建完毕,具体取决于您的输入。创建音频后,即可进行查看。

  1. 点击播放器控件以播放音频。

    “Text-to-Speech 合成”页面第 3 部分的屏幕截图。

  2. 点击下载以在本地下载音频文件。

清理

为避免产生不必要的 Google Cloud 费用,请使用 Google Cloud 控制台删除您不需要的项目。

后续步骤