将语音转成文字

本页面介绍如何使用 Vertex AI Studio 将语音转成文字。

如需了解如何将文字转成语音,请参阅将文字转成语音

将语音转成文字

如需将语音转成文字,请执行以下操作:

  1. 在 Google Cloud 控制台的“Vertex AI”部分,进入 Vertex AI Studio 页面。

    进入 Vertex AI Studio

  2. 语音卡片中,点击打开

  3. 选择语音转文字标签页。

  4. 语音中,点击浏览以选择要转成文字的音频文件。

  5. 语言选择器框中,选择音频文件中的语音语言。

  6. 点击提交

    转换后的文字会显示在文字中。

限制

  • 音频文件不得超过 60 秒或 10 MB(以较小者为准)。
  • 文件使用 Chirp 模型进行转写。
  • 仅支持 16 位线性 PCM WAV 文件。

您可以直接使用 Speech-to-Text 界面来突破这些限制。

后续步骤

  • 如需了解更多模型、高级功能以及最多可转写 8 小时的文件的功能,请参阅 Speech-to-Text