音声入力

このページでは、Vertex AI Studio を使用して音声をテキストに変換する方法について説明します。

テキストを音声に変換する方法については、テキストを音声に変換するをご覧ください。

音声をテキストに変換する

音声をテキストに変換する手順は次のとおりです。

  1. Google Cloud コンソールの [Vertex AI Studio] セクションで、[Vertex AI Studio] ページに移動します。

    Vertex AI Studio に移動

  2. [音声] カードで [開く] をクリックします。

  3. [Speech-to-Text] タブを選択します。

  4. [音声] で [参照] をクリックして、テキストに変換する音声ファイルを選択します。

  5. [言語] セレクタ ボックスで、音声ファイルの音声の言語を選択します。

  6. [送信] をクリックします。

    変換されたテキストが [テキスト] に表示されます。

制限事項

  • 音声ファイルの最大サイズは 60 秒または 10 MB(どちらか短いほう)です。
  • ファイルの音声文字変換は Chirp モデルを使用して行われます。
  • 16 ビットリニア PCM WAV ファイルのみがサポートされています。

Speech-to-Text UI を直接使用すると、これらの制限を克服できます。

次のステップ

  • その他のモデル、高度な機能、最大 8 時間のファイルの音声文字変換機能については、Speech-to-Text をご覧ください。