このページでは、Vertex AI Studio を使用して音声をテキストに変換する方法について説明します。
テキストを音声に変換する方法については、テキストを音声に変換するをご覧ください。
音声をテキストに変換する
音声をテキストに変換する手順は次のとおりです。
Google Cloud コンソールの [Vertex AI] セクションで、[Vertex AI Studio] ページに移動します。
[音声を生成] をクリックします。
[Speech-to-Text] タブを選択します。
[音声] で [参照] をクリックして、テキストに変換する音声ファイルを選択します。
[言語] セレクタ ボックスで、音声ファイルの音声の言語を選択します。
[送信] をクリックします。
変換されたテキストが [テキスト] に表示されます。
制限事項
- 音声ファイルの最大サイズは 60 秒または 10 MB(どちらか短いほう)です。
- ファイルの音声文字変換は Chirp モデルを使用して行われます。
- 16 ビットリニア PCM WAV ファイルのみがサポートされています。
Speech-to-Text UI を直接使用すると、これらの制限を克服できます。
次のステップ
- その他のモデル、高度な機能、最大 8 時間のファイルの音声文字変換機能については、Speech-to-Text をご覧ください。