English
Deutsch
Español
Español – América Latina
Français
Indonesia
Italiano
Português
Português – Brasil
中文 – 简体
中文 – 繁體
日本語
한국어

コンソール

お問い合わせ無料で利用開始

音声をテキストに変換する

このページでは、Vertex AI Studio を使用して音声をテキストに変換する方法について説明します。

テキストを音声に変換する方法については、テキストを音声に変換するをご覧ください。

音声をテキストに変換する

音声をテキストに変換する手順は次のとおりです。

Google Cloud コンソールの [Vertex AI] セクションで、[Vertex AI Studio] ページに移動します。

Vertex AI Studio に移動
[音声を生成] をクリックします。
[Speech-to-Text] タブを選択します。
[音声] で [参照] をクリックして、テキストに変換する音声ファイルを選択します。
[言語] セレクタボックスで、音声ファイルの音声の言語を選択します。
[送信] をクリックします。

変換されたテキストが [テキスト] に表示されます。

制限事項

音声ファイルの最大サイズは 60 秒または 10 MB（どちらか短いほう）です。
ファイルの音声文字変換は Chirp モデルを使用して行われます。
16 ビットリニア PCM WAV ファイルのみがサポートされています。

Speech-to-Text UI を直接使用すると、これらの制限を克服できます。

次のステップ

その他のモデル、高度な機能、最大 8 時間のファイルの音声文字変換機能については、Speech-to-Text をご覧ください。

特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。

最終更新日 2025-10-19 UTC。