Speech-to-Text RPC API リファレンス

これは Speech-to-Text の gRPC API リファレンスです。これは、Google Distributed Cloud エアギャップ アプライアンス(GDC)で利用できる Vertex AI 事前トレーニング済み API の 1 つです。

このガイドでは、音声認識技術をデベロッパーのアプリケーションにプログラムで統合する方法について説明します。Vertex AI Speech-to-Text API サービスに音声を送信すると、文字変換されたテキストを受け取ることができます。たとえば、スペイン語で音声を送信すると、スペイン語の対応するテキスト文字起こしが結果として返されます。

Speech-to-Text メソッド

GDC では次の 2 つの方法を使用できます。

  • 認識: 同期音声認識を実行します。Recognize は、すべての音声が送信されて処理された後に結果を受け取ります。
  • StreamingRecognize: 双方向ストリーミング音声認識を実行します。StreamingRecognize は、音声を送信しながら結果を受け取ります。