割り当てと上限

このドキュメントでは、Cloud Speech-to-Text の使用に関する API の現在の制限事項と使用量上限について説明します。これらの制限事項や使用量上限に変更があったときは、このページにもその変更が反映されます。Google は、このような制限事項をいつでも変更できる権限を有します。

必要な場合は、割り当ての増加をリクエストできます。割り当ての確認と管理に関する詳細については、Google Cloud の割り当てページをご覧ください。

リクエスト送信後に、Google から詳細について確認させていただく場合があります。リクエストの承認または却下の結果については、追ってお知らせいたします。

コンテンツの上限

Speech-to-Text のコンテンツは、リクエストの content フィールド内で音声データとして直接提供されるか、リクエストの uri フィールドの Google Cloud Storage URI で音声データとして参照されます。ローカル ファイルを使用して API に送信されるすべての単一リクエストに対して 10 MB の上限があります。Recognize メソッドと LongRunningRecognize メソッドの場合、この上限は送信されるリクエストのサイズに適用されます。StreamingRecognize メソッドの場合、10 MB の上限は、最初の StreamingRecognize リクエストとストリーム内の各メッセージのサイズの両方に適用されます。この上限を超えると、エラーがスローされます。Google Cloud Storage バケットに保存されている音声データを使用して送信されるリクエストにはサイズ上限はありません。

この API では、このコンテンツのサイズに次の上限が適用されます(変更される場合があります)。

コンテンツの上限 音声の長さの上限
同期リクエスト 約 1 分
非同期リクエスト 約 480 分*
ストリーミング リクエスト 約 5 分**

* 約 1 分よりも長い音声データの場合、uri フィールドを使用して Google Cloud Storage 内の音声ファイルを参照する必要があります。
** コンテンツを 5 分以上ストリーミングする必要がある場合は、エンドレス ストリーミングのチュートリアルをご覧ください。

StreamingRecognizeリクエストの場合、ほぼリアルタイムのレートで音声を送信する必要があります。

これらの上限を超えるコンテンツを処理しようとすると、エラーが発生します。

任意のリクエスト内で、そのリクエストに固有のフレーズのリストを含む SpeechContext リソースを一緒に指定できます(このコンテキストでは 1 つの単語が 1 フレーズとしてカウントされます)。このようなコンテキストには次の上限が適用されます。

SpeechContext の上限 上限値
1 リクエストあたりのフレーズ数 5,000
1 リクエストあたりの合計文字数 100,000
1 フレーズあたりの文字数 100

リクエストの上限

Speech-to-Text に対する API の現在の使用量上限は次のとおりです(変更されることがあります)。

上限のタイプ 使用量上限
60 秒あたりのリクエスト数* 900
1 日あたりの処理量 480 時間の音声

* 各 StreamingRecognize セッションは、ストリーム内に StreamingRecognizeRequest 音声の複数フレームが含まれる場合でも、1 つのリクエストと見なされます。

これらの上限を超える音声処理のリクエストまたは試行を行うと、エラーが発生します。

これらの上限は各 Speech-to-Text デベロッパー プロジェクトに適用され、そのデベロッパー プロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。