割り当てと上限

このドキュメントでは、Speech-to-Text に適用される割り当てと上限について説明します。

割り当ては、Google Cloud プロジェクトで使用できる共有 Google Cloud リソース(ハードウェア、ソフトウェア、ネットワーク コンポーネントなど)の量を制限します。つまり、割り当てはシステムの一部で、次の機能があります。

  • Google Cloud のプロダクトとサービスの使用量や消費量をモニタリングする。
  • 公平性の確保や使用量急増の抑制などのため、これらのリソースの消費量を制限する。
  • 規定の制限を自動的に適用する構成を維持する。
  • 割り当てをリクエストまたは変更する手段を提供する。

ほとんどの場合、割り当てを超過すると、システムは関連する Google リソースへのアクセスをすぐにブロックするため、ユーザーが試行しているタスクは失敗します。ほとんどの場合、割り当ては各 Google Cloud プロジェクトに適用され、その Google Cloud プロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。

ほどんどの場合、割り当ての増減を行うには Google Cloud コンソールを使用します。詳細については、割り当ての増加をリクエストするをご覧ください。

Speech-to-Text リソースにも上限があります。これらの上限は、割り当てシステムとは無関係です。上限は、特に明記されていない限り、変更できません。

このドキュメントでは、Cloud Speech-to-Text の使用に関する API の現在の制限事項と使用量上限について説明します。これらの制限事項や使用量上限に変更があったときは、このページにもその変更が反映されます。Google は、このような制限事項をいつでも変更できる権限を有します。

コンテンツの上限

Speech-to-Text のコンテンツは、リクエストの content フィールド内で音声データとして直接提供されるか、リクエストの uri フィールドの Google Cloud Storage URI で音声データとして参照されます。ローカル ファイルを使用して API に送信されるすべての単一リクエストに対して 10 MB の上限があります。Recognize メソッドと LongRunningRecognize メソッドの場合、この上限は送信されるリクエストのサイズに適用されます。StreamingRecognize メソッドの場合、10 MB の上限は、最初の StreamingRecognize リクエストとストリーム内の各メッセージのサイズの両方に適用されます。この上限を超えると、エラーがスローされます。Google Cloud Storage バケットに保存されている音声データを使用して送信されるリクエストにはサイズ上限はありません。

この API では、このコンテンツのサイズに次の上限が適用されます(変更される場合があります)。

コンテンツの上限 音声の長さの上限
同期リクエスト 約 1 分
非同期リクエスト 約 480 分*
ストリーミング リクエスト 約 5 分**

* 約 1 分よりも長い音声データの場合、uri フィールドを使用して Google Cloud Storage 内の音声ファイルを参照する必要があります。
** コンテンツを 5 分以上ストリーミングする必要がある場合は、エンドレス ストリーミングのチュートリアルをご覧ください。

StreamingRecognize リクエストの場合、ほぼリアルタイムのレートで音声を送信する必要があります。

これらの上限を超えるコンテンツを処理しようとすると、エラーが発生します。詳細については、エラー メッセージトラブルシューティングをご覧ください。

任意のリクエスト内で、そのリクエストに固有のフレーズのリストを含む PhraseSet リソースを指定することもできます(このコンテキストでは 1 つの単語が 1 フレーズとしてカウントされます)。このようなコンテキストには次の上限が適用されます。

音声適応の上限
1 リクエストあたりのフレーズ数 5,000
1 リクエストあたりの合計文字数 100,000
1 フレーズあたりの文字数 100

リクエストの上限

Speech-to-Text に対する API の現在の使用量上限は次のとおりです(変更されることがあります)。

上限のタイプ 使用量上限
60 秒あたりの認識リクエスト数* 900
60 秒ごとの適応リソース リクエスト数* 10
1 日あたりの処理量 480 時間の音声

* 各 StreamingRecognize セッションは、ストリーム内に StreamingRecognizeRequest 音声の複数フレームが含まれる場合でも、1 つのリクエストと見なされます。

これらの上限を超える音声処理のリクエストまたは試行を行うと、エラーが発生します。詳細については、エラー メッセージトラブルシューティングをご覧ください。

これらの上限は各 Speech-to-Text デベロッパー プロジェクトに適用され、そのデベロッパー プロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。