割り当てと上限

このドキュメントでは、Speech-to-Text に適用される割り当てとシステムの上限について説明します。割り当ては、Speech-to-Text などの Google Cloud サービスによって定義される、使用できるカウント可能な共有リソースの量を規定します。システムの上限は、変更できない固定値です。

Google Cloud は、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、Google Cloud プロジェクトで使用できる Google Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワークコンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。

Cloud Quotas システムは次のことを行います。

Google Cloud のプロダクトとサービスの消費量をモニタリングする
これらのリソースの消費量を制限する
割り当て値の変更をリクエストする手段を提供する

ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。

割り当ては通常、Google Cloud プロジェクトレベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。

通常、割り当てを調整するには、Google Cloud コンソールを使用します。詳細については、割り当ての調整をリクエストするをご覧ください。

Speech-to-Text リソースにも上限があります。システムの上限は変更できません。

このドキュメントでは、Cloud Speech-to-Text の使用に関する API の現在の制限事項と使用量上限について説明します。これらの制限事項や使用量上限に変更があったときは、このページにもその変更が反映されます。Google は、このような制限事項をいつでも変更できる権限を有します。

コンテンツの上限

Speech-to-Text のコンテンツは、リクエストの content フィールド内で音声データとして直接提供されるか、リクエストの uri フィールドの Google Cloud Storage URI で音声データとして参照されます。ローカルファイルを使用して API に送信されるすべての単一リクエストに対して 10 MB の上限があります。Recognize メソッドと LongRunningRecognize メソッドの場合、この上限は送信されるリクエストのサイズに適用されます。StreamingRecognize メソッドの場合、10 MB の上限は、最初の StreamingRecognize リクエストとストリーム内の各メッセージのサイズの両方に適用されます。この上限を超えると、エラーがスローされます。Google Cloud Storage バケットに保存されている音声データを使用して送信されるリクエストにはサイズ上限はありません。

この API では、このコンテンツのサイズに次の上限が適用されます（変更される場合があります）。

コンテンツの上限	音声の長さの上限
同期リクエスト	約 1 分
非同期リクエスト	約 480 分*
ストリーミングリクエスト	約 5 分**

* 約 1 分よりも長い音声データの場合、uri フィールドを使用して Google Cloud Storage 内の音声ファイルを参照する必要があります。
** コンテンツを 5 分以上ストリーミングする必要がある場合は、エンドレスストリーミングのチュートリアルをご覧ください。

StreamingRecognize リクエストの場合、ほぼリアルタイムのレートで音声を送信する必要があります。

これらの上限を超えるコンテンツを処理しようとすると、エラーが発生します。詳細については、エラーメッセージとトラブルシューティングをご覧ください。

任意のリクエスト内で、そのリクエストに固有のフレーズのリストを含む PhraseSet リソースを指定することもできます（このコンテキストでは 1 つの単語が 1 フレーズとしてカウントされます）。このようなコンテキストには次の上限が適用されます。

音声適応の上限	値
1 リクエストあたりのフレーズ数	5,000
1 リクエストあたりの合計文字数	100,000
1 フレーズあたりの文字数	100

リクエストの上限

Speech-to-Text に対する API の現在の使用量上限は次のとおりです（変更されることがあります）。

上限のタイプ	使用量上限
60 秒あたりの認識リクエスト数*	900
60 秒ごとの適応リソースリクエスト数*	10
1 日あたりの処理量	480 時間の音声

* 各 StreamingRecognize セッションは、ストリーム内に StreamingRecognizeRequest 音声の複数フレームが含まれる場合でも、1 つのリクエストと見なされます。

これらの上限を超える音声処理のリクエストまたは試行を行うと、エラーが発生します。詳細については、エラーメッセージとトラブルシューティングをご覧ください。

これらの上限は各 Speech-to-Text デベロッパープロジェクトに適用され、そのデベロッパープロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。