このドキュメントでは、Cloud Speech-to-Text の使用に関する API の現在の制限事項と使用量上限について説明します。これらの制限事項や使用量上限に変更があったときは、このページにもその変更が反映されます。Google は、このような制限事項をいつでも変更できる権限を有します。
必要な場合は、割り当ての増加をリクエストできます。割り当ての確認と管理に関する詳細については、Google Cloud の割り当てページをご覧ください。
リクエスト送信後に、Google から詳細について確認させていただく場合があります。リクエストの承認または却下の結果については、追ってお知らせいたします。
コンテンツの上限
Speech-to-Text のコンテンツは、リクエストの content
フィールド内で音声データとして直接提供されるか、リクエストの uri
フィールドの Google Cloud Storage URI で音声データとして参照されます。ローカル ファイルを使用して API に送信されるすべての単一リクエストに対して 10 MB の上限があります。Recognize
メソッドと LongRunningRecognize
メソッドの場合、この上限は送信されるリクエストのサイズに適用されます。StreamingRecognize
メソッドの場合、10 MB の上限は、最初の StreamingRecognize
リクエストとストリーム内の各メッセージのサイズの両方に適用されます。この上限を超えると、エラーがスローされます。Google Cloud Storage バケットに保存されている音声データを使用して送信されるリクエストにはサイズ上限はありません。
この API では、このコンテンツのサイズに次の上限が適用されます(変更される場合があります)。
コンテンツの上限 | 音声の長さの上限 |
---|---|
同期リクエスト | 約 1 分 |
非同期リクエスト | 約 480 分* |
ストリーミング リクエスト | 約 5 分** |
* 約 1 分よりも長い音声データの場合、uri
フィールドを使用して Google Cloud Storage 内の音声ファイルを参照する必要があります。
** コンテンツを 5 分以上ストリーミングする必要がある場合は、エンドレス ストリーミングのチュートリアルをご覧ください。
StreamingRecognize
リクエストの場合、ほぼリアルタイムのレートで音声を送信する必要があります。
これらの上限を超えるコンテンツを処理しようとすると、エラーが発生します。詳細については、エラー メッセージとトラブルシューティングをご覧ください。
任意のリクエスト内で、そのリクエストに固有のフレーズのリストを含む PhraseSet リソースを指定することもできます(このコンテキストでは 1 つの単語が 1 フレーズとしてカウントされます)。このようなコンテキストには次の上限が適用されます。
音声適応の上限 | 値 |
---|---|
1 リクエストあたりのフレーズ数 | 5,000 |
1 リクエストあたりの合計文字数 | 100,000 |
1 フレーズあたりの文字数 | 100 |
リクエストの上限
Speech-to-Text に対する API の現在の使用量上限は次のとおりです(変更されることがあります)。
上限のタイプ | 使用量上限 |
---|---|
60 秒あたりの認識リクエスト数* | 900 |
60 秒ごとの適応リソース リクエスト数* | 10 |
1 日あたりの処理量 | 480 時間の音声 |
* 各 StreamingRecognize
セッションは、ストリーム内に StreamingRecognizeRequest
音声の複数フレームが含まれる場合でも、1 つのリクエストと見なされます。
これらの上限を超える音声処理のリクエストまたは試行を行うと、エラーが発生します。詳細については、エラー メッセージとトラブルシューティングをご覧ください。
これらの上限は各 Speech-to-Text デベロッパー プロジェクトに適用され、そのデベロッパー プロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。