クォータと制限

このドキュメントでは、Gemini for Google Cloud に適用される割り当て上限の一覧を示します。割り当ての詳細については、Virtual Private Cloud の割り当てをご覧ください。

割り当ては、Google Cloud プロジェクトで使用できる共有 Google Cloud リソース(ハードウェア、ソフトウェア、ネットワーク コンポーネントなど)の量を制限します。つまり、割り当てはシステムの一部で、次の機能があります。

  • Google Cloud のプロダクトとサービスの使用量や消費量をモニタリングする。
  • 公平性の確保や使用量急増の抑制などのため、これらのリソースの消費量を制限する。
  • 規定の制限を自動的に適用する構成を維持する。
  • 割り当てをリクエストまたは変更する手段を提供する。

ほとんどの場合、割り当てを超過すると、システムは関連する Google リソースへのアクセスをすぐにブロックするため、ユーザーが試行しているタスクは失敗します。ほとんどの場合、割り当ては各 Google Cloud プロジェクトに適用され、その Google Cloud プロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。

Gemini リソースには上限もあります。これらの上限は、割り当てシステムとは無関係です。上限は、特に明記されていない限り、変更できません。

1 秒あたりのリクエスト数

Gemini for Google Cloud では、プロジェクト内の各ユーザーの 1 秒あたりのリクエスト数に対して割り当てが適用されます。

割り当て
1 秒あたりのリクエスト数 2

1 日あたりのリクエスト数

Gemini for Google Cloud では、プロジェクト内の各ユーザーの 1 日あたりの合計リクエスト数に割り当てが適用されます。

割り当て 価値
コード生成やコード補完など、Gemini Code Assist のコード リクエストの 1 日あたりのリクエスト数。 6000
Google Cloud コンソールと IDE の Gemini ペインにレスポンスを表示するチャットとその他のリクエストの 1 日あたりのリクエスト数。 240

割り当ての増加をリクエストする

ほどんどの場合、割り当ての増減を行うには Google Cloud コンソールを使用します。詳細については、割り当ての増加をリクエストするをご覧ください。