このドキュメントでは、Gemini for Google Cloud に適用される割り当てと上限の一覧を示します。割り当ての詳細については、Virtual Private Cloud の割り当てをご覧ください。
割り当ては、Google Cloud プロジェクトで使用できる共有 Google Cloud リソース(ハードウェア、ソフトウェア、ネットワーク コンポーネントなど)の量を制限します。つまり、割り当てはシステムの一部で、次の機能があります。
- Google Cloud のプロダクトとサービスの使用量や消費量をモニタリングする。
- 公平性の確保や使用量急増の抑制などのため、これらのリソースの消費量を制限する。
- 規定の制限を自動的に適用する構成を維持する。
- 割り当てをリクエストまたは変更する手段を提供する。
ほとんどの場合、割り当てを超過すると、システムは関連する Google リソースへのアクセスをすぐにブロックするため、ユーザーが試行しているタスクは失敗します。ほとんどの場合、割り当ては各 Google Cloud プロジェクトに適用され、その Google Cloud プロジェクトを使用するすべてのアプリケーションと IP アドレスで共有されます。
Gemini リソースには上限もあります。これらの上限は、割り当てシステムとは無関係です。上限は、特に明記されていない限り、変更できません。
1 秒あたりのリクエスト数
Gemini for Google Cloud では、プロジェクト内の各ユーザーの 1 秒あたりのリクエスト数に対して割り当てが適用されます。
割り当て | 値 |
---|---|
1 秒あたりのリクエスト数 | 2 |
1 日あたりのリクエスト数
Gemini for Google Cloud では、プロジェクト内の各ユーザーの 1 日あたりの合計リクエスト数に割り当てが適用されます。
割り当て | 価値 |
---|---|
コード生成やコード補完など、Gemini Code Assist のコード リクエストの 1 日あたりのリクエスト数。 | 6000 |
Google Cloud コンソールと IDE の Gemini ペインにレスポンスを表示するチャットとその他のリクエストの 1 日あたりのリクエスト数。 | 240 |
割り当ての増加をリクエストする
ほどんどの場合、割り当ての増減を行うには Google Cloud コンソールを使用します。詳細については、割り当ての増加をリクエストするをご覧ください。