このドキュメントでは、Gemini for Google Cloud に適用される割り当てとシステムの上限について説明します。
- 割り当ては、使用できるカウント可能な共有リソースの量を指定します。割り当ては、Gemini for Google Cloud などの Google Cloud サービスによって定義されます。
- システムの上限は固定値で、変更できません。
Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、Google Cloud プロジェクトで使用できる Google Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。
Cloud Quotas システムは次のことを行います。
- Google Cloud のプロダクトとサービスの消費量をモニタリングする
- これらのリソースの消費量を制限する
- 割り当て値の変更をリクエストする方法を提供する
ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。
割り当ては通常、Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。
Gemini リソースにはシステムの上限もあります。システムの上限は変更できません。
1 秒あたりのリクエスト数
Gemini for Google Cloud では、プロジェクト内の各ユーザーの 1 秒あたりのリクエスト数に対して割り当てが適用されます。
割り当て | 値 |
---|---|
1 秒あたりのリクエスト数 | 2 |
1 日あたりのリクエスト数
Gemini for Google Cloud では、プロジェクト内の各ユーザーの 1 日あたりの合計リクエスト数に対して割り当てを適用します。
割り当て | 値 |
---|---|
コード生成やコード補完など、Gemini Code Assist または BigQuery の Gemini のコード リクエストの 1 日あたりのリクエスト数。 | 6000 |
Google Cloud コンソールと IDE の Gemini ペインにレスポンスを表示するチャット、可視化、データ分析情報テーブル スキャン、その他のリクエストの 1 日あたりのリクエスト数。 | 240 |
Gemini Code Assist の割り当て
Gemini Code Assist は、特定の機能に対して割り当てを適用します。
割り当て | 値 |
---|---|
ローカル コードベースの認識 | 128,000 トークンのコンテキスト ウィンドウ |
コード カスタマイズ リポジトリ | 950 |
BigQuery の Gemini の割り当て
BigQuery Enterprise Plus エディションで Gemini in BigQuery を使用しているお客様の場合、割り当ては、直近の暦月における Enterprise Plus スロット時間の 1 日あたりの平均使用量に基づいて提供されます。この割り当ては組織レベルで適用され、Enterprise Plus エディションのスロットが割り当てられている組織内のすべてのプロジェクトで使用できます。割り当ては、100 スロット時間単位で切り上げられます。
100 スロット時間あたりの割り当て(Enterprise Plus エディションの 1 日あたりの平均使用量) | 値 |
---|---|
1 日あたりのコード補完リクエスト数 | 150 |
1 日あたりのコード生成リクエスト数 | 10 |
Google Cloud コンソールの Gemini ペインにレスポンスを表示するチャット、可視化、テーブル スキャン、その他のリクエストの 1 日あたりのリクエスト数。 | 5 |
例: ベースラインとして 100 スロットの Enterprise Plus エディションの予約がある組織は、1 日あたり平均 2,400 スロット時間(100 スロット × 24 時間 = 2,400 スロット時間)を使用します。その結果、翌月には 1 日あたりのクォータが次のようになります。
- 1 日あたり 3,600 件のコード補完リクエスト
- 1 日あたり 240 件のコード生成リクエスト
- 1 日あたり 120 件のチャット、可視化、データ分析情報のテーブル スキャン
組織でこれまで BigQuery Enterprise Plus エディションの予約を購入したことがない場合は、Enterprise Plus エディションの予約を購入した後、最初の暦月全体に対して次のデフォルトの割り当てが付与されます。
- 1 日あたり 7,500 件のコード補完リクエスト
- 1 日あたり 500 件のコード生成リクエスト
- 1 日あたり 250 件のチャット、ビジュアリゼーション、データ分析情報のテーブル スキャン
月の中旬に Enterprise Plus エディションの予約を開始した場合、翌月の末日までデフォルトの割り当てが適用されます。
割り当ての増加をリクエストする
通常、割り当てを調整するには、Google Cloud コンソールを使用します。詳細については、割り当ての調整をリクエストするをご覧ください。