このドキュメントでは、Vertex AI エージェント ビルダーに適用される割り当てとシステムの上限について説明します。
- 割り当ては、使用できるカウント可能な共有リソースの量を指定します。割り当ては、Vertex AI Agent Builder などの Google Cloud サービスによって定義されます。
- システムの上限は固定値で、変更できません。
Google Cloud では、割り当てを使用して公平性を確保し、リソースの使用量と可用性の急増を抑えます。割り当ては、Google Cloud プロジェクトで使用できる Google Cloud リソースの量を制限します。割り当ては、ハードウェア、ソフトウェア、ネットワーク コンポーネントなど、さまざまなリソースタイプに適用されます。たとえば、割り当てによって、サービスへの API 呼び出しの数、プロジェクトで同時に使用されるロードバランサの数、作成可能なプロジェクトの数を制限できます。割り当てを適用することで、サービスの過負荷を防ぎ、Google Cloud ユーザーのコミュニティを保護します。割り当ては、自組織で使用している Google Cloud リソースの管理にも役立ちます。
Cloud Quotas システムは次のことを行います。
- Google Cloud のプロダクトとサービスの消費量をモニタリングする
- これらのリソースの消費量を制限する
- 割り当て値の変更をリクエストする方法を提供する
ほとんどの場合、割り当ての許容量を超えるリソースを消費しようとすると、システムによってリソースへのアクセスがブロックされ、実行しようとしているタスクは失敗します。
割り当ては通常、Google Cloud プロジェクト レベルで適用されます。あるプロジェクトでリソースを使用しても、別のプロジェクトで使用可能な割り当てに影響することはありません。Google Cloud プロジェクト内では、すべてのアプリケーションと IP アドレスで割り当てが共有されます。
Vertex AI Agent Builder リソースにはシステムの上限もあります。システムの上限は変更できません。
数量に基づく割り当て
次の割り当ては、時間が経過してもリセットされず、代わりにリソースを解放すると解放されます。
割り当て | 値 |
---|---|
プロジェクトあたりのドキュメント数 | 1,000,000 |
組織あたりのドキュメント数 | 5,000,000 |
プロジェクトあたりの保留中のインポートの長時間実行オペレーションの数 | 300 |
組織あたりの保留中のインポートの長時間実行オペレーションの数 | 1500 |
プロジェクトあたりの保留中のパージ ドキュメントの長時間実行オペレーションの数 | 100 |
組織あたりの保留中のパージ ドキュメントの長時間実行オペレーションの数 | 500 |
プロジェクトあたりのサービス提供制御の数 | 1,000 |
サービス提供構成あたりのブースト サービス提供コントロールの数 | 100 |
サービング構成あたりのフィルタ サービング コントロールの数 | 100 |
サービス構成あたりのリダイレクト サービス提供コントロールの数 | 100 |
サービス構成あたりの類義語サービス提供コントロールの数 | 100 |
プロジェクトあたりのユーザー イベント数 | 40,000,000,000 |
組織あたりのユーザー イベント数 | 200,000,000,000 |
リクエストの割り当て
Vertex AI Agent Builder リクエストには、次の割り当てが適用されます。
割り当て | 値 |
---|---|
1 プロジェクト、1 分あたりのクエリ リクエスト数 | 300 |
1 分あたりの組織あたりの完了したクエリ リクエスト数 | 1,500 |
1 プロジェクト、1 分あたりの会話型検索の読み取りリクエスト数 | 300 |
1 分あたりの組織あたりの会話型検索の読み取りリクエスト数 | 500 |
プロジェクトあたりの 1 分あたりの会話型検索書き込みリクエスト数 | 300 |
1 分あたりの組織あたりの会話型検索書き込みリクエスト数 | 500 |
1 プロジェクト、1 分あたりのドキュメント一括リクエスト数 | 100 |
組織あたり 1 分あたりのドキュメント一括リクエスト数 | 500 |
プロジェクトあたりのドキュメント読み取りリクエスト数(1 分あたり) | 300 |
組織あたりのドキュメント読み取りリクエスト数(1 分あたり) | 1500 |
プロジェクトあたりのドキュメント書き込みリクエスト数(1 分あたり) | 12,000 |
組織あたり 1 分あたりのドキュメント書き込みリクエスト数 | 60,000 |
1 組織、1 日あたりの評価作成リクエスト数 | 5 |
1 プロジェクトあたり 1 日あたりの評価作成リクエスト数 | 5 |
組織あたりの 1 分あたりの評価読み取りリクエスト数 | 500 |
プロジェクトあたりの評価読み取りリクエスト数(1 分あたり) | 100 |
組織あたり 1 分あたりの評価書き込みリクエスト数 | 500 |
1 プロジェクト、1 分あたりの評価書き込みリクエスト数 | 100 |
1 プロジェクト、1 分あたりの LLM クエリ リクエスト数(検索の要約、マルチターン検索) | 15 |
組織あたり 1 分あたりの LLM クエリ リクエスト(検索の要約、マルチターン検索) | 75 |
1 分あたりの保留中の FHIR/BQ ストリーミング書き込み数 | 6,000 |
組織あたりのサンプル クエリセットの数 | 500 |
プロジェクトあたりのサンプル クエリセットの数 | 100 |
プロジェクトあたりのランキング API リクエスト数(1 分あたり) | 500 |
1 プロジェクト、1 分あたりの推奨リクエスト数 | 60,000 |
組織あたり 1 分あたりの推奨リクエスト数 | 無制限 |
組織あたりの 1 分あたりのサンプルクエリ読み取りリクエスト数 | 1000 |
プロジェクトあたりの 1 分あたりのサンプルクエリ読み取りリクエスト数 | 200 |
組織あたり 1 分あたりのサンプル クエリセット読み取りリクエスト数 | 500 |
プロジェクトあたりの 1 分あたりのサンプル クエリセット読み取りリクエスト数 | 100 |
組織あたり 1 分あたりのサンプル クエリセット書き込みリクエスト数 | 500 |
プロジェクトあたりの 1 分あたりのサンプル クエリセット書き込みリクエスト数 | 100 |
組織あたり 1 分あたりのサンプルクエリ書き込みリクエスト数 | 1000 |
プロジェクトあたりの 1 分あたりのサンプルクエリ書き込みリクエスト数 | 200 |
プロジェクトあたりのスキーマ読み取りリクエスト数(1 分あたり) | 100 |
組織あたりのスキーマ読み取りリクエスト数(1 分あたり) | 500 |
1 プロジェクト、1 分あたりのスキーマ書き込みリクエスト数 | 100 |
組織あたり 1 分あたりのスキーマ書き込みリクエスト数 | 500 |
1 プロジェクト、1 分あたりの検索リクエスト数 | 300 |
1 分あたりの組織あたりの検索リクエスト数 | 無制限 |
1 プロジェクトあたり 1 分あたりのユーザー イベント バッチ リクエスト(インポートやパージなど) | 100 |
1 分あたりの組織あたりのユーザー イベントのバッチ リクエスト(インポートやパージなど) | 500 |
1 プロジェクト、1 分、1 ユーザーあたりのユーザー イベント収集リクエスト数 | 240 |
1 分あたりのユーザーあたりの組織あたりのユーザー イベント収集リクエスト | 1200 |
プロジェクトあたりの 1 分あたりのユーザー イベント書き込みリクエスト | 60,000 |
1 分あたりの組織あたりのユーザー イベントの書き込みリクエスト数 | 300,000 |
ウェブページのインデックス登録の割り当て
高度なウェブサイト インデックス登録が有効になっているデータストアでは、インデックスに登録するすべてのウェブページが、[割り当て割り当て] リストの [プロジェクトあたりのドキュメント数] の割り当てにカウントされます。プロジェクト内のページ数とそのプロジェクトのページ割り当ては、データストアの [データ] ページの [プロジェクトのページ数と割り当て] フィールドで確認することもできます。
プロジェクトのデータストアにウェブサイトを追加し、それらのウェブサイトのウェブページが原因でプロジェクトの割り当てを超えた場合、ウェブサイトはインデックスに登録されません。データストアにすでにインデックス登録されているウェブサイトがある場合、それらのウェブサイトは引き続きインデックスに登録されます。割り当てのアップグレードはいつでもリクエストできます。
割り当ての増加をリクエストする
通常、割り当てを調整するには、Google Cloud コンソールを使用します。詳細については、割り当ての調整をリクエストするをご覧ください。