割り当ての正確な見積もりは、各 API への秒間クエリ数(QPS)に基づいています。以降のセクションでは、各 Agent Assist 機能で使用される API の割り当てについて説明します。
割り当ての増加をリクエストする方法については、割り当てのページをご覧ください。リクエスト送信後に、Google から詳細について確認させていただく場合があります。リクエストの承認または却下の結果については、追ってお知らせいたします。
プロジェクトの種類
次の割り当て表には、コンシューマー プロジェクトとリソース プロジェクトの 2 種類のプロジェクトが記載されています。これらの 2 種類のプロジェクトの定義については、複数のプロジェクトの使用に関するドキュメントをご覧ください。
CCAI の文字起こし
この機能は、テレフォニー統合または gRPC 統合のいずれかを使用します。それぞれに異なる API 割り当てがあります。
テレフォニー統合
テレフォニー統合で使用される API については、Dialogflow の割り当てをご覧ください。
gRPC 統合
割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
---|---|---|---|---|
AnalyzeContentOperationsPerMinutePerProject | 300 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent/StreamingAnalyzeContent リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。 |
ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 件の同時リクエスト | リージョン(グローバル トラフィックは us-central1 リージョンでカウントされます) |
コンシューマー プロジェクト(テレフォニー SipRec 統合のリソース プロジェクト) | リージョンごとの同時双方向ストリーミング セッション数 |
感情分析
割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
---|---|---|---|---|
AnalyzeSentimentOperationsPerMinutePerProject | 300 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent または StreamingAnalyzeContent を介した感情分析リクエスト。 |
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeSentiment リクエストと StreamingAnalyzeSenitment リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。 |
独自のサポートを構築する
この機能では、次の AI モデルを使用します。
- text-bison@001(デフォルトの上限は 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType | 10 リクエスト/分 | グローバル | コンシューマー プロジェクト | モデルタイプごとの生成候補オペレーション |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 リクエスト/分 | リージョン | コンシューマー プロジェクト | モデルタイプとリージョンごとのジェネレータ提案オペレーション |
要約
AI 生成の要約では、次のモデルが使用されます。
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
次の表に、各バージョンの要約で使用される割り当てタイプとモデルを示します。
要約バージョン |
割り当てタイプ |
バックエンド モデル |
---|---|---|
Generator 4.0 |
Generator ベース |
事前トレーニング済みの Gemini-2.0-flash-001 |
Generator 3.1 |
Generator ベース |
LoRA チューニングされた gemini-1.5-flash-001 |
Generator 3.0 |
Generator ベース |
Lora チューニング済み gemini-1.0-pro-002 |
Generator 2.1 |
Generator ベース |
Lora チューニング済み text-bison-32k@002 |
Generator 2.0 |
Generator ベース |
Lora チューニング済み text-bison-32k@002 |
Generator 1.0 |
Generator ベース |
Lora チューニング済み text-bison@001 |
ベースライン v2 |
ベースライン v2 モデル |
text-bison |
ベースライン v1 |
Non Generator based |
LongT5 モデル |
カスタム 2.0 |
Non Generator based |
LongT5 モデル |
前の表の割り当てタイプは、要約で使用される API の次の割り当てリストに反映されます。
割り当てタイプ |
割り当て上限名 |
デフォルト値 |
リージョン |
リソース/コンシューマー プロジェクトの課金 |
説明 |
---|---|---|---|---|---|
Generator ベース |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 リクエスト/分 |
地域 |
コンシューマー プロジェクト |
モデルタイプとリージョンごとの生成候補オペレーション |
Generator ベース |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 リクエスト/分 |
グローバル |
コンシューマー プロジェクト |
モデルタイプごとの生成候補オペレーション |
Generator ベース |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 リクエスト/分 |
グローバル |
リソース プロジェクト |
会話の要約オペレーションを提案する |
Non Generator based |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0 ~ 2 リクエスト/分 |
地域 |
リソース プロジェクト |
各リージョンで会話の概要オペレーションを提案する |
ベースライン v2 モデル |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 リクエスト/分 |
グローバル |
リソース プロジェクト |
会話の概要の提案 V2 ベースラインのポーリング リクエスト |
ベースライン v2 モデル |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 リクエスト/分 |
地域 |
リソース プロジェクト |
各リージョンにおける Conversation Summary Suggestion V2 ベースラインのポーリング リクエスト数 |
要約の自動評価
割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
---|---|---|---|---|
ConcurrentSummarizationEvaluationsPerProject | 1 プロジェクトあたり 1 件のリクエスト | コンシューマー プロジェクト | 自動評価リクエスト |
追加の同時実行割り当てが必要な場合は、 Google Cloud コンソールからリクエストを送信してください。この機能では、プロジェクトごとに最大 4 つの同時割り当てをサポートできます。
生成ナレッジ アシスト
割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
---|---|---|---|---|
SearchKnowledgeOperationsPerMinutePerProject | 60 リクエスト/分 | グローバル | コンシューマー プロジェクト | SearchKnowledge リクエスト |
プロアクティブ生成ナレッジ アシスト
割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
---|---|---|---|---|
SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 リクエスト/分 | グローバル | リソース プロジェクト | AnalyzeContent または SuggestKnowledgeAssist を介した KnowledgeAssist リクエスト |
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 リクエスト/分 | リージョン | リソース プロジェクト | 各リージョンでの AnalyzeContent または SuggestKnowledgeAssist による KnowledgeAssist リクエスト |
その他の API 割り当て
割り当て上限名 | デフォルト値 | リージョン | 課金リソース/コンシューマー プロジェクト | 説明 |
---|---|---|---|---|
ConversationOperationsPerMinutePerProject | 300 リクエスト/分 | グローバル | コンシューマー プロジェクト | AnalyzeContent と StreamingAnalyzeContent 以外の会話リクエスト(CreateConversation、CompleteConversation など)。割り当ては Dialogflow と Agent Assist で共有されます。 |
MessagePollingOperationsPerMinutePerProject | 1,200 リクエスト / 分 | グローバル | コンシューマー プロジェクト | ListMessages リクエスト。割り当ては Dialogflow と Agent Assist で共有されます。 |
AnswerRecordOperationsPerMinutePerProject | 300 リクエスト / 分 | グローバル | コンシューマー プロジェクト | AnswerRecord リクエスト |