如要準確估算配額,請根據每個 API 的每秒查詢次數 (QPS) 進行。以下各節概述與各項 Agent Assist 功能搭配使用的 API 配額。
如要進一步瞭解如何申請增加配額,請參閱配額頁面。提交申請後,Google 可能會與您聯絡,以便進一步瞭解相關資訊,並通知您申請是否獲得核准。
專案類型
以下配額表列出兩種專案:消費者和資源。如要瞭解這兩種專案類型的定義,請參閱使用多個專案的說明文件。
CCAI 轉錄
這項功能會使用電話或 gRPC 整合,兩者各有不同的 API 配額。
電話整合
如要瞭解與電話整合服務搭配使用的 API 配額,請參閱 Dialogflow 配額。
gRPC 整合
配額限制名稱 | 預設值 | 區域 | 充電資源/消費者專案 | 說明 |
---|---|---|---|---|
AnalyzeContentOperationsPerMinutePerProject | 每分鐘 300 次要求 | 全球 | 消費者專案 | AnalyzeContent/StreamingAnalyzeContent 要求。Dialogflow 和 Agent Assist 共用配額。 |
情緒分析
配額限制名稱 | 預設值 | 區域 | 充電資源/消費者專案 | 說明 |
---|---|---|---|---|
AnalyzeSentimentOperationsPerMinutePerProject | 每分鐘 300 次要求 | 全球 | 消費者專案 | 透過 AnalyzeContent 或 StreamingAnalyzeContent 提出的情緒分析要求。 |
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 每分鐘 300 次要求 | 全球 | 消費者專案 | AnalyzeSentiment 和 StreamingAnalyzeSenitment 要求。Dialogflow 和 Agent Assist 共用配額。 |
打造專屬輔助功能
這項功能使用下列 AI 模型:
- text-bison@001 (預設限制為 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
配額限制名稱 | 預設值 | 區域 | 充電資源/消費者專案 | 說明 |
---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType | 每分鐘 10 個要求 | 全球 | 消費者專案 | 各模型類型的生成器建議作業 |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 每分鐘 10 個要求 | 區域 | 消費者專案 | 每個模型類型和區域的產生器建議作業 |
摘要
AI 生成摘要功能使用下列模型:
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
下表列出各個摘要版本使用的配額類型和模型。
摘要版本 |
配額類型 |
後端模型 |
---|---|---|
Generator 4.0 |
以生成器為準 |
預先訓練的 Gemini-2.0-flash-001 |
Generator 3.1 |
以生成器為準 |
經 Lora 微調的 gemini-1.5-flash-001 |
Generator 3.0 |
以生成器為準 |
經 Lora 微調的 gemini-1.0-pro-002 |
產生器 2.1 |
以生成器為準 |
Lora 微調的 text-bison-32k@002 |
生成器 2.0 |
以生成器為準 |
Lora 微調的 text-bison-32k@002 |
Generator 1.0 |
以生成器為準 |
經過 Lora 微調的 text-bison@001 |
基準 v2 |
基準 v2 模型 |
text-bison |
基準 v1 |
非產生器 |
LongT5 模型 |
自訂 2.0 |
非產生器 |
LongT5 模型 |
下表列出用於摘要的 API 配額,反映上表中的配額類型。
配額類型 |
配額限制名稱 |
預設值 |
區域 |
收費資源/消費者專案 |
說明 |
---|---|---|---|---|---|
以生成器為準 |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
每分鐘 10 次要求 |
區域 |
消費者專案 |
各模型類型和區域的產生器建議作業 |
以生成器為準 |
GeneratorSuggestionOperationsPerMinutePerModelType |
每分鐘 10 次要求 |
全球 |
消費者專案 |
各模型類型的產生器建議作業 |
以生成器為準 |
SuggestConversationSummaryOperationsPerMinutePerProject |
每分鐘 60 個要求 |
全球 |
資源專案 |
建議對話摘要作業 |
非產生器 |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
每分鐘 0 到 2 次要求 |
區域 |
資源專案 |
建議各區域的對話摘要作業 |
基準 v2 模型 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
每分鐘 120 次要求 |
全球 |
資源專案 |
Conversation Summary Suggestion V2 Baseline polling requests |
基準 v2 模型 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
每分鐘 60 個要求 |
區域 |
資源專案 |
各區域的對話摘要建議 V2 基準輪詢要求 |
摘要自動評估
配額限制名稱 | 預設值 | 區域 | 充電資源/消費者專案 | 說明 |
---|---|---|---|---|
ConcurrentSummarizationEvaluationsPerProject | 每項專案 1 項要求 | 消費者專案 | 自動評估要求 |
如需額外的並行配額,請透過 Google Cloud 控制台提出要求。這項功能最多可支援每個專案四個並行配額。
生成式知識輔助
配額限制名稱 | 預設值 | 區域 | 充電資源/消費者專案 | 說明 |
---|---|---|---|---|
SearchKnowledgeOperationsPerMinutePerProject | 每分鐘 60 個要求 | 全球 | 消費者專案 | SearchKnowledge 要求 |
主動提供生成式知識輔助
配額限制名稱 | 預設值 | 區域 | 充電資源/消費者專案 | 說明 |
---|---|---|---|---|
SuggestKnowledgeAssistOperationsPerMinutePerProject | 每分鐘 60 個要求 | 全球 | 資源專案 | 透過 AnalyzeContent 或 SuggestKnowledgeAssist 提出的 KnowledgeAssist 要求 |
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 每分鐘 30 個要求 | 區域 | 資源專案 | 透過各區域的 AnalyzeContent 或 SuggestKnowledgeAssist 提出的 KnowledgeAssist 要求 |
其他 API 配額
配額限制名稱 | 預設值 | 區域 | 充電資源/消費者專案 | 說明 |
---|---|---|---|---|
ConversationOperationsPerMinutePerProject | 每分鐘 300 次要求 | 全球 | 消費者專案 | 除了 AnalyzeContent 和 StreamingAnalyzeContent 以外的其他對話要求,例如 CreateConversation、CompleteConversation。Dialogflow 和 Agent Assist 共用配額。 |
MessagePollingOperationsPerMinutePerProject | 每分鐘 1,200 個要求 | 全球 | 消費者專案 | ListMessages 要求。Dialogflow 和 Agent Assist 共用配額。 |
AnswerRecordOperationsPerMinutePerProject | 每分鐘 300 個要求 | 全球 | 消費者專案 | AnswerRecord 要求 |