配額

如要準確估算配額,請根據每個 API 的每秒查詢次數 (QPS) 進行。以下各節概述與各項 Agent Assist 功能搭配使用的 API 配額。

如要進一步瞭解如何申請增加配額,請參閱配額頁面。提交申請後,Google 可能會與您聯絡,以便進一步瞭解相關資訊,並通知您申請是否獲得核准。

專案類型

以下配額表列出兩種專案:消費者和資源。如要瞭解這兩種專案類型的定義,請參閱使用多個專案的說明文件。

CCAI 轉錄

這項功能會使用電話或 gRPC 整合,兩者各有不同的 API 配額。

電話整合

如要瞭解與電話整合服務搭配使用的 API 配額,請參閱 Dialogflow 配額

gRPC 整合

配額限制名稱 預設值 區域 充電資源/消費者專案 說明
AnalyzeContentOperationsPerMinutePerProject 每分鐘 300 次要求 全球 消費者專案 AnalyzeContent/StreamingAnalyzeContent 要求。Dialogflow 和 Agent Assist 共用配額。

情緒分析

配額限制名稱 預設值 區域 充電資源/消費者專案 說明
AnalyzeSentimentOperationsPerMinutePerProject 每分鐘 300 次要求 全球 消費者專案 透過 AnalyzeContent 或 StreamingAnalyzeContent 提出的情緒分析要求。
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 每分鐘 300 次要求 全球 消費者專案 AnalyzeSentiment 和 StreamingAnalyzeSenitment 要求。Dialogflow 和 Agent Assist 共用配額。

打造專屬輔助功能

這項功能使用下列 AI 模型:

  • text-bison@001 (預設限制為 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
配額限制名稱 預設值 區域 充電資源/消費者專案 說明
GeneratorSuggestionOperationsPerMinutePerModelType 每分鐘 10 個要求 全球 消費者專案 各模型類型的生成器建議作業
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 每分鐘 10 個要求 區域 消費者專案 每個模型類型和區域的產生器建議作業

摘要

AI 生成摘要功能使用下列模型:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0

下表列出各個摘要版本使用的配額類型和模型。


摘要版本

配額類型

後端模型

Generator 4.0

以生成器為準

預先訓練的 Gemini-2.0-flash-001

Generator 3.1

以生成器為準

經 Lora 微調的 gemini-1.5-flash-001

Generator 3.0

以生成器為準

經 Lora 微調的 gemini-1.0-pro-002

產生器 2.1

以生成器為準

Lora 微調的 text-bison-32k@002

生成器 2.0

以生成器為準

Lora 微調的 text-bison-32k@002

Generator 1.0

以生成器為準

經過 Lora 微調的 text-bison@001

基準 v2

基準 v2 模型

text-bison

基準 v1

非產生器

LongT5 模型

自訂 2.0

非產生器

LongT5 模型

下表列出用於摘要的 API 配額,反映上表中的配額類型。


配額類型

配額限制名稱

預設值

區域

收費資源/消費者專案

說明

以生成器為準

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

每分鐘 10 次要求

區域

消費者專案

各模型類型和區域的產生器建議作業

以生成器為準

GeneratorSuggestionOperationsPerMinutePerModelType

每分鐘 10 次要求

全球

消費者專案

各模型類型的產生器建議作業

以生成器為準

SuggestConversationSummaryOperationsPerMinutePerProject

每分鐘 60 個要求

全球

資源專案

建議對話摘要作業

非產生器

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

每分鐘 0 到 2 次要求

區域

資源專案

建議各區域的對話摘要作業

基準 v2 模型

SuggestSummaryV2BaselineOperationsPerMinutePerProject

每分鐘 120 次要求

全球

資源專案

Conversation Summary Suggestion V2 Baseline polling requests

基準 v2 模型

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

每分鐘 60 個要求

區域

資源專案

各區域的對話摘要建議 V2 基準輪詢要求

摘要自動評估

配額限制名稱 預設值 區域 充電資源/消費者專案 說明
ConcurrentSummarizationEvaluationsPerProject 每項專案 1 項要求 消費者專案 自動評估要求

如需額外的並行配額,請透過 Google Cloud 控制台提出要求。這項功能最多可支援每個專案四個並行配額。

生成式知識輔助

配額限制名稱 預設值 區域 充電資源/消費者專案 說明
SearchKnowledgeOperationsPerMinutePerProject 每分鐘 60 個要求 全球 消費者專案 SearchKnowledge 要求

主動提供生成式知識輔助

配額限制名稱 預設值 區域 充電資源/消費者專案 說明
SuggestKnowledgeAssistOperationsPerMinutePerProject 每分鐘 60 個要求 全球 資源專案 透過 AnalyzeContent 或 SuggestKnowledgeAssist 提出的 KnowledgeAssist 要求
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 每分鐘 30 個要求 區域 資源專案 透過各區域的 AnalyzeContent 或 SuggestKnowledgeAssist 提出的 KnowledgeAssist 要求

其他 API 配額

配額限制名稱 預設值 區域 充電資源/消費者專案 說明
ConversationOperationsPerMinutePerProject 每分鐘 300 次要求 全球 消費者專案 除了 AnalyzeContent 和 StreamingAnalyzeContent 以外的其他對話要求,例如 CreateConversation、CompleteConversation。Dialogflow 和 Agent Assist 共用配額。
MessagePollingOperationsPerMinutePerProject 每分鐘 1,200 個要求 全球 消費者專案 ListMessages 要求。Dialogflow 和 Agent Assist 共用配額。
AnswerRecordOperationsPerMinutePerProject 每分鐘 300 個要求 全球 消費者專案 AnswerRecord 要求