정확한 할당량 추정은 각 API에 대한 초당 쿼리 수 (QPS)를 기반으로 합니다. 다음 섹션에서는 각 상담 지원 기능과 함께 사용되는 API의 할당량을 간략히 설명합니다.
할당량 상향 조정 요청에 대한 자세한 내용은 할당량 페이지를 참고하세요. 요청이 제출된 후 Google에서 추가 정보를 위해 연락할 수도 있고, 요청의 승인 또는 거부 여부를 알릴 수도 있습니다.
프로젝트 유형
다음 할당량 표에는 소비자 및 리소스라는 두 가지 유형의 프로젝트가 나열되어 있습니다. 이 두 프로젝트 유형의 정의는 여러 프로젝트 사용에 관한 문서를 참고하세요.
CCAI 텍스트 변환
이 기능은 전화 통신 또는 gRPC 통합을 사용하며, 각 통합에는 서로 다른 API 할당량이 있습니다.
전화 통신 통합
전화 통신 통합에 사용되는 API의 경우 Dialogflow 할당량을 참고하세요.
gRPC 통합
할당량 한도 이름 | 기본값 | 리전 | 요금이 청구되는 리소스/소비자 프로젝트 | 설명 |
---|---|---|---|---|
AnalyzeContentOperationsPerMinutePerProject | 분당 요청 300개 | 전역 | 소비자 프로젝트 | AnalyzeContent/StreamingAnalyzeContent 요청 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다. |
감정 분석
할당량 한도 이름 | 기본값 | 리전 | 요금이 청구되는 리소스/소비자 프로젝트 | 설명 |
---|---|---|---|---|
AnalyzeSentimentOperationsPerMinutePerProject | 분당 요청 300개 | 전역 | 소비자 프로젝트 | AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청 |
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 분당 요청 300개 | 전역 | 소비자 프로젝트 | AnalyzeSentiment 및 StreamingAnalyzeSenitment 요청 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다. |
나만의 어시스트 만들기
이 기능은 다음 AI 모델을 사용합니다.
- text-bison@001 (기본 한도 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
할당량 한도 이름 | 기본값 | 리전 | 요금이 청구되는 리소스/소비자 프로젝트 | 설명 |
---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType | 요청 10개/분 | 전역 | 소비자 프로젝트 | 모델 유형별 생성기 제안 작업 |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 요청 10개/분 | 리전 | 소비자 프로젝트 | 모델 유형 및 지역별 생성기 제안 작업 |
요약
AI 생성 요약은 다음 모델을 사용합니다.
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
다음 표에는 각 버전의 요약에 사용되는 할당량 유형과 모델이 나와 있습니다.
요약 버전 |
할당량 유형 |
백엔드 모델 |
---|---|---|
Generator 4.0 |
생성기 기반 |
사전 학습된 Gemini-2.0-flash-001 |
생성기 3.1 |
생성기 기반 |
LoRA로 조정된 gemini-1.5-flash-001 |
Generator 3.0 |
생성기 기반 |
LoRA로 조정된 gemini-1.0-pro-002 |
Generator 2.1 |
생성기 기반 |
Lora로 조정된 text-bison-32k@002 |
생성기 2.0 |
생성기 기반 |
Lora로 조정된 text-bison-32k@002 |
생성기 1.0 |
생성기 기반 |
Lora로 조정된 text-bison@001 |
기준 v2 |
기준 v2 모델 |
text-bison |
기준 v1 |
생성기 기반 아님 |
LongT5 모델 |
맞춤 2.0 |
생성기 기반 아님 |
LongT5 모델 |
이전 표의 할당량 유형은 요약에 사용되는 API의 다음 할당량 목록에 반영됩니다.
할당량 유형 |
할당량 한도 이름 |
기본값 |
지역 |
리소스/소비자 프로젝트 요금 청구 |
설명 |
---|---|---|---|---|---|
생성기 기반 |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
분당 요청 10개 |
지역 |
소비자 프로젝트 |
모델 유형 및 지역별 생성기 제안 작업 |
생성기 기반 |
GeneratorSuggestionOperationsPerMinutePerModelType |
분당 요청 10개 |
전체 |
소비자 프로젝트 |
모델 유형별 생성기 제안 작업 |
생성기 기반 |
SuggestConversationSummaryOperationsPerMinutePerProject |
요청 60개/분 |
전체 |
리소스 프로젝트 |
대화 요약 작업 제안 |
생성기 기반 아님 |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0~2회 요청/분 |
지역 |
리소스 프로젝트 |
각 지역에서 대화 요약 작업 제안 |
기준 v2 모델 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 requests/min |
전체 |
리소스 프로젝트 |
대화 요약 제안 V2 기준 폴링 요청 |
기준 v2 모델 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
요청 60개/분 |
지역 |
리소스 프로젝트 |
각 지역의 대화 요약 제안 V2 기준 폴링 요청 |
요약 자동 평가
할당량 한도 이름 | 기본값 | 리전 | 요금이 청구되는 리소스/소비자 프로젝트 | 설명 |
---|---|---|---|---|
ConcurrentSummarizationEvaluationsPerProject | 프로젝트당 1개 요청 | 소비자 프로젝트 | 자동 평가 요청 |
동시 할당량이 추가로 필요한 경우 Google Cloud 콘솔을 통해 요청을 제출하세요. 이 기능은 프로젝트당 최대 4개의 동시 할당량을 지원할 수 있습니다.
생성형 지식 지원
할당량 한도 이름 | 기본값 | 리전 | 요금이 청구되는 리소스/소비자 프로젝트 | 설명 |
---|---|---|---|---|
SearchKnowledgeOperationsPerMinutePerProject | 요청 60개/분 | 전역 | 소비자 프로젝트 | SearchKnowledge 요청 |
사전 대응형 생성형 지식 지원
할당량 한도 이름 | 기본값 | 리전 | 요금이 청구되는 리소스/소비자 프로젝트 | 설명 |
---|---|---|---|---|
SuggestKnowledgeAssistOperationsPerMinutePerProject | 요청 60개/분 | 전역 | 리소스 프로젝트 | AnalyzeContent 또는 SuggestKnowledgeAssist를 통한 KnowledgeAssist 요청 |
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 요청 30회/분 | 리전 | 리소스 프로젝트 | 각 지역에서 AnalyzeContent 또는 SuggestKnowledgeAssist를 통한 KnowledgeAssist 요청 |
기타 API 할당량
할당량 한도 이름 | 기본값 | 리전 | 요금이 청구되는 리소스/소비자 프로젝트 | 설명 |
---|---|---|---|---|
ConversationOperationsPerMinutePerProject | 분당 요청 300개 | 전역 | 소비자 프로젝트 | AnalyzeContent 및 StreamingAnalyzeContent를 제외한 기타 대화 요청(예: CreateConversation, CompleteConversation) 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다. |
MessagePollingOperationsPerMinutePerProject | 1,200 요청 / 분 | 전역 | 소비자 프로젝트 | ListMessages 요청입니다. 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다. |
AnswerRecordOperationsPerMinutePerProject | 300 요청 / 분 | 전역 | 소비자 프로젝트 | AnswerRecord 요청 |