할당량

정확한 할당량 추정은 각 API에 대한 초당 쿼리 수 (QPS)를 기반으로 합니다. 다음 섹션에서는 각 상담 지원 기능과 함께 사용되는 API의 할당량을 간략히 설명합니다.

할당량 상향 조정 요청에 대한 자세한 내용은 할당량 페이지를 참고하세요. 요청이 제출된 후 Google에서 추가 정보를 위해 연락할 수도 있고, 요청의 승인 또는 거부 여부를 알릴 수도 있습니다.

프로젝트 유형

다음 할당량 표에는 소비자 및 리소스라는 두 가지 유형의 프로젝트가 나열되어 있습니다. 이 두 프로젝트 유형의 정의는 여러 프로젝트 사용에 관한 문서를 참고하세요.

CCAI 텍스트 변환

이 기능은 전화 통신 또는 gRPC 통합을 사용하며, 각 통합에는 서로 다른 API 할당량이 있습니다.

전화 통신 통합

전화 통신 통합에 사용되는 API의 경우 Dialogflow 할당량을 참고하세요.

gRPC 통합

할당량 한도 이름 기본값 리전 요금이 청구되는 리소스/소비자 프로젝트 설명
AnalyzeContentOperationsPerMinutePerProject 분당 요청 300개 전역 소비자 프로젝트 AnalyzeContent/StreamingAnalyzeContent 요청 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다.

감정 분석

할당량 한도 이름 기본값 리전 요금이 청구되는 리소스/소비자 프로젝트 설명
AnalyzeSentimentOperationsPerMinutePerProject 분당 요청 300개 전역 소비자 프로젝트 AnalyzeContent 또는 StreamingAnalyzeContent를 통한 감정 분석 요청
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 분당 요청 300개 전역 소비자 프로젝트 AnalyzeSentiment 및 StreamingAnalyzeSenitment 요청 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다.

나만의 어시스트 만들기

이 기능은 다음 AI 모델을 사용합니다.

  • text-bison@001 (기본 한도 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
할당량 한도 이름 기본값 리전 요금이 청구되는 리소스/소비자 프로젝트 설명
GeneratorSuggestionOperationsPerMinutePerModelType 요청 10개/분 전역 소비자 프로젝트 모델 유형별 생성기 제안 작업
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 요청 10개/분 리전 소비자 프로젝트 모델 유형 및 지역별 생성기 제안 작업

요약

AI 생성 요약은 다음 모델을 사용합니다.

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0

다음 표에는 각 버전의 요약에 사용되는 할당량 유형과 모델이 나와 있습니다.


요약 버전

할당량 유형

백엔드 모델

Generator 4.0

생성기 기반

사전 학습된 Gemini-2.0-flash-001

생성기 3.1

생성기 기반

LoRA로 조정된 gemini-1.5-flash-001

Generator 3.0

생성기 기반

LoRA로 조정된 gemini-1.0-pro-002

Generator 2.1

생성기 기반

Lora로 조정된 text-bison-32k@002

생성기 2.0

생성기 기반

Lora로 조정된 text-bison-32k@002

생성기 1.0

생성기 기반

Lora로 조정된 text-bison@001

기준 v2

기준 v2 모델

text-bison

기준 v1

생성기 기반 아님

LongT5 모델

맞춤 2.0

생성기 기반 아님

LongT5 모델

이전 표의 할당량 유형은 요약에 사용되는 API의 다음 할당량 목록에 반영됩니다.


할당량 유형

할당량 한도 이름

기본값

지역

리소스/소비자 프로젝트 요금 청구

설명

생성기 기반

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

분당 요청 10개

지역

소비자 프로젝트

모델 유형 및 지역별 생성기 제안 작업

생성기 기반

GeneratorSuggestionOperationsPerMinutePerModelType

분당 요청 10개

전체

소비자 프로젝트

모델 유형별 생성기 제안 작업

생성기 기반

SuggestConversationSummaryOperationsPerMinutePerProject

요청 60개/분

전체

리소스 프로젝트

대화 요약 작업 제안

생성기 기반 아님

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0~2회 요청/분

지역

리소스 프로젝트

각 지역에서 대화 요약 작업 제안

기준 v2 모델

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 requests/min

전체

리소스 프로젝트

대화 요약 제안 V2 기준 폴링 요청

기준 v2 모델

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

요청 60개/분

지역

리소스 프로젝트

각 지역의 대화 요약 제안 V2 기준 폴링 요청

요약 자동 평가

할당량 한도 이름 기본값 리전 요금이 청구되는 리소스/소비자 프로젝트 설명
ConcurrentSummarizationEvaluationsPerProject 프로젝트당 1개 요청 소비자 프로젝트 자동 평가 요청

동시 할당량이 추가로 필요한 경우 Google Cloud 콘솔을 통해 요청을 제출하세요. 이 기능은 프로젝트당 최대 4개의 동시 할당량을 지원할 수 있습니다.

생성형 지식 지원

할당량 한도 이름 기본값 리전 요금이 청구되는 리소스/소비자 프로젝트 설명
SearchKnowledgeOperationsPerMinutePerProject 요청 60개/분 전역 소비자 프로젝트 SearchKnowledge 요청

사전 대응형 생성형 지식 지원

할당량 한도 이름 기본값 리전 요금이 청구되는 리소스/소비자 프로젝트 설명
SuggestKnowledgeAssistOperationsPerMinutePerProject 요청 60개/분 전역 리소스 프로젝트 AnalyzeContent 또는 SuggestKnowledgeAssist를 통한 KnowledgeAssist 요청
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 요청 30회/분 리전 리소스 프로젝트 각 지역에서 AnalyzeContent 또는 SuggestKnowledgeAssist를 통한 KnowledgeAssist 요청

기타 API 할당량

할당량 한도 이름 기본값 리전 요금이 청구되는 리소스/소비자 프로젝트 설명
ConversationOperationsPerMinutePerProject 분당 요청 300개 전역 소비자 프로젝트 AnalyzeContent 및 StreamingAnalyzeContent를 제외한 기타 대화 요청(예: CreateConversation, CompleteConversation) 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다.
MessagePollingOperationsPerMinutePerProject 1,200 요청 / 분 전역 소비자 프로젝트 ListMessages 요청입니다. 할당량은 Dialogflow와 Agent Assist 간에 공유됩니다.
AnswerRecordOperationsPerMinutePerProject 300 요청 / 분 전역 소비자 프로젝트 AnswerRecord 요청