Estimasi kuota yang akurat didasarkan pada jumlah kueri per detik (QPS) Anda ke setiap API. Bagian berikut menguraikan kuota untuk API yang digunakan dengan setiap fitur Agent Assist.
Lihat halaman kuota untuk mengetahui informasi selengkapnya tentang cara meminta penambahan kuota. Setelah mengirimkan permintaan, Google mungkin akan menghubungi Anda untuk meminta informasi tambahan dan memberi tahu Anda saat permintaan Anda disetujui atau ditolak.
Jenis project
Tabel kuota berikut mencantumkan dua jenis project: konsumen dan resource. Lihat dokumentasi tentang penggunaan beberapa project untuk definisi kedua jenis project ini.
Transkripsi CCAI
Fitur ini menggunakan integrasi telepon atau gRPC, yang masing-masing memiliki kuota API yang berbeda.
Integrasi telepon
Lihat kuota Dialogflow untuk API yang digunakan dengan integrasi telepon.
Integrasi gRPC
Nama batas kuota | Nilai default | Region | Resource pengisian daya/Project konsumen | Deskripsi |
---|---|---|---|---|
AnalyzeContentOperationsPerMinutePerProject | 300 permintaan/mnt | Global | Project konsumen | Permintaan AnalyzeContent/StreamingAnalyzeContent. Kuota dibagi antara Dialogflow dan Agent Assist. |
ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 permintaan serentak | Regional (traffic global dihitung di region us-central1 ) |
Project konsumen (project resource untuk integrasi SipRec telephony) | Sesi streaming dua arah serentak per region |
Analisis sentimen
Nama batas kuota | Nilai default | Region | Resource pengisian daya/Project konsumen | Deskripsi |
---|---|---|---|---|
AnalyzeSentimentOperationsPerMinutePerProject | 300 permintaan/mnt | Global | Project konsumen | Permintaan analisis sentimen melalui AnalyzeContent atau StreamingAnalyzeContent. |
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 permintaan/mnt | Global | Project konsumen | Permintaan AnalyzeSentiment dan StreamingAnalyzeSentiment. Kuota dibagi antara Dialogflow dan Agent Assist. |
Membuat bantuan Anda sendiri
Fitur ini menggunakan model AI berikut:
- text-bison@001 (batas default 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
Nama batas kuota | Nilai default | Region | Resource pengisian daya/Project konsumen | Deskripsi |
---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType | 10 permintaan/menit | Global | Project konsumen | Operasi saran generator per jenis model |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 permintaan/menit | Regional | Project konsumen | Operasi saran generator per jenis model dan region |
Ringkasan
Ringkasan buatan AI menggunakan model berikut:
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
Tabel berikut menunjukkan jenis kuota dan model yang digunakan untuk setiap versi ringkasan.
Versi ringkasan |
Jenis kuota |
Model backend |
---|---|---|
Generator 4.0 |
Berdasarkan generator |
Gemini-2.0-flash-001 yang telah dilatih sebelumnya |
Generator 3.1 |
Berdasarkan generator |
gemini-1.5-flash-001 yang di-tune Lora |
Generator 3.0 |
Berdasarkan generator |
gemini-1.0-pro-002 yang di-tuning Lora |
Generator 2.1 |
Berdasarkan generator |
Lora-tuned text-bison-32k@002 |
Generator 2.0 |
Berdasarkan generator |
Lora-tuned text-bison-32k@002 |
Generator 1.0 |
Berdasarkan generator |
text-bison@001 yang di-tune Lora |
Dasar pengukuran v2 |
Model dasar v2 |
text-bison |
Dasar pengukuran v1 |
Tidak Berbasis Generator |
Model LongT5 |
Kustom 2.0 |
Tidak Berbasis Generator |
Model LongT5 |
Jenis kuota dalam tabel sebelumnya tercermin dalam daftar kuota berikut untuk API yang digunakan dengan ringkasan.
Jenis kuota |
Nama batas kuota |
Nilai default |
Region |
Mengisi daya perangkat/Project konsumen |
Deskripsi |
---|---|---|---|---|---|
Berdasarkan generator |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 permintaan/menit |
Regional |
Project konsumen |
Operasi saran generator per jenis model dan wilayah |
Berdasarkan generator |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 permintaan/menit |
Global |
Project konsumen |
Operasi saran generator per jenis model |
Berdasarkan generator |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 permintaan/menit |
Global |
Project resource |
Menyarankan operasi ringkasan percakapan |
Tidak Berbasis Generator |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0-2 permintaan/mnt |
Regional |
Project resource |
Menyarankan operasi ringkasan percakapan di setiap region |
Model dasar v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 permintaan/menit |
Global |
Project resource |
Permintaan polling dasar untuk Saran Ringkasan Percakapan V2 |
Model dasar v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 permintaan/menit |
Regional |
Project resource |
Permintaan polling dasar Saran Ringkasan Percakapan V2 di setiap region |
Evaluasi otomatis perangkuman
Nama batas kuota | Nilai default | Region | Resource pengisian daya/Project konsumen | Deskripsi |
---|---|---|---|---|
ConcurrentSummarizationEvaluationsPerProject | 1 permintaan per project | Project konsumen | Permintaan evaluasi otomatis |
Jika Anda memerlukan kuota serentak tambahan, ajukan permintaan melalui Google Cloud konsol. Fitur ini dapat mendukung hingga empat kuota serentak per project.
Bantuan pengetahuan generatif
Nama batas kuota | Nilai default | Region | Resource pengisian daya/Project konsumen | Deskripsi |
---|---|---|---|---|
SearchKnowledgeOperationsPerMinutePerProject | 60 permintaan/mnt | Global | Project konsumen | Permintaan SearchKnowledge |
Bantuan pengetahuan generatif proaktif
Nama batas kuota | Nilai default | Region | Resource pengisian daya/Project konsumen | Deskripsi |
---|---|---|---|---|
SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 permintaan/mnt | Global | Project resource | Permintaan KnowledgeAssist melalui AnalyzeContent atau SuggestKnowledgeAssist |
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 permintaan/menit | Regional | Project resource | Permintaan KnowledgeAssist melalui AnalyzeContent atau SuggestKnowledgeAssist di setiap region |
Kuota API lainnya
Nama batas kuota | Nilai default | Region | Resource pengisian daya/Project konsumen | Deskripsi |
---|---|---|---|---|
ConversationOperationsPerMinutePerProject | 300 permintaan/mnt | Global | Project konsumen | Permintaan percakapan lainnya, kecuali AnalyzeContent dan StreamingAnalyzeContent, misalnya CreateConversation, CompleteConversation. Kuota dibagi antara Dialogflow dan Agent Assist. |
MessagePollingOperationsPerMinutePerProject | 1.200 permintaan / menit | Global | Project konsumen | Permintaan ListMessages. Kuota dibagi antara Dialogflow dan Agent Assist. |
AnswerRecordOperationsPerMinutePerProject | 300 permintaan / menit | Global | Project konsumen | Permintaan AnswerRecord |