Kuota

Estimasi kuota yang akurat didasarkan pada jumlah kueri per detik (QPS) Anda ke setiap API. Bagian berikut menguraikan kuota untuk API yang digunakan dengan setiap fitur Agent Assist.

Lihat halaman kuota untuk mengetahui informasi selengkapnya tentang cara meminta penambahan kuota. Setelah mengirimkan permintaan, Google mungkin akan menghubungi Anda untuk meminta informasi tambahan dan memberi tahu Anda saat permintaan Anda disetujui atau ditolak.

Jenis project

Tabel kuota berikut mencantumkan dua jenis project: konsumen dan resource. Lihat dokumentasi tentang penggunaan beberapa project untuk definisi kedua jenis project ini.

Transkripsi CCAI

Fitur ini menggunakan integrasi telepon atau gRPC, yang masing-masing memiliki kuota API yang berbeda.

Integrasi telepon

Lihat kuota Dialogflow untuk API yang digunakan dengan integrasi telepon.

Integrasi gRPC

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
AnalyzeContentOperationsPerMinutePerProject 300 permintaan/mnt Global Project konsumen Permintaan AnalyzeContent/StreamingAnalyzeContent. Kuota dibagi antara Dialogflow dan Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 permintaan serentak Regional (traffic global dihitung di region us-central1) Project konsumen (project resource untuk integrasi SipRec telephony) Sesi streaming dua arah serentak per region

Analisis sentimen

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
AnalyzeSentimentOperationsPerMinutePerProject 300 permintaan/mnt Global Project konsumen Permintaan analisis sentimen melalui AnalyzeContent atau StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 permintaan/mnt Global Project konsumen Permintaan AnalyzeSentiment dan StreamingAnalyzeSentiment. Kuota dibagi antara Dialogflow dan Agent Assist.

Membuat bantuan Anda sendiri

Fitur ini menggunakan model AI berikut:

  • text-bison@001 (batas default 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
GeneratorSuggestionOperationsPerMinutePerModelType 10 permintaan/menit Global Project konsumen Operasi saran generator per jenis model
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 permintaan/menit Regional Project konsumen Operasi saran generator per jenis model dan region

Ringkasan

Ringkasan buatan AI menggunakan model berikut:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0

Tabel berikut menunjukkan jenis kuota dan model yang digunakan untuk setiap versi ringkasan.


Versi ringkasan

Jenis kuota

Model backend

Generator 4.0

Berdasarkan generator

Gemini-2.0-flash-001 yang telah dilatih sebelumnya

Generator 3.1

Berdasarkan generator

gemini-1.5-flash-001 yang di-tune Lora

Generator 3.0

Berdasarkan generator

gemini-1.0-pro-002 yang di-tuning Lora

Generator 2.1

Berdasarkan generator

Lora-tuned text-bison-32k@002

Generator 2.0

Berdasarkan generator

Lora-tuned text-bison-32k@002

Generator 1.0

Berdasarkan generator

text-bison@001 yang di-tune Lora

Dasar pengukuran v2

Model dasar v2

text-bison

Dasar pengukuran v1

Tidak Berbasis Generator

Model LongT5

Kustom 2.0

Tidak Berbasis Generator

Model LongT5

Jenis kuota dalam tabel sebelumnya tercermin dalam daftar kuota berikut untuk API yang digunakan dengan ringkasan.


Jenis kuota

Nama batas kuota

Nilai default

Region

Mengisi daya perangkat/Project konsumen

Deskripsi

Berdasarkan generator

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 permintaan/menit

Regional

Project konsumen

Operasi saran generator per jenis model dan wilayah

Berdasarkan generator

GeneratorSuggestionOperationsPerMinutePerModelType

10 permintaan/menit

Global

Project konsumen

Operasi saran generator per jenis model

Berdasarkan generator

SuggestConversationSummaryOperationsPerMinutePerProject

60 permintaan/menit

Global

Project resource

Menyarankan operasi ringkasan percakapan

Tidak Berbasis Generator

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0-2 permintaan/mnt

Regional

Project resource

Menyarankan operasi ringkasan percakapan di setiap region

Model dasar v2

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 permintaan/menit

Global

Project resource

Permintaan polling dasar untuk Saran Ringkasan Percakapan V2

Model dasar v2

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 permintaan/menit

Regional

Project resource

Permintaan polling dasar Saran Ringkasan Percakapan V2 di setiap region

Evaluasi otomatis perangkuman

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
ConcurrentSummarizationEvaluationsPerProject 1 permintaan per project Project konsumen Permintaan evaluasi otomatis

Jika Anda memerlukan kuota serentak tambahan, ajukan permintaan melalui Google Cloud konsol. Fitur ini dapat mendukung hingga empat kuota serentak per project.

Bantuan pengetahuan generatif

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
SearchKnowledgeOperationsPerMinutePerProject 60 permintaan/mnt Global Project konsumen Permintaan SearchKnowledge

Bantuan pengetahuan generatif proaktif

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 permintaan/mnt Global Project resource Permintaan KnowledgeAssist melalui AnalyzeContent atau SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 permintaan/menit Regional Project resource Permintaan KnowledgeAssist melalui AnalyzeContent atau SuggestKnowledgeAssist di setiap region

Kuota API lainnya

Nama batas kuota Nilai default Region Resource pengisian daya/Project konsumen Deskripsi
ConversationOperationsPerMinutePerProject 300 permintaan/mnt Global Project konsumen Permintaan percakapan lainnya, kecuali AnalyzeContent dan StreamingAnalyzeContent, misalnya CreateConversation, CompleteConversation. Kuota dibagi antara Dialogflow dan Agent Assist.
MessagePollingOperationsPerMinutePerProject 1.200 permintaan / menit Global Project konsumen Permintaan ListMessages. Kuota dibagi antara Dialogflow dan Agent Assist.
AnswerRecordOperationsPerMinutePerProject 300 permintaan / menit Global Project konsumen Permintaan AnswerRecord