Audio Proaktif membantu Gemini melakukan percakapan yang lebih autentik dengan memungkinkan Anda mengontrol kapan Gemini merespons dan dalam konteks apa dengan lebih sedikit gangguan. Misalnya, Anda dapat meminta Gemini untuk hanya merespons saat diminta atau saat topik tertentu dibahas. Untuk melihat cara kerja Audio Proaktif, lihat demonstrasi fitur ini.
Panduan ini membahas cara kerja Audio Proaktif, cara mengintegrasikannya ke dalam aplikasi Anda, dan token yang ditagih kepada Anda. Panduan ini tidak mencakup daftar harga untuk Audio Proaktif. Untuk mengetahui detail harga selengkapnya, lihat Harga Vertex AI. Panduan ini mengasumsikan bahwa Anda bekerja di Vertex AI Studio atau menggunakan Google Gen AI SDK untuk Python.
Model yang didukung
Anda dapat menggunakan Audio Proaktif dengan model berikut:
Versi model | Tingkat ketersediaan |
---|---|
gemini-live-2.5-flash-preview-native-audio-09-2025 |
Pratinjau publik |
gemini-live-2.5-flash-preview-native-audio |
Pratinjau publik; Tanggal penghentian: 17 Oktober 2025 |
Menggunakan Audio Proaktif
Audio Proaktif tidak diaktifkan secara default di
gemini-live-2.5-flash-preview-native-audio-09-2025
.
Untuk menggunakan Audio Proaktif, konfigurasi kolom proactivity
di
pesan penyiapan dan tetapkan proactive_audio
ke true
:
Python
config = LiveConnectConfig( response_modalities=["AUDIO"], proactivity=ProactivityConfig(proactive_audio=True), )
Melakukan percakapan menggunakan Audio Proaktif
Anda dapat memulai percakapan dengan Gemini menggunakan Audio Proaktif dan menentukan kapan Gemini dapat merespons, sehingga membatasi responsnya pada topik yang relevan.
Misalnya, berikut adalah contoh percakapan dengan Gemini tentang memasak:
Prompt: "You are an AI assistant in Italian cooking; only chime in when the topic is about Italian cooking."
Speaker A: "I really love cooking!" (No response from Gemini.)
Speaker B: "Oh yes, me too! My favorite is French cuisine." (No response from
Gemini.)
Speaker A: "I really like Italian food; do you know how to make a pizza?"
(Italian cooking topic will trigger response from Gemini.)
Live API: "I'd be happy to help! Here's a recipe for a pizza."
Fitur
Saat menggunakan Audio Proaktif, Gemini akan merespons dengan latensi minimal setelah pengguna selesai berbicara. Tindakan ini mengurangi gangguan dan membantu Gemini tidak kehilangan konteks jika terjadi gangguan.
Audio Proaktif juga membantu Gemini menghindari gangguan dari kebisingan latar belakang atau percakapan eksternal, dan mencegah Gemini merespons jika percakapan eksternal terjadi selama percakapan.
Jika pengguna perlu menyela respons dari Gemini, Audio Proaktif mempermudah Gemini untuk melakukan komunikasi di luar jalur yang sesuai (artinya, interupsi yang sesuai akan ditangani), daripada jika pengguna menggunakan kata pengisi seperti mmm atau eh.
Gemini dapat mendengarkan bersama file audio yang bukan suara pembicara dan kemudian menjawab pertanyaan tentang file audio tersebut di percakapan selanjutnya.
Penagihan
Saat Gemini mendengarkan percakapan, token audio input akan dikenai biaya.
Untuk token audio output, Anda hanya akan ditagih saat Gemini merespons. Jika Gemini tidak merespons atau tetap diam, tidak ada biaya untuk token audio output Anda.
Untuk mengetahui informasi selengkapnya, lihat Harga Vertex AI.