Dengan Vertex AI Agent Builder, developer dapat memanfaatkan keunggulan teknologi AI percakapan, keahlian penelusuran, dan model dasar Google untuk membuat aplikasi AI generatif tingkat perusahaan melalui Vertex AI Agents dan Vertex AI Search. Sebagai teknologi tahap awal, kemampuan dan penggunaannya yang terus berkembang menciptakan potensi penyelewengan, penyalahgunaan, dan konsekuensi yang tidak diinginkan atau tidak terduga. Misalnya, Vertex AI Agent Builder dapat menghasilkan output yang tidak Anda harapkan, termasuk teks yang menyinggung, tidak sensitif, atau salah secara faktual.
Mengingat risiko dan kompleksitas ini, Vertex AI Agent Builder dirancang dengan mempertimbangkan Prinsip AI Google. Namun, penting bagi developer untuk memahami dan menguji model mereka agar dapat di-deploy dengan aman dan bertanggung jawab. Untuk membantu developer, Vertex AI Agent Builder memiliki filter keamanan bawaan untuk membantu pelanggan memblokir output yang berpotensi berbahaya dalam kasus penggunaan mereka. Untuk mengetahui informasi selengkapnya, lihat Setelan keamanan untuk Vertex AI Search.
Saat Vertex AI Agent Builder diintegrasikan ke dalam konteks dan kasus penggunaan unik pelanggan, pertimbangan responsible AI tambahan dan batasan model mungkin perlu dipertimbangkan. Kami mendorong pelanggan untuk memanfaatkan praktik yang direkomendasikan untuk keadilan, penafsiran, privasi, dan keamanan.
Setelan keamanan untuk Vertex AI Search
Vertex AI Search menawarkan filter SafeSearch untuk memfilter hasil penelusuran situs vulgar. Hasil vulgar mungkin mencakup konten seperti pornografi, kekerasan, dan luka berdarah. Pemfilteran SafeSearch tidak tersedia untuk konten pribadi.
Ringkasan (baik untuk penelusuran situs maupun konten pribadi) memfilter respons seperti informasi yang menghina, vulgar, negatif, atau kekerasan. Selain itu, respons ringkasan berisi atribut keamanan, yang mencakup "kategori berbahaya" dan topik yang mungkin dianggap sensitif.
Penelusuran situs
SafeSearch dapat diterapkan ke konten publik yang diindeks oleh Vertex AI Search, seperti situs. Jika SafeSearch diaktifkan, Vertex AI Search akan membantu memfilter konten vulgar dalam hasil Vertex AI Search pelanggan untuk semua kueri di seluruh gambar, video, dan situs. Meskipun filter tersebut tidak 100% akurat, kami terus mengevaluasi dan memperbarui kemampuan pemfilteran.
Dalam konteks dan kasus penggunaan tertentu, pelanggan mungkin memerlukan akses ke berbagai
informasi, meskipun menyertakan konten vulgar, untuk mengumpulkan insight dan hasil
yang komprehensif dari Vertex AI Search. Pelanggan dapat mengaktifkan dan
menonaktifkan filter keamanan menggunakan API dengan menetapkan safe_search
ke "true" atau "false".
Untuk mengaktifkan SafeSearch untuk Vertex AI Search, gunakan panggilan API berikut:
curl -X POST\
-H "Authorization: Bearer $(gcloud auth application-default print-access-token)"
-H "Content-Type: application/json"\
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/servingConfigs/default_config:search"
-d '{
"query": { "input": "FREE_TEXT"},
"serving_config": "SERVING_CONFIG_ID",
"safe_search": "true",
}'
Untuk mengaktifkan SafeSearch untuk Penelusuran dengan tindak lanjut di Vertex AI Search, gunakan panggilan API berikut:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/conversations/CONVERSATION_ID:converse" \
-d '{
"query": { "input": "FREE_TEXT"},
"serving_config": "SERVING_CONFIG_ID",
"safe_search": "true",
}'
Setelan safe_search
berlaku untuk hasil penelusuran dan juga untuk
output Vertex AI Search seperti ringkasan (yang didasarkan pada hasil
penelusuran).
Output Vertex AI Search, seperti ringkasan, dinilai berdasarkan daftar
atribut keamanan yang memfilter konten yang berpotensi berbahaya meskipun
safe_search
dinonaktifkan.
Ringkasan untuk konten pribadi dan penelusuran situs
Output Vertex AI Search, seperti ringkasan, dinilai berdasarkan daftar
atribut keamanan, yang memfilter konten yang berpotensi berbahaya seperti informasi yang bersifat merendahkan,
vulgar, negatif, atau kekerasan, meskipun safe_search
untuk
penelusuran situs dinonaktifkan. Selain itu, Anda dapat memfilter respons yang
menyertakan "kategori berbahaya" dan topik yang mungkin dianggap sensitif dengan
menggunakan safetyAttributes
dalam respons Vertex AI Search API.
Respons penggantian
Jika model ringkasan merespons permintaan dengan string kosong atau
respons umum, artinya input atau output sedang memicu
filter keamanan. Dalam respons Vertex AI Search API,
SummarySkippedReason
ditetapkan ke BLOCKED_DUE_TO_POTENTIAL_POLICY_VIOLATION
jika
terdeteksi potensi pelanggaran kebijakan.
Jika Anda merasa filter keamanan dipicu dengan tidak semestinya, laporkan masalah ini melalui Konsol Google Cloud.
Setelan keamanan untuk Agen Vertex AI
Chat menggunakan berbagai mekanisme pemfilteran keamanan pada kueri pengguna dan jawaban agen. Pemfilteran mencakup kategori seperti informasi yang merendahkan, seksual eksplisit, negatif, atau kekerasan. Hal ini memastikan bahwa balasan chat sesuai dengan kueri yang tidak aman dan bahwa balasan tersebut aman secara umum. Anda juga dapat menentukan filter tambahan untuk konten yang Anda anggap tidak diinginkan dan menentukan respons penggantian saat pemfilteran tersebut diterapkan di konsol Dialogflow. Jika Anda merasa pemfilteran keamanan dipicu dengan tidak semestinya, laporkan masalah ini melalui konsol Google Cloud.
Praktik terbaik Responsible AI
Saat memanfaatkan Agen Vertex AI, sebaiknya terapkan praktik terbaik Responsible AI berikut:
Memastikan pengguna akhir diberi tahu bahwa mereka berinteraksi dengan bot
Jika berlaku, beri tahu pengguna jika dan kapan respons mereka direkam
Memberi pengguna cara untuk menandai respons yang berbahaya
Batasan
Agen Vertex AI menerapkan tanggung jawab dengan beberapa cara, termasuk filter keamanan untuk kategori seperti informasi yang merendahkan, vulgar, beracun, atau kekerasan. Namun, seperti yang diuraikan di atas, filter keamanan ini tidak 100% akurat. Selagi kami terus mengevaluasi dan memperbarui kemampuan pemfilteran, kami mendorong pelanggan untuk memberikan masukan model, mempelajari kasus penggunaan yang akan membawa manfaat bagi masyarakat, dan menghindari penggunaan Agen Vertex AI dalam konteks yang sangat penting bagi keselamatan.
Agen Vertex AI adalah salah satu dari beberapa alat yang dapat memberi tahu pakar materi pokok, dan tidak dimaksudkan untuk digunakan dalam konteks pengambilan keputusan tanpa pengawasan manusia. Saat menggabungkan data pribadi tidak terstruktur yang filter keamanannya tidak diaktifkan, sebaiknya gunakan evaluasi model dan validasi manusia yang lebih besar sebelum menggunakannya.
Referensi lainnya
- Mempelajari rekomendasi Google lebih lanjut untuk Praktik Responsible AI
- Membaca blog kami, Agenda bersama untuk progres responsible AI