Responsible AI

Dengan Vertex AI Agent Builder, developer dapat memanfaatkan keunggulan teknologi AI percakapan, keahlian penelusuran, dan model dasar Google untuk membuat aplikasi AI generatif tingkat perusahaan melalui Vertex AI Agents dan Vertex AI Search. Sebagai teknologi tahap awal, kemampuan dan penggunaannya yang terus berkembang menciptakan potensi penyelewengan, penyalahgunaan, dan konsekuensi yang tidak diinginkan atau tidak terduga. Misalnya, Vertex AI Agent Builder dapat menghasilkan output yang tidak Anda harapkan, termasuk teks yang menyinggung, tidak sensitif, atau salah secara faktual.

Mengingat risiko dan kompleksitas ini, Vertex AI Agent Builder dirancang dengan mempertimbangkan Prinsip AI Google. Namun, penting bagi developer untuk memahami dan menguji model mereka agar dapat di-deploy dengan aman dan bertanggung jawab. Untuk membantu developer, Vertex AI Agent Builder memiliki filter keamanan bawaan untuk membantu pelanggan memblokir output yang berpotensi berbahaya dalam kasus penggunaan mereka. Untuk mengetahui informasi selengkapnya, lihat Setelan keamanan untuk Vertex AI Search.

Saat Vertex AI Agent Builder diintegrasikan ke dalam konteks dan kasus penggunaan unik pelanggan, pertimbangan responsible AI tambahan dan batasan model mungkin perlu dipertimbangkan. Kami mendorong pelanggan untuk memanfaatkan praktik yang direkomendasikan untuk keadilan, penafsiran, privasi, dan keamanan.

Vertex AI Search menawarkan filter SafeSearch untuk memfilter hasil penelusuran situs vulgar. Hasil vulgar mungkin mencakup konten seperti pornografi, kekerasan, dan luka berdarah. Pemfilteran SafeSearch tidak tersedia untuk konten pribadi.

Ringkasan (baik untuk penelusuran situs maupun konten pribadi) memfilter respons seperti informasi yang menghina, vulgar, negatif, atau kekerasan. Selain itu, respons ringkasan berisi atribut keamanan, yang mencakup "kategori berbahaya" dan topik yang mungkin dianggap sensitif.

Penelusuran situs

SafeSearch dapat diterapkan ke konten publik yang diindeks oleh Vertex AI Search, seperti situs. Jika SafeSearch diaktifkan, Vertex AI Search akan membantu memfilter konten vulgar dalam hasil Vertex AI Search pelanggan untuk semua kueri di seluruh gambar, video, dan situs. Meskipun filter tersebut tidak 100% akurat, kami terus mengevaluasi dan memperbarui kemampuan pemfilteran.

Dalam konteks dan kasus penggunaan tertentu, pelanggan mungkin memerlukan akses ke berbagai informasi, meskipun menyertakan konten vulgar, untuk mengumpulkan insight dan hasil yang komprehensif dari Vertex AI Search. Pelanggan dapat mengaktifkan dan menonaktifkan filter keamanan menggunakan API dengan menetapkan safe_search ke "true" atau "false".

Untuk mengaktifkan SafeSearch untuk Vertex AI Search, gunakan panggilan API berikut:

curl -X POST\
 -H "Authorization: Bearer $(gcloud auth application-default print-access-token)"
 -H "Content-Type: application/json"\
"https://discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/servingConfigs/default_config:search"
     -d '{
      "query": { "input": "FREE_TEXT"},
  "serving_config": "SERVING_CONFIG_ID",
  "safe_search": "true",
}'

Untuk mengaktifkan SafeSearch untuk Penelusuran dengan tindak lanjut di Vertex AI Search, gunakan panggilan API berikut:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
"https://discoveryengine.googleapis.com/v1beta/projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID/conversations/CONVERSATION_ID:converse" \
-d '{
  "query": { "input": "FREE_TEXT"},
  "serving_config": "SERVING_CONFIG_ID",
  "safe_search": "true",
}'

Setelan safe_search berlaku untuk hasil penelusuran dan juga untuk output Vertex AI Search seperti ringkasan (yang didasarkan pada hasil penelusuran).

Output Vertex AI Search, seperti ringkasan, dinilai berdasarkan daftar atribut keamanan yang memfilter konten yang berpotensi berbahaya meskipun safe_search dinonaktifkan.

Ringkasan untuk konten pribadi dan penelusuran situs

Output Vertex AI Search, seperti ringkasan, dinilai berdasarkan daftar atribut keamanan, yang memfilter konten yang berpotensi berbahaya seperti informasi yang bersifat merendahkan, vulgar, negatif, atau kekerasan, meskipun safe_search untuk penelusuran situs dinonaktifkan. Selain itu, Anda dapat memfilter respons yang menyertakan "kategori berbahaya" dan topik yang mungkin dianggap sensitif dengan menggunakan safetyAttributes dalam respons Vertex AI Search API.

Respons penggantian

Jika model ringkasan merespons permintaan dengan string kosong atau respons umum, artinya input atau output sedang memicu filter keamanan. Dalam respons Vertex AI Search API, SummarySkippedReason ditetapkan ke BLOCKED_DUE_TO_POTENTIAL_POLICY_VIOLATION jika terdeteksi potensi pelanggaran kebijakan.

Jika Anda merasa filter keamanan dipicu dengan tidak semestinya, laporkan masalah ini melalui Konsol Google Cloud.

Setelan keamanan untuk Agen Vertex AI

Chat menggunakan berbagai mekanisme pemfilteran keamanan pada kueri pengguna dan jawaban agen. Pemfilteran mencakup kategori seperti informasi yang merendahkan, seksual eksplisit, negatif, atau kekerasan. Hal ini memastikan bahwa balasan chat sesuai dengan kueri yang tidak aman dan bahwa balasan tersebut aman secara umum. Anda juga dapat menentukan filter tambahan untuk konten yang Anda anggap tidak diinginkan dan menentukan respons penggantian saat pemfilteran tersebut diterapkan di konsol Dialogflow. Jika Anda merasa pemfilteran keamanan dipicu dengan tidak semestinya, laporkan masalah ini melalui konsol Google Cloud.

Praktik terbaik Responsible AI

Saat memanfaatkan Agen Vertex AI, sebaiknya terapkan praktik terbaik Responsible AI berikut:

  • Memastikan pengguna akhir diberi tahu bahwa mereka berinteraksi dengan bot

  • Jika berlaku, beri tahu pengguna jika dan kapan respons mereka direkam

  • Memberi pengguna cara untuk menandai respons yang berbahaya

Batasan

Agen Vertex AI menerapkan tanggung jawab dengan beberapa cara, termasuk filter keamanan untuk kategori seperti informasi yang merendahkan, vulgar, beracun, atau kekerasan. Namun, seperti yang diuraikan di atas, filter keamanan ini tidak 100% akurat. Selagi kami terus mengevaluasi dan memperbarui kemampuan pemfilteran, kami mendorong pelanggan untuk memberikan masukan model, mempelajari kasus penggunaan yang akan membawa manfaat bagi masyarakat, dan menghindari penggunaan Agen Vertex AI dalam konteks yang sangat penting bagi keselamatan.

Agen Vertex AI adalah salah satu dari beberapa alat yang dapat memberi tahu pakar materi pokok, dan tidak dimaksudkan untuk digunakan dalam konteks pengambilan keputusan tanpa pengawasan manusia. Saat menggabungkan data pribadi tidak terstruktur yang filter keamanannya tidak diaktifkan, sebaiknya gunakan evaluasi model dan validasi manusia yang lebih besar sebelum menggunakannya.

Referensi lainnya