Responsible AI

Model bahasa besar (LLM) dapat menerjemahkan bahasa, meringkas teks, menghasilkan penulisan kreatif, menghasilkan kode, mendukung chatbot dan asisten virtual, serta melengkapi mesin telusur dan sistem rekomendasi. Pada saat yang sama, sebagai teknologi tahap awal, kemampuan dan penggunaannya yang berkembang menciptakan potensi penyelewengan, penyalahgunaan, dan konsekuensi yang tidak diinginkan atau tidak terduga. Model bahasa besar dapat menghasilkan output yang tidak Anda harapkan, termasuk teks yang menyinggung, tidak sensitif, atau salah secara faktual.

Selain itu, fleksibilitas LLM yang luar biasa juga menyulitkan memprediksi dengan tepat jenis output yang tidak diinginkan atau tidak terduga yang mungkin dihasilkan. Dengan mempertimbangkan risiko dan kompleksitas ini, API AI generatif Vertex AI dirancang dengan mempertimbangkan Prinsip-Prinsip AI Google. Namun, penting bagi developer untuk memahami dan menguji model mereka agar dapat di-deploy dengan aman dan bertanggung jawab. Untuk membantu developer, Vertex AI Studio memiliki pemfilteran konten bawaan, dan API AI generatif kami memiliki penskoran atribut keamanan untuk membantu pelanggan menguji filter keamanan Google dan menentukan nilai minimum keyakinan yang tepat untuk kasus penggunaan dan bisnis mereka. Baca bagian Filter dan atribut keamanan untuk mempelajari lebih lanjut.

Saat API generatif kami diintegrasikan ke dalam konteks dan kasus penggunaan unik Anda, pertimbangan dan batasan responsible AI lainnya mungkin perlu dipertimbangkan. Kami mendorong pelanggan untuk mendukung praktik yang direkomendasikan, keadilan, penafsiran, privasi, dan keamanan.

Filter dan atribut keamanan

Untuk mempelajari cara menggunakan filter dan atribut keamanan untuk API, lihat halaman berikut:

Metadata kutipan

Fitur kode generatif kami dimaksudkan untuk memproduksi konten asli dan tidak mereplikasi konten yang sudah ada sepenuhnya. Kami telah mendesain agar sistem kami membatasi kemungkinan terjadinya hal ini, dan terus meningkatkan cara kerja sistem ini. Jika fitur ini mengutip dari suatu halaman web sepenuhnya secara langsung, maka fitur ini mengutip halaman tersebut.

Terkadang konten yang sama dapat ditemukan di beberapa halaman web dan kami berusaha mengarahkan Anda ke sumber yang populer. Dalam hal kutipan repositori kode, kutipan juga dapat merujuk ke lisensi open source yang berlaku. Mematuhi setiap persyaratan lisensi adalah tanggung jawab Anda.

Contoh metadata kutipan

{
  "predictions": [
    {
      "safetyAttributes": {
        "scores": [],
        "categories": [],
        "blocked": false
      },
      "content": "Shall I compare thee to a summer's day?\nThou art more lovely and more temperate.\nRough winds do shake the darling buds of May,\nAnd summer's lease hath all too short a date.\n\nSometime too hot the eye of heaven shines,\nAnd often is his gold complexion dimm'd;\nAnd every fair from fair sometime declines,\nBy chance or nature's changing course, untrimm'd.\n\nBut thy eternal summer shall not fade,\nNor lose possession of that fair thou ow'st,\nNor shall death brag thou wanderest in his shade,\nWhen in eternal lines to time thou grow'st.\n\nSo long as men can breathe or eyes can see,\nSo long lives this and this gives life to thee.",
      "citationMetadata": {
        "citations": [
          {
            "endIndex": 262,
            "publicationDate": "1800",
            "startIndex": 0,
            "title": ""The" Royal Shakespeare"
          },
          {
            "title": "Sabrinae corolla in hortulis regiae scholae Salopiensis contextuerunt tres viri floribus legendis ...",
            "publicationDate": "1801",
            "startIndex": 140,
            "endIndex": 417
          },
          {
            "startIndex": 302,
            "publicationDate": "1800",
            "title": ""The" Royal Shakespeere",
            "endIndex": 429
          },
          {
            "startIndex": 473,
            "publicationDate": "1847",
            "title": "The Poems of William Shakespeare",
            "endIndex": 618
          }
        ]
      }
    }
  ]
}

Deskripsi metadata

Tabel berikut menjelaskan metadata kutipan

Metadata Deskripsi

startIndex

Indeks dalam respons di mana kutipan dimulai (inklusif). Harus lebih besar dari atau sama dengan 0 dan kurang dari nilai endIndex.

endIndex

Indeks dalam output prediksi tempat kutipan berakhir (eksklusif). Harus lebih besar dari startIndex dan kurang dari panjang respons.

url

URL yang terkait dengan kutipan ini. Jika ada, URL ini akan ditautkan ke halaman web sumber kutipan ini.

title

Judul yang terkait dengan kutipan ini. Jika ada, judul tersebut merujuk pada judul sumber kutipan ini.

license

Lisensi yang terkait dengan kutipan ini. Jika ada, atribut ini akan merujuk pada lisensi yang terdeteksi secara otomatis dari sumber kutipan ini. Lisensi yang memungkinkan mencakup lisensi open source.

publicationDate

Tanggal terbit yang terkait dengan kutipan ini. Jika ada, tanggal terbit tersebut mengacu pada tanggal sumber kutipan ini dipublikasikan. Format yang memungkinkan adalah YYYY, YYYY-MM, dan YYYY-MM-DD.

Batasan model

Keterbatasan yang dapat Anda temui saat menggunakan model AI generatif meliputi (tetapi tidak terbatas pada):

  • Kasus ekstrem: Kasus ekstrem mengacu pada situasi yang tidak biasa, jarang, atau luar biasa yang tidak terwakili dengan baik dalam data pelatihan. Kasus ini dapat menyebabkan keterbatasan dalam performa model, seperti terlalu percaya diri model, salah penafsiran konteks, atau output yang tidak pantas.

  • Buat model halusinasi, landasan, dan faktualitas: Model AI generatif dapat kekurangan faktualitas dalam pengetahuan dunia nyata, sifat fisik, atau pemahaman yang akurat. Keterbatasan ini dapat menyebabkan halusinasi model, yang mengacu pada kasus saat video tersebut dapat menghasilkan output yang terdengar masuk akal tetapi sebenarnya salah, tidak relevan, tidak pantas, atau tidak masuk akal. Untuk mengurangi peluang ini, Anda dapat mendasarkan model ke data spesifik Anda. Untuk mempelajari lebih lanjut landasan di Vertex AI, lihat Ringkasan ground.

  • Kualitas dan penyesuaian data: Kualitas, akurasi, dan bias perintah atau input data ke dalam model dapat memiliki dampak yang signifikan terhadap performa. Jika pengguna memasukkan data atau perintah yang tidak akurat atau salah, model tersebut dapat memiliki performa yang kurang optimal atau output model yang salah.

  • Penguatan bias: Model AI generatif dapat secara tidak sengaja memperkuat bias yang ada dalam data pelatihannya, sehingga menghasilkan output yang dapat lebih memperkuat prasangka sosial dan perlakuan yang tidak setara terhadap kelompok tertentu.

  • Kualitas bahasa: Meskipun model ini menghasilkan kemampuan multibahasa yang mengesankan berdasarkan tolok ukur yang kami evaluasi, sebagian besar tolok ukur kami (termasuk semua evaluasi keadilan) menggunakan bahasa Inggris. Untuk mengetahui informasi selengkapnya, lihat blog Tim Riset Google.

    • Model AI generatif dapat memberikan kualitas layanan yang tidak konsisten kepada berbagai pengguna. Misalnya, pembuatan teks mungkin tidak seefektif untuk beberapa dialek atau varietas bahasa karena kurang terwakili dalam data pelatihan. Performa dapat menjadi lebih buruk untuk bahasa non-Inggris atau variasi bahasa Inggris dengan lebih sedikit representasi.
  • Tolok ukur dan subgrup keadilan: Analisis keadilan dari Tim Riset Google tentang model AI generatif kami tidak memberikan penjelasan lengkap tentang berbagai potensi risiko. Misalnya, kami berfokus pada bias terhadap sumbu gender, ras, etnis, dan agama, tetapi hanya melakukan analisis pada output model dan data berbahasa Inggris. Untuk mengetahui informasi selengkapnya, lihat blog Tim Riset Google.

  • Keahlian domain yang terbatas: Model AI generatif dapat kekurangan pengetahuan yang diperlukan untuk memberikan respons yang akurat dan mendetail terkait topik yang sangat khusus atau teknis, sehingga menyebabkan informasi yang kurang penting atau salah. Untuk kasus penggunaan yang khusus dan kompleks, model harus disesuaikan dengan data khusus domain, dan harus ada pengawasan manusia yang bermakna dalam konteks dengan potensi untuk secara material memengaruhi hak individu.

  • Panjang dan struktur input dan output: Model AI generatif memiliki batas token input dan output maksimum. Jika input atau output melebihi batas ini, pengklasifikasi keamanan kami tidak akan diterapkan, yang pada akhirnya dapat menyebabkan performa model yang buruk. Meskipun model kami didesain untuk menangani beragam format teks, performanya dapat terpengaruh jika data input memiliki struktur yang tidak biasa atau kompleks.

Untuk memanfaatkan teknologi ini dengan aman dan bertanggung jawab, penting juga untuk mempertimbangkan risiko lain yang spesifik untuk kasus penggunaan, pengguna, dan konteks bisnis Anda, selain memanfaatkan perlindungan teknis bawaan.

Anda sebaiknya melakukan langkah-langkah berikut ini:

  1. Menilai risiko keamanan aplikasi Anda.
  2. Mempertimbangkan penyesuaian untuk mengurangi risiko keselamatan.
  3. Melakukan pengujian keamanan yang sesuai dengan kasus penggunaan Anda.
  4. Meminta masukan pengguna dan memantau konten.

Melaporkan penyalahgunaan

Anda dapat melaporkan dugaan penyalahgunaan Layanan atau output yang dihasilkan yang berisi materi tidak pantas atau informasi yang tidak akurat dengan menggunakan formulir berikut: Melaporkan dugaan penyalahgunaan di Google Cloud.

Referensi lainnya