Menempatkan respons menggunakan RAG

Perujukan adalah teknik yang dapat Anda gunakan untuk membantu menghasilkan respons model yang lebih tepercaya, bermanfaat, dan faktual. Saat melandasi respons model AI generatif, Anda menghubungkannya ke sumber informasi yang dapat diverifikasi. Untuk menerapkan penjelasan, biasanya Anda harus mengambil data sumber yang relevan. Praktik terbaik yang direkomendasikan adalah menggunakan teknik retrieval-augmented generation (RAG). Pengambilan biasanya dilakukan menggunakan mesin telusur, yang menggunakan indeks yang disematkan dengan makna semantik teks sumber.

Ada juga layanan dan API komponen yang menerapkan siklus proses RAG, seperti Vertex AI Search Builder API, yang memungkinkan pembuatan gabungan. Dengan pembuatan mix-and-match, Anda dapat menerapkan solusi RAG menggunakan salah satu layanan atau API berikut:

  • API pembuatan grounding: Anda dapat menggunakannya untuk menerapkan grounding, atau menautkan ke penyedia pengambilan untuk siklus proses RAG yang lengkap.
  • Parser tata letak dokumen: Parser ini mewakili yang terbaik dari Document AI dan Gemini untuk pemahaman dokumen.
  • Vertex AI Vector Search: Layanan penelusuran ini berperforma tinggi dan menggunakan database vektor berkualitas tinggi.
  • Check grounding API: API ini membandingkan output RAG dengan fakta yang diambil dan membantu memastikan bahwa semua pernyataan didasarkan sebelum menampilkan respons kepada pengguna.

Langkah selanjutnya