Ringkasan Vertex AI RAG Engine

Mesin RAG Vertex AI, komponen dari Platform Vertex AI, memfasilitasi Retrieval-Augmented Generation (RAG). Vertex AI RAG Engine juga merupakan framework data untuk mengembangkan aplikasi model bahasa besar (LLM) yang dilengkapi konteks. Augmentasi konteks terjadi saat Anda menerapkan LLM ke data. Ini mengimplementasikan retrieval-augmented generation (RAG).

Masalah umum terkait LLM adalah LLM tidak memahami pengetahuan pribadi, yaitu data organisasi Anda. Dengan Vertex AI RAG Engine, Anda dapat memperkaya konteks LLM dengan informasi pribadi tambahan, karena model dapat mengurangi halusinasi dan menjawab pertanyaan dengan lebih akurat.

Dengan menggabungkan sumber pengetahuan tambahan dengan pengetahuan yang ada yang dimiliki LLM, konteks yang lebih baik akan diberikan. Konteks yang ditingkatkan beserta kueri akan meningkatkan kualitas respons LLM.

Gambar berikut mengilustrasikan konsep utama untuk memahami Vertex AI RAG Engine.

Konsep utama RAG Vertex AI

Konsep ini tercantum dalam urutan proses retrieval-augmented generation (RAG).

  1. Penyerapan data: Mengambil data dari berbagai sumber data. Misalnya, file lokal, Cloud Storage, dan Google Drive.

  2. Transformasi data: Konversi data sebagai persiapan untuk pengindeksan. Misalnya, data dibagi menjadi beberapa bagian.

  3. Embedding: Representasi numerik dari kata atau potongan teks. Angka ini menangkap makna semantik dan konteks teks. Kata atau teks yang serupa atau terkait cenderung memiliki penyematan yang serupa, yang berarti keduanya lebih dekat dalam ruang vektor berdimensi tinggi.

  4. Pengindeksan data: Mesin RAG Vertex AI membuat indeks yang disebut korpus. Indeks menyusun pusat informasi sehingga dioptimalkan untuk penelusuran. Misalnya, indeks seperti daftar isi mendetail untuk buku referensi yang besar.

  5. Pengambilan: Saat pengguna mengajukan pertanyaan atau memberikan perintah, komponen pengambilan di Mesin RAG Vertex AI akan menelusuri basis pengetahuannya untuk menemukan informasi yang relevan dengan kueri.

  6. Pembuatan: Informasi yang diambil menjadi konteks yang ditambahkan ke kueri pengguna asli sebagai panduan bagi model AI generatif untuk menghasilkan respons yang berdasarkan fakta dan relevan.

Region yang didukung

Vertex AI RAG Engine didukung di wilayah berikut:

Wilayah Lokasi Deskripsi Tahap peluncuran
europe-west3 Frankfurt, Jerman Hanya versi v1beta1 yang didukung. Pratinjau
us-central1 Iowa Versi v1 dan v1beta1 didukung. GA

Langkah selanjutnya