Halaman ini memperkenalkan pilihan database vektor yang didukung di RAG Engine. Anda juga dapat melihat cara menghubungkan database vektor (penyimpanan vektor) ke korpus RAG.
Masalah umum dengan LLM adalah LLM tidak memahami pengetahuan pribadi, yaitu data organisasi Anda. Dengan RAG Engine, Anda dapat memperkaya konteks LLM dengan informasi pribadi tambahan, karena model ini dapat mengurangi halusinasi dan menjawab pertanyaan dengan lebih akurat.
Database vektor memainkan peran penting dalam memungkinkan pengambilan untuk aplikasi RAG. Database vektor menawarkan cara khusus untuk menyimpan dan membuat kueri embedding vektor, yang merupakan representasi matematika dari teks atau data lain yang menangkap makna dan hubungan semantik. Embed vektor memungkinkan sistem RAG menemukan informasi yang paling relevan dalam basis pengetahuan yang luas dengan cepat dan akurat, bahkan saat menangani kueri yang kompleks atau bernuansa. Jika digabungkan dengan model penyematan, database vektor dapat membantu mengatasi keterbatasan LLM, dan memberikan respons yang lebih akurat, relevan, dan komprehensif.
Database vektor yang didukung
Saat membuat korpus RAG, RAG Engine menawarkan RagManagedDb
sebagai pilihan
default database vektor, yang tidak memerlukan penyediaan atau
pengelolaan tambahan. Jika Anda ingin RAG Engine membuat dan
mengelola database vektor secara otomatis untuk Anda, lihat Membuat korpus
RAG.
Selain RagManagedDb
default, RAG Engine memungkinkan Anda menyediakan
dan membawa database vektor untuk digunakan dalam korpus RAG. Dalam hal ini,
Anda bertanggung jawab atas siklus proses dan skalabilitas database vektor Anda.
Tabel ini mencantumkan pilihan database vektor yang didukung dalam RAG Engine dan link ke halaman yang menjelaskan cara menggunakannya dalam korpus RAG Anda.
Database vektor | Tersedia di Vertex AI | Eksternal | Dukungan penelusuran campuran dalam Mesin RAG |
---|---|---|---|
RagManagedDb (default) |
|||
FeatureStore | |||
Penelusuran Vektor | |||
Pinecone | |||
Weaviate |
Langkah selanjutnya
- Untuk mempelajari lebih lanjut cara memilih model penyematan, lihat Menggunakan model penyematan dengan RAG Engine.
- Untuk mempelajari RAG Engine lebih lanjut, lihat Ringkasan RAG Engine.