Pilihan database vektor di RAG Engine

Halaman ini memperkenalkan pilihan database vektor yang didukung di RAG Engine. Anda juga dapat melihat cara menghubungkan database vektor (penyimpanan vektor) ke korpus RAG.

Masalah umum dengan LLM adalah LLM tidak memahami pengetahuan pribadi, yaitu data organisasi Anda. Dengan RAG Engine, Anda dapat memperkaya konteks LLM dengan informasi pribadi tambahan, karena model ini dapat mengurangi halusinasi dan menjawab pertanyaan dengan lebih akurat.

Database vektor memainkan peran penting dalam memungkinkan pengambilan untuk aplikasi RAG. Database vektor menawarkan cara khusus untuk menyimpan dan membuat kueri embedding vektor, yang merupakan representasi matematika dari teks atau data lain yang menangkap makna dan hubungan semantik. Embed vektor memungkinkan sistem RAG menemukan informasi yang paling relevan dalam basis pengetahuan yang luas dengan cepat dan akurat, bahkan saat menangani kueri yang kompleks atau bernuansa. Jika digabungkan dengan model penyematan, database vektor dapat membantu mengatasi keterbatasan LLM, dan memberikan respons yang lebih akurat, relevan, dan komprehensif.

Database vektor yang didukung

Saat membuat korpus RAG, RAG Engine menawarkan RagManagedDb sebagai pilihan default database vektor, yang tidak memerlukan penyediaan atau pengelolaan tambahan. Jika Anda ingin RAG Engine membuat dan mengelola database vektor secara otomatis untuk Anda, lihat Membuat korpus RAG.

Selain RagManagedDb default, RAG Engine memungkinkan Anda menyediakan dan membawa database vektor untuk digunakan dalam korpus RAG. Dalam hal ini, Anda bertanggung jawab atas siklus proses dan skalabilitas database vektor Anda.

Tabel ini mencantumkan pilihan database vektor yang didukung dalam RAG Engine dan link ke halaman yang menjelaskan cara menggunakannya dalam korpus RAG Anda.

Database vektor Tersedia di Vertex AI Eksternal Dukungan penelusuran campuran dalam Mesin RAG
RagManagedDb (default)
FeatureStore
Penelusuran Vektor
Pinecone
Weaviate

Langkah selanjutnya