Halaman ini memperkenalkan pilihan database vektor yang didukung di Vertex AI RAG Engine. Anda juga dapat melihat cara menghubungkan database vektor (penyimpanan vektor) ke korpus RAG.
Masalah umum terkait LLM adalah LLM tidak memahami pengetahuan pribadi, yaitu data organisasi Anda. Dengan Vertex AI RAG Engine, Anda dapat memperkaya konteks LLM dengan informasi pribadi tambahan, karena model ini dapat mengurangi halusinasi dan menjawab pertanyaan dengan lebih akurat.
Database vektor memainkan peran penting dalam memungkinkan pengambilan untuk aplikasi RAG. Database vektor menawarkan cara khusus untuk menyimpan dan membuat kueri embedding vektor, yang merupakan representasi matematika dari teks atau data lain yang menangkap makna dan hubungan semantik. Embed vektor memungkinkan sistem RAG menemukan informasi yang paling relevan dalam basis pengetahuan yang luas dengan cepat dan akurat, bahkan saat menangani kueri yang kompleks atau bernuansa. Jika digabungkan dengan model penyematan, database vektor dapat membantu mengatasi keterbatasan LLM, dan memberikan respons yang lebih akurat, relevan, dan komprehensif.
Database vektor yang didukung
Saat membuat korpus RAG, Vertex AI RAG Engine menawarkan RagManagedDb
sebagai pilihan database vektor default, yang tidak memerlukan penyediaan atau pengelolaan tambahan. Agar Vertex AI RAG Engine dapat membuat dan mengelola database
vektor secara otomatis untuk Anda, lihat Membuat korpus
RAG.
Selain RagManagedDb
default, Vertex AI RAG Engine memungkinkan Anda menyediakan
dan membawa database vektor untuk digunakan dalam korpus RAG. Dalam hal ini,
Anda bertanggung jawab atas siklus proses dan skalabilitas database vektor Anda.
Membandingkan opsi database vektor
Tabel ini mencantumkan pilihan database vektor yang didukung dalam Vertex AI RAG Engine dan menyediakan link ke halaman yang menjelaskan cara menggunakan database vektor dalam korpus RAG Anda.
Untuk mengidentifikasi database vektor yang memenuhi kebutuhan Anda, gunakan tabel ini untuk membandingkan opsi database vektor:
Database vektor | Deskripsi | Manfaat | Kekurangan | Metrik jarak yang didukung di Vertex AI RAG Engine | Jenis penelusuran | Tahap peluncuran di Mesin RAG Vertex AI | Siap produksi | Paling cocok untuk |
---|---|---|---|---|---|---|---|---|
RagManagedDb (default) |
RagManagedDb adalah layanan database skalabel yang didistribusikan secara regional dan menawarkan konsistensi serta ketersediaan tinggi.RagManagedDb dapat digunakan untuk penelusuran vektor.
|
|
|
cosine |
KNN | Pratinjau |
|
|
Penelusuran Vektor | Vector Search adalah layanan database vektor dalam Vertex AI. Vector Search dioptimalkan untuk tugas machine learning dan terintegrasi dengan layanan Google Cloud lain. |
|
|
cosine dot-product |
ANN | GA |
|
|
Vertex AI Feature Store | Vertex AI Feature Store adalah layanan terkelola untuk mengatur, menyimpan, dan menyalurkan fitur machine learning. Vertex AI Feature Store dioptimalkan untuk tugas machine learning dan terintegrasi dengan layanan Google Cloud lain. |
|
|
cosine dot-product L2 squared |
ANN | Pratinjau |
|
|
Weaviate | Weaviate adalah database vektor open source yang berfokus pada fleksibilitas dan modularitas. Weaviate mendukung berbagai jenis data dan menawarkan kemampuan grafik bawaan. |
|
|
cosine dot-product L2 squared hamming manhattan |
Dukungan penelusuran ANN + Hybrid | Pratinjau |
|
|
Pinecone | Pinecone adalah database vektor native cloud yang terkelola sepenuhnya dan dirancang untuk penelusuran kemiripan berperforma tinggi. |
|
|
cosine euclidean dot-product |
ANN | GA |
|