Halaman ini memperkenalkan database vektor yang didukung di Vertex AI RAG Engine. Anda juga dapat melihat cara menghubungkan database vektor (penyimpanan vektor) ke korpus RAG.
Database vektor memainkan peran penting dalam mengaktifkan pengambilan untuk aplikasi RAG. Database vektor menawarkan cara khusus untuk menyimpan dan membuat kueri embedding vektor, yang merupakan representasi matematika dari teks atau data lain yang menangkap makna dan hubungan semantik. Embedding vektor memungkinkan sistem RAG menemukan informasi yang paling relevan dengan cepat dan akurat dalam pusat informasi yang luas, bahkan saat menangani kueri yang kompleks atau bernuansa. Jika digabungkan dengan model penyematan, database vektor dapat membantu mengatasi batasan LLM, dan memberikan respons yang lebih akurat, relevan, dan komprehensif.
Database vektor yang didukung
Saat membuat korpus RAG, RAG Engine Vertex AI menawarkan RagManagedDb
yang siap digunakan perusahaan sebagai database vektor default, yang tidak memerlukan penyediaan atau pengelolaan tambahan.
RagManagedDb
menawarkan opsi penelusuran KNN dan ANN serta memungkinkan peralihan ke tingkat dasar untuk beberapa pembuatan prototipe dan eksperimen cepat.
Untuk mempelajari lebih lanjut cara memilih strategi pengambilan di RagManagedDb
atau untuk memperbarui tingkat, lihat Menggunakan RagManagedDb
dengan RAG. Agar Vertex AI RAG Engine dapat membuat dan mengelola database vektor secara otomatis untuk Anda, lihat Membuat korpus RAG.
Selain RagManagedDb
default, Vertex AI RAG Engine
memungkinkan Anda menyediakan dan menggunakan database vektor dalam korpus RAG. Dalam hal ini, Anda bertanggung jawab atas siklus proses dan skalabilitas database vektor Anda.
Membandingkan opsi database vektor
Tabel ini mencantumkan pilihan database vektor yang didukung dalam Vertex AI RAG Engine dan menyediakan link ke halaman yang menjelaskan cara menggunakan database vektor dalam korpus RAG Anda.
Database vektor | Manfaat | Ideal untuk | Kekurangan | Metrik jarak yang didukung | Jenis penelusuran | Tahap peluncuran |
---|---|---|---|---|---|---|
RagManagedDb (default) adalah layanan database skalabel yang didistribusikan secara regional yang menawarkan konsistensi sangat tinggi dan ketersediaan tinggi serta dapat digunakan untuk penelusuran vektor.
mudah sederhana cepat |
|
|
|
cosine |
KNN (default) dan ANN | Pratinjau |
Vector Search adalah layanan database vektor dalam Vertex AI yang dioptimalkan untuk tugas machine learning. |
|
|
|
cosine dot-product |
ANN | Tersedia secara umum |
Vertex AI Feature Store adalah layanan terkelola untuk mengatur, menyimpan, dan menyalurkan fitur machine learning. |
|
|
|
cosine dot-product L2 squared |
ANN | Pratinjau |
Weaviate adalah database vektor open source yang fleksibel dan modular. |
|
|
|
cosine dot-product L2 squared hamming manhattan |
Dukungan penelusuran Hybrid + ANN | Pratinjau |
Pinecone adalah database vektor berbasis cloud yang terkelola sepenuhnya dan dirancang untuk penelusuran kesamaan dengan performa tinggi. |
|
|
|
cosine euclidean dot-product |
ANN | Tersedia secara umum |
Langkah berikutnya
- Untuk membuat korpus RAG, lihat Contoh pembuatan korpus RAG.
- Untuk mencantumkan semua korpus RAG, lihat Contoh mencantumkan korpus RAG.