Halaman ini memperkenalkan Anda pada RagManagedDb
, teknologi yang mendasarinya, dan cara
RagManagedDb
digunakan di Vertex AI RAG Engine. Selain itu, halaman ini menjelaskan berbagai tingkat yang tersedia untuk menyesuaikan performa, yang dapat memengaruhi biaya Anda, dan memberikan petunjuk untuk menghapus data Vertex AI RAG Engine Anda, yang akan menghentikan penagihan.
Ringkasan
Vertex AI RAG Engine menggunakan RagManagedDb
, yang merupakan instance Google Spanner terkelola sepenuhnya dan siap digunakan perusahaan yang digunakan untuk penyimpanan resource oleh Vertex AI RAG Engine dan secara opsional tersedia untuk digunakan sebagai database vektor pilihan untuk korpus RAG Anda.
Melalui Spanner, Vertex AI RAG Engine menawarkan database yang konsisten, sangat tersedia, dan sangat skalabel untuk mendukung aplikasi Anda. Untuk mempelajari Google Spanner lebih lanjut, lihat Spanner.
Vertex AI RAG Engine menyimpan metadata resource file RAG dan korpus RAG Anda di RagManagedDb
, terlepas dari pilihan database vektor Anda. Database
vektor hanya digunakan untuk penyimpanan dan pengambilan embedding. Selain penyimpanan resource, RagManagedDb
juga dapat digunakan untuk menyimpan dan mengelola representasi vektor dokumen Anda. Database vektor kemudian digunakan untuk mengambil
dokumen yang relevan berdasarkan kemiripan semantik dokumen dengan kueri tertentu.
Mengelola tingkat
Mesin RAG Vertex AI memungkinkan Anda menskalakan instance RagManagedDb
berdasarkan
penggunaan dan persyaratan performa menggunakan pilihan dua tingkat, dan
secara opsional, memungkinkan Anda menghapus data Mesin RAG Vertex AI menggunakan
tingkat ketiga.
Tingkatan adalah setelan tingkat project yang tersedia di resource RagEngineConfig
yang memengaruhi korpus RAG menggunakan RagManagedDb
. Tingkatan berikut
tersedia di RagEngineConfig
:
Tingkat yang diskalakan: Tingkat ini menawarkan performa skala produksi beserta fungsi penskalaan otomatis. Layanan ini cocok untuk pelanggan dengan data dalam jumlah besar atau workload yang sensitif terhadap performa. Secara internal, tingkat ini menetapkan instance Spanner ke konfigurasi penskalaan otomatis dengan minimal 1 node (1.000 unit pemrosesan) dan maksimum 10 node (10.000 unit pemrosesan).
Tingkat dasar (default): Tingkat ini menawarkan tingkat komputasi rendah dan hemat biaya, yang mungkin cocok untuk beberapa kasus berikut:
- Bereksperimen dengan
RagManagedDb
. - Ukuran data kecil.
- Workload yang tidak sensitif terhadap latensi.
- Gunakan Vertex AI RAG Engine hanya dengan database vektor lainnya.
Untuk menawarkan tingkat Dasar,
RagManagedDb
menetapkan instance Spanner yang mendasarinya ke konfigurasi tetap 100 unit pemrosesan, yang setara dengan 0,1 node.- Bereksperimen dengan
Paket yang tidak disediakan: Paket ini menghapus
RagManagedDb
dan instance Spanner yang mendasarinya. Tingkat yang Tidak Disediakan akan menonaktifkan layanan Vertex AI RAG Engine dan menghapus data Anda yang disimpan dalam layanan ini, terlepas dari database vektor yang digunakan untukRagCorpora
. Tindakan ini akan menghentikan penagihan layanan. Untuk mengetahui informasi selengkapnya tentang penagihan, lihat Penagihan Mesin RAG Vertex AI.Setelah data dihapus, data tidak dapat dipulihkan. Untuk mulai menggunakan Vertex AI RAG Engine lagi, Anda harus memperbarui tingkat dengan memanggil
UpdateRagEngineConfig
API.
Mendapatkan konfigurasi project
Contoh kode berikut menunjukkan cara menggunakan API GetRagEngineConfig
untuk setiap jenis tingkat:
Contoh kode API Versi 1 (v1).
Contoh kode API v1beta1.
Memperbarui konfigurasi project
Contoh kode berikut menunjukkan cara menggunakan API UpdateRagEngineConfig
untuk setiap jenis tingkat:
Versi 1 (v1) Contoh kode API.
Contoh kode API v1beta1.
Langkah berikutnya
- Untuk mempelajari cara menggunakan RAG API v1, yang merupakan API default, lihat RAG API v1.
- Untuk mempelajari cara menggunakan RAG API v1beta1, lihat RAG API v1beta1.
- Untuk mempelajari lebih lanjut
RagManagedDb
dan cara mengelola konfigurasi tingkat Anda serta strategi pengambilan tingkat korpus RAG, lihat Menggunakan RagManagedDb dengan Vertex AI RAG Engine.