Halaman ini menjelaskan harga dan penagihan Vertex AI RAG Engine berdasarkan komponen Vertex AI RAG Engine yang Anda gunakan, seperti model, perankingan ulang, dan penyimpanan vektor.
Untuk mengetahui informasi selengkapnya, lihat halaman Ringkasan RAG Engine Vertex AI.
Penetapan harga dan penagihan
Vertex AI RAG Engine dapat digunakan secara gratis. Namun, jika Anda mengonfigurasi komponen Vertex AI RAG Engine, penagihan mungkin terpengaruh.
Tabel ini menjelaskan cara kerja penagihan saat Anda menggunakan komponen RAG.
Komponen | Cara kerja penagihan dengan Vertex AI RAG Engine |
---|---|
Penyerapan data | Mesin RAG Vertex AI mendukung penyerapan data dari berbagai sumber data. Misalnya, mengupload file lokal, Cloud Storage, dan Google Drive. Mengakses file di sumber data ini dari Vertex AI RAG Engine tidak dikenai biaya, tetapi sumber data ini mungkin mengenakan biaya untuk transfer data. Misalnya, biaya traffic keluar data. |
Transformasi data (parsing file) |
|
Transformasi data (pemecahan file) | Mendukung chunking ukuran tetap, yang gratis. |
Pembuatan embedding | Mesin RAG Vertex AI mengatur pembuatan embedding menggunakan model embedding yang Anda tentukan, dan project Anda ditagih untuk biaya yang terkait dengan model tersebut. Untuk mengetahui informasi harga selengkapnya, lihat Biaya pembuatan dan deployment model AI di Vertex AI. |
Pengindeksan dan pengambilan data |
Mesin RAG mendukung dua kategori database vektor untuk penelusuran vektor:
Database yang dikelola RAG memiliki dua tujuan:
Database yang dikelola RAG menggunakan instance Spanner sebagai backend. Untuk setiap project Anda, Vertex AI RAG Engine menyediakan project khusus pelanggan Google Cloud dan mengelola resource yang dikelola RAG yang disimpan di Vertex AI RAG Engine, sehingga data Anda terisolasi secara fisik. Jika Anda memilih tingkat Dasar
Jika ada korpus RAG dalam project Anda yang memilih untuk menggunakan database yang dikelola RAG untuk penelusuran vektor, Anda akan ditagih untuk instance Spanner yang dikelola RAG. Vertex AI RAG Engine menampilkan biaya Spanner dari project yang dikelola RAG yang sesuai ke project Google Cloud Anda, sehingga Anda dapat melihat dan membayar biaya instance Spanner. Untuk mengetahui detail harga Spanner selengkapnya, lihat Harga Spanner. |
Peringkatan ulang untuk Mesin RAG Vertex AI | Alat pemberian peringkat berikut didukung setelah pengambilan:
|
Langkah berikutnya
- Untuk mempelajari cara menggunakan Vertex AI SDK guna menjalankan tugas Vertex AI RAG Engine, lihat Mulai cepat RAG untuk Python.
- Untuk mempelajari perujukan, lihat Ringkasan perujukan.
- Untuk mempelajari lebih lanjut respons dari RAG, lihat Output Pengambilan dan Pembuatan Mesin RAG Vertex AI.
- Untuk mempelajari arsitektur RAG: