Penagihan Vertex AI RAG Engine

Halaman ini menjelaskan harga dan penagihan Vertex AI RAG Engine berdasarkan komponen Vertex AI RAG Engine yang Anda gunakan, seperti model, perankingan ulang, dan penyimpanan vektor.

Untuk mengetahui informasi selengkapnya, lihat halaman Ringkasan RAG Engine Vertex AI.

Penetapan harga dan penagihan

Vertex AI RAG Engine dapat digunakan secara gratis. Namun, jika Anda mengonfigurasi komponen Vertex AI RAG Engine, penagihan mungkin terpengaruh.

Tabel ini menjelaskan cara kerja penagihan saat Anda menggunakan komponen RAG.

Komponen Cara kerja penagihan dengan Vertex AI RAG Engine
Penyerapan data Mesin RAG Vertex AI mendukung penyerapan data dari berbagai sumber data. Misalnya, mengupload file lokal, Cloud Storage, dan Google Drive. Mengakses file di sumber data ini dari Vertex AI RAG Engine tidak dikenai biaya, tetapi sumber data ini mungkin mengenakan biaya untuk transfer data. Misalnya, biaya traffic keluar data.
Transformasi data (parsing file)
  • Parser default: Gratis.
  • LLM Parser: Vertex AI RAG Engine menggunakan model LLM yang Anda tentukan untuk mem-parsing file Anda, dan Anda akan melihat serta membayar biaya model LLM langsung dari project Anda.
  • Parser tata letak Document AI: Vertex AI RAG Engine menggunakan parser tata letak Document AI yang Anda tentukan untuk memproses file Anda, dan Anda akan melihat serta membayar penggunaan parser tata letak Document AI langsung dari project Anda.
Transformasi data (pemecahan file) Mendukung chunking ukuran tetap, yang gratis.
Pembuatan embedding Mesin RAG Vertex AI mengatur pembuatan embedding menggunakan model embedding yang Anda tentukan, dan project Anda ditagih untuk biaya yang terkait dengan model tersebut.

Untuk mengetahui informasi harga selengkapnya, lihat Biaya pembuatan dan deployment model AI di Vertex AI.

Pengindeksan dan pengambilan data Mesin RAG mendukung dua kategori database vektor untuk penelusuran vektor:
  • Database yang dikelola RAG
  • Database vektor Bawa Sendiri

Database yang dikelola RAG memiliki dua tujuan:
  • Database yang dikelola RAG menyimpan resource RAG, seperti korpus RAG dan file RAG. Isi file dikecualikan.
  • Sesuai pilihan Anda, pengindeksan dan pengambilan embedding untuk penelusuran vektor.

Database yang dikelola RAG menggunakan instance Spanner sebagai backend.

Untuk setiap project Anda, Vertex AI RAG Engine menyediakan project khusus pelanggan Google Cloud dan mengelola resource yang dikelola RAG yang disimpan di Vertex AI RAG Engine, sehingga data Anda terisolasi secara fisik.

Jika Anda memilih tingkat Dasar RagManagedDB atau tingkat Berskala, Vertex AI RAG Engine akan menyediakan instance edisi Spanner Enterprise di project yang sesuai:

  • Tingkat dasar: 100 unit pemrosesan dengan pencadangan
  • Tingkat yang diskalakan: Dimulai dari 1 node (1.000 unit pemrosesan) dan melakukan penskalaan otomatis hingga 10 node dengan pencadangan

Jika ada korpus RAG dalam project Anda yang memilih untuk menggunakan database yang dikelola RAG untuk penelusuran vektor, Anda akan ditagih untuk instance Spanner yang dikelola RAG.

Vertex AI RAG Engine menampilkan biaya Spanner dari project yang dikelola RAG yang sesuai ke project Google Cloud Anda, sehingga Anda dapat melihat dan membayar biaya instance Spanner.

Untuk mengetahui detail harga Spanner selengkapnya, lihat Harga Spanner.

Peringkatan ulang untuk Mesin RAG Vertex AI Alat pemberian peringkat berikut didukung setelah pengambilan:
  • LLM Reranker: Mesin RAG Vertex AI menggunakan model LLM yang Anda tentukan untuk mengurutkan ulang hasil pengambilan, dan Anda akan melihat dan membayar biaya model LLM langsung dari project Anda.
  • Vertex AI Search Ranking API: Vertex AI RAG Engine menggunakan Vertex AI Search Ranking API untuk mengurutkan ulang hasil pengambilan, dan Anda akan melihat serta membayar Ranking API langsung dari project Anda.

Langkah berikutnya