Halaman ini diterjemahkan oleh Cloud Translation API.

Penagihan Vertex AI RAG Engine

Halaman ini menjelaskan harga dan penagihan Vertex AI RAG Engine berdasarkan komponen Vertex AI RAG Engine yang Anda gunakan, seperti model, penyusunan ulang peringkat, dan penyimpanan vektor.

Untuk mengetahui informasi selengkapnya, lihat halaman Ringkasan Vertex AI RAG Engine.

Penetapan harga dan penagihan

Vertex AI RAG Engine dapat digunakan secara gratis. Namun, jika Anda mengonfigurasi komponen Vertex AI RAG Engine, penagihan mungkin terpengaruh.

Tabel ini menjelaskan cara kerja penagihan saat Anda menggunakan komponen RAG.

Komponen	Cara kerja penagihan dengan Vertex AI RAG Engine
Penyerapan data	Mesin RAG Vertex AI mendukung penyerapan data dari berbagai sumber data. Misalnya, mengupload file lokal, Cloud Storage, dan Google Drive. Mengakses file di sumber data ini dari Vertex AI RAG Engine tidak dikenai biaya, tetapi sumber data ini mungkin mengenakan biaya untuk transfer data. Misalnya, biaya traffic keluar data.
Transformasi data (penguraian file)	Parser default: Gratis. LLM Parser: Vertex AI RAG Engine menggunakan model LLM yang Anda tentukan untuk mem-parsing file Anda, dan Anda akan melihat serta membayar biaya model LLM langsung dari project Anda. Parser tata letak Document AI: Vertex AI RAG Engine menggunakan parser tata letak Document AI yang Anda tentukan untuk memproses file Anda, dan Anda akan melihat serta membayar penggunaan parser tata letak Document AI langsung dari project Anda.
Transformasi data (pemecahan file)	Mendukung chunking ukuran tetap, yang gratis.
Pembuatan embedding	Mesin RAG Vertex AI mengatur pembuatan embedding menggunakan model embedding yang Anda tentukan, dan project Anda ditagih untuk biaya yang terkait dengan model tersebut. Untuk mengetahui informasi harga selengkapnya, lihat Biaya pembuatan dan deployment model AI di Vertex AI.
Pengindeksan dan pengambilan data	Mesin RAG mendukung dua kategori database vektor untuk penelusuran vektor: Database yang dikelola RAG Database vektor Bawa Sendiri Database yang dikelola RAG memiliki dua tujuan: Database yang dikelola RAG menyimpan resource RAG, seperti korpus RAG dan file RAG. Isi file dikecualikan. Sesuai pilihan Anda, pengindeksan dan pengambilan embedding untuk penelusuran vektor. Database yang dikelola RAG menggunakan instance Spanner sebagai backend. Untuk setiap project Anda, Vertex AI RAG Engine menyediakan project Google Cloud khusus pelanggan dan mengelola resource yang dikelola RAG yang disimpan di Vertex AI RAG Engine, sehingga data Anda terisolasi secara fisik. Jika Anda memilih tingkat Dasar `RagManagedDB` atau tingkat Berskala, Vertex AI RAG Engine akan menyediakan instance edisi Spanner Enterprise di project yang sesuai: Tingkat dasar: 100 unit pemrosesan dengan pencadangan Tingkat yang diskalakan: Mulai dari 1 node (1.000 unit pemrosesan) dan penskalaan otomatis hingga 10 node dengan pencadangan Jika ada korpus RAG dalam project Anda yang memilih untuk menggunakan database yang dikelola RAG untuk penelusuran vektor, Anda akan ditagih untuk instance Spanner yang dikelola RAG. Vertex AI RAG Engine menampilkan biaya Spanner dari project yang dikelola RAG yang sesuai ke project Google Cloud Anda, sehingga Anda dapat melihat dan membayar biaya instance Spanner. Untuk mengetahui detail harga Spanner selengkapnya, lihat Harga Spanner.
Peringkatan ulang untuk Mesin RAG Vertex AI	Alat peringkat berikut didukung setelah pengambilan: LLM Reranker: Vertex AI RAG Engine menggunakan model LLM yang Anda tentukan untuk mengurutkan ulang hasil pengambilan, dan Anda akan melihat dan membayar biaya model LLM langsung dari project Anda. Vertex AI Search Ranking API: Vertex AI RAG Engine menggunakan Vertex AI Search Ranking API untuk mengurutkan ulang hasil pengambilan, dan Anda akan melihat serta membayar Ranking API langsung dari project Anda.

Menghapus Vertex AI RAG Engine

Contoh kode berikut menunjukkan cara menghapus Vertex AI RAG Engine untuk konsol Google Cloud , Python, dan REST:

Parameter API Versi 1 (v1) dan contoh kode.
Parameter API v1beta1 dan contoh kode.

Langkah berikutnya

Untuk mempelajari cara menggunakan Vertex AI SDK guna menjalankan tugas Vertex AI RAG Engine, lihat Mulai cepat RAG untuk Python.
Untuk mempelajari perujukan, lihat Ringkasan perujukan.
Untuk mempelajari lebih lanjut respons dari RAG, lihat Output Pengambilan dan Pembuatan Mesin RAG Vertex AI.
Untuk mempelajari arsitektur RAG:
- Infrastruktur untuk aplikasi AI generatif berkemampuan RAG menggunakan Vertex AI dan Penelusuran Vektor
- Infrastruktur untuk aplikasi AI generatif berkemampuan RAG menggunakan Vertex AI dan AlloyDB untuk PostgreSQL.

Penagihan Vertex AI RAG Engine Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Penetapan harga dan penagihan

Menghapus Vertex AI RAG Engine

Langkah berikutnya

Penagihan Vertex AI RAG Engine