Mulai 29 April 2025, model Gemini 1.5 Pro dan Gemini 1.5 Flash tidak tersedia di project yang belum pernah menggunakan model ini, termasuk project baru. Untuk mengetahui detailnya, lihat Versi dan siklus proses model.
Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Halaman ini menjelaskan harga dan penagihan Vertex AI RAG Engine berdasarkan komponen Vertex AI RAG Engine yang Anda gunakan, seperti model, perankingan ulang, dan penyimpanan vektor.
Mesin RAG Vertex AI mendukung penyerapan data dari berbagai sumber data. Misalnya, mengupload file lokal, Cloud Storage, dan Google Drive. Mengakses file di sumber data ini dari Vertex AI RAG Engine tidak dikenai biaya, tetapi sumber data ini mungkin mengenakan biaya untuk transfer data. Misalnya, biaya traffic keluar data.
LLM Parser: Vertex AI RAG Engine menggunakan model LLM yang Anda tentukan untuk mem-parsing file Anda, dan Anda akan melihat serta membayar biaya model LLM langsung dari project Anda.
Parser tata letak Document AI: Vertex AI RAG Engine menggunakan parser tata letak Document AI yang Anda tentukan untuk memproses file Anda, dan Anda akan melihat serta membayar penggunaan parser tata letak Document AI langsung dari project Anda.
Mesin RAG Vertex AI mengatur pembuatan embedding menggunakan model embedding yang Anda tentukan, dan project Anda ditagih untuk biaya yang terkait dengan model tersebut.
Mesin RAG mendukung dua kategori database vektor untuk penelusuran vektor:
Database yang dikelola RAG
Database vektor Bawa Sendiri
Database yang dikelola RAG memiliki dua tujuan:
Database yang dikelola RAG
menyimpan resource RAG, seperti korpus RAG dan file RAG. Isi file
dikecualikan.
Sesuai pilihan Anda, pengindeksan dan
pengambilan embedding untuk penelusuran vektor.
Database yang dikelola RAG menggunakan instance Spanner sebagai backend.
Untuk setiap project Anda, Vertex AI RAG Engine
menyediakan project khusus pelanggan Google Cloud dan mengelola
resource yang dikelola RAG yang disimpan di
Vertex AI RAG Engine, sehingga data Anda terisolasi secara fisik.
Jika Anda memilih tingkat Dasar RagManagedDB
atau tingkat Berskala, Vertex AI RAG Engine akan menyediakan
instance edisi Spanner Enterprise di project
yang sesuai:
Tingkat dasar: 100 unit pemrosesan dengan pencadangan
Tingkat yang diskalakan: Dimulai dari 1 node (1.000 unit pemrosesan) dan
melakukan penskalaan otomatis hingga 10 node dengan pencadangan
Jika ada korpus RAG dalam project Anda yang memilih untuk menggunakan database yang dikelola RAG untuk penelusuran vektor, Anda akan ditagih untuk instance Spanner yang dikelola RAG.
Vertex AI RAG Engine menampilkan biaya Spanner dari project yang dikelola RAG yang sesuai ke project Google Cloud Anda, sehingga Anda dapat melihat dan membayar biaya instance Spanner.
Untuk mengetahui detail harga Spanner selengkapnya, lihat Harga Spanner.
Alat pemberian peringkat berikut didukung setelah pengambilan:
LLM Reranker: Mesin RAG Vertex AI menggunakan
model LLM yang Anda tentukan untuk mengurutkan ulang hasil pengambilan, dan Anda
akan melihat dan membayar biaya model LLM langsung dari project Anda.
Vertex AI Search Ranking API:
Vertex AI RAG Engine menggunakan
Vertex AI Search Ranking API untuk mengurutkan ulang hasil
pengambilan, dan Anda akan melihat serta membayar Ranking API langsung dari project Anda.
Langkah berikutnya
Untuk mempelajari cara menggunakan Vertex AI SDK guna menjalankan tugas Vertex AI RAG Engine, lihat Mulai cepat RAG untuk Python.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-09-04 UTC."],[],[],null,["# Vertex AI RAG Engine billing\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nThis page describes the Vertex AI RAG Engine pricing and billing based on the Vertex AI RAG Engine components you use, such as models, reranking, and vector storage.\n\nFor more information, see the [Vertex AI RAG Engine overview](/vertex-ai/generative-ai/docs/rag-engine/rag-overview) page.\n\nPricing and billing\n-------------------\n\nVertex AI RAG Engine is free to use. However, if you configure\nVertex AI RAG Engine components, the billing might be affected.\n\nThis table explains how billing works when you use the RAG components.\n\nWhat's next\n-----------\n\n- To learn how to use the Vertex AI SDK to run Vertex AI RAG Engine tasks, see [RAG quickstart for\n Python](/vertex-ai/generative-ai/docs/rag-quickstart).\n- To learn about grounding, see [Grounding\n overview](/vertex-ai/generative-ai/docs/grounding/overview).\n- To learn more about the responses from RAG, see [Retrieval and Generation Output of Vertex AI RAG Engine](/vertex-ai/generative-ai/docs/model-reference/rag-output-explained).\n- To learn about the RAG architecture:\n - [Infrastructure for a RAG-capable generative AI application using Vertex AI and Vector Search](/architecture/gen-ai-rag-vertex-ai-vector-search)\n - [Infrastructure for a RAG-capable generative AI application using Vertex AI and AlloyDB for PostgreSQL](/architecture/rag-capable-gen-ai-app-using-vertex-ai)."]]