Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
En esta página, se describen los precios y la facturación de Vertex AI RAG Engine en función de los componentes que usas, como modelos, clasificación de nuevo y almacenamiento de vectores.
El motor de RAG de Vertex AI es de uso gratuito. Sin embargo, si configuras los componentes de Vertex AI RAG Engine, es posible que la facturación se vea afectada.
En esta tabla, se explica cómo funciona la facturación cuando usas los componentes de RAG.
Componente
Cómo funciona la facturación con el motor de RAG de Vertex AI
Vertex AI RAG Engine admite la transferencia de datos de diferentes fuentes de datos. Por ejemplo, subir archivos locales, Cloud Storage y Google Drive. El acceso a los archivos de estas fuentes de datos desde Vertex AI RAG Engine es gratuito, pero es posible que estas fuentes de datos cobren por la transferencia de datos. Por ejemplo, los costos de salida de datos.
Analizador de LLM: Vertex AI RAG Engine usa el modelo de LLM que especificaste para analizar tu archivo, y verás y pagarás los costos del modelo de LLM directamente desde tu proyecto.
Analizador de diseño de Document AI: El motor de RAG de Vertex AI usa el analizador de diseño de Document AI que especificaste para procesar tu archivo, y verás y pagarás el uso del analizador de diseño de Document AI directamente desde tu proyecto.
El motor de RAG de Vertex AI coordina la generación de la incorporación con el modelo de incorporación que especificaste, y se te facturan los costos asociados a ese modelo.
RAG Engine admite dos categorías de bases de datos vectoriales para la búsqueda de vectores:
Base de datos administrada por RAG
Base de datos de vectores propia
Una base de datos administrada por RAG tiene dos propósitos:
Una base de datos administrada por RAG
almacena recursos de RAG, como corpus y archivos de RAG. Se excluye el contenido del archivo.
Según tu elección, indexación y recuperación de embeddings para la búsqueda de vectores.
Una base de datos administrada por RAG usa una instancia de Spanner como backend.
Para cada uno de tus proyectos, Vertex AI RAG Engine aprovisiona un Google Cloud proyecto específico del cliente y administra los recursos administrados por RAG que se almacenan en Vertex AI RAG Engine, de modo que tus datos estén aislados físicamente.
Si eliges el nivel Básico RagManagedDB o el nivel Ajustado, Vertex AI RAG Engine aprovisiona una instancia de la edición Enterprise de Spanner en el proyecto correspondiente:
Nivel básico: 100 unidades de procesamiento con copia de seguridad
Nivel con ajuste de escala: A partir de 1 nodo (1,000 unidades de procesamiento) y ajuste de escala automático de hasta 10 nodos con copia de seguridad
Si algún corpus de RAG de tu proyecto elige usar una base de datos administrada por RAG para la búsqueda de vectores, se te cobrará por la instancia de Spanner administrada por RAG.
El motor de RAG de Vertex AI muestra los costos de Spanner de tu proyecto administrado por RAG correspondiente en tu proyecto Google Cloud , de modo que puedas ver y pagar los costos de la instancia de Spanner.
Para obtener más detalles sobre los precios de Spanner, consulta Precios de Spanner.
Se admiten las siguientes herramientas de clasificación después de la recuperación:
LLM Reranker: Vertex AI RAG Engine usa el
modelo de LLM que especificaste para volver a clasificar los resultados de la recuperación, y
verás y pagarás los costos del modelo de LLM directamente desde tu proyecto.
API de clasificación de Vertex AI Search:
El motor de RAG de Vertex AI usa la
API de clasificación de Vertex AI Search para volver a clasificar los resultados de la recuperación, y verás y pagarás la API de clasificación directamente desde tu proyecto.
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Información o código de muestra incorrectos","incorrectInformationOrSampleCode","thumb-down"],["Faltan la información o los ejemplos que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-04 (UTC)"],[],[],null,["# Vertex AI RAG Engine billing\n\n| The [VPC-SC security controls](/vertex-ai/generative-ai/docs/security-controls) and\n| CMEK are supported by Vertex AI RAG Engine. Data residency and AXT security controls aren't\n| supported.\n\nThis page describes the Vertex AI RAG Engine pricing and billing based on the Vertex AI RAG Engine components you use, such as models, reranking, and vector storage.\n\nFor more information, see the [Vertex AI RAG Engine overview](/vertex-ai/generative-ai/docs/rag-engine/rag-overview) page.\n\nPricing and billing\n-------------------\n\nVertex AI RAG Engine is free to use. However, if you configure\nVertex AI RAG Engine components, the billing might be affected.\n\nThis table explains how billing works when you use the RAG components.\n\nWhat's next\n-----------\n\n- To learn how to use the Vertex AI SDK to run Vertex AI RAG Engine tasks, see [RAG quickstart for\n Python](/vertex-ai/generative-ai/docs/rag-quickstart).\n- To learn about grounding, see [Grounding\n overview](/vertex-ai/generative-ai/docs/grounding/overview).\n- To learn more about the responses from RAG, see [Retrieval and Generation Output of Vertex AI RAG Engine](/vertex-ai/generative-ai/docs/model-reference/rag-output-explained).\n- To learn about the RAG architecture:\n - [Infrastructure for a RAG-capable generative AI application using Vertex AI and Vector Search](/architecture/gen-ai-rag-vertex-ai-vector-search)\n - [Infrastructure for a RAG-capable generative AI application using Vertex AI and AlloyDB for PostgreSQL](/architecture/rag-capable-gen-ai-app-using-vertex-ai)."]]