En esta página, se describen los precios y la facturación de Vertex AI RAG Engine en función de los componentes que usas, como modelos, clasificación de nuevo y almacenamiento de vectores.
Para obtener más información, consulta la página Descripción general de Vertex AI RAG Engine.
Precios y facturación
El motor de RAG de Vertex AI es de uso gratuito. Sin embargo, si configuras los componentes de Vertex AI RAG Engine, es posible que la facturación se vea afectada.
En esta tabla, se explica cómo funciona la facturación cuando usas los componentes de RAG.
Componente | Cómo funciona la facturación con el motor de RAG de Vertex AI |
---|---|
Transferencia de datos | Vertex AI RAG Engine admite la transferencia de datos de diferentes fuentes de datos. Por ejemplo, subir archivos locales, Cloud Storage y Google Drive. El acceso a los archivos de estas fuentes de datos desde Vertex AI RAG Engine es gratuito, pero es posible que estas fuentes de datos cobren por la transferencia de datos. Por ejemplo, los costos de salida de datos. |
Transformación de datos (análisis de archivos) |
|
Transformación de datos (división de archivos en fragmentos) | Admite la fragmentación de tamaño fijo, que es gratuita. |
Generación de embeddings | El motor de RAG de Vertex AI coordina la generación de la incorporación con el modelo de incorporación que especificaste, y se te facturan los costos asociados a ese modelo. Para obtener más información sobre los precios, consulta Costo de crear y, luego, implementar modelos de IA en Vertex AI. |
Indexación y recuperación de datos |
RAG Engine admite dos categorías de bases de datos vectoriales para la búsqueda de vectores:
Una base de datos administrada por RAG tiene dos propósitos:
Una base de datos administrada por RAG usa una instancia de Spanner como backend. Para cada uno de tus proyectos, Vertex AI RAG Engine aprovisiona un Google Cloud proyecto específico del cliente y administra los recursos administrados por RAG que se almacenan en Vertex AI RAG Engine, de modo que tus datos estén aislados físicamente. Si eliges el nivel Básico
Si algún corpus de RAG de tu proyecto elige usar una base de datos administrada por RAG para la búsqueda de vectores, se te cobrará por la instancia de Spanner administrada por RAG. El motor de RAG de Vertex AI muestra los costos de Spanner de tu proyecto administrado por RAG correspondiente en tu proyecto Google Cloud , de modo que puedas ver y pagar los costos de la instancia de Spanner. Para obtener más detalles sobre los precios de Spanner, consulta Precios de Spanner. |
Clasificación de nuevo para el motor de RAG de Vertex AI | Se admiten las siguientes herramientas de clasificación después de la recuperación:
|
¿Qué sigue?
- Si deseas obtener información para usar el SDK de Vertex AI para ejecutar tareas de Vertex AI RAG Engine, consulta la guía de inicio rápido de RAG para Python.
- Para obtener más información sobre la fundamentación, consulta Descripción general de la fundamentación.
- Para obtener más información sobre las respuestas de la RAG, consulta Resultados de recuperación y generación del motor de RAG de Vertex AI.
- Para obtener información sobre la arquitectura de RAG, haz lo siguiente: