Los precios aparecen en dólares estadounidenses.
Los precios de las funciones con disponibilidad general (DG) que se indican se aplicarán a partir del 1 de septiembre de 2023.
Vertex AI Search permite que todos los desarrolladores, incluso aquellos con habilidades limitadas respecto al aprendizaje automático, aprovechen el poder de los modelos de lenguaje grandes de base, la experiencia de búsqueda y las recomendaciones de Google para compilar aplicaciones de IA generativa de nivel empresarial.
✩ Nota interna de Google: Para obtener más información sobre los precios, consulta go/vertexsc-pricing.
Vertex AI Search ofrece la capacidad de crear rápidamente motores de búsqueda para sitios web, datos no estructurados y datos estructurados para recuperar información y generar respuestas fundamentadas. Puedes leer más sobre las funciones disponibles en Vertex AI Search.
Vertex AI Search ofrece dos modelos de precios: General y Configurable. Debes elegir un modelo para tu aplicación de búsqueda y sus almacenes de datos asociados.
Precios generales | Precios configurables | |
|---|---|---|
Ideal para | Comienza rápido Cargas de trabajo con menos de 15 M de consultas Tráfico impredecible | Cargas de trabajo con más de 15 millones de consultas por mes Necesidad de tráfico o capacidad de procesamiento predecible Flexibilidad para no usar siempre la semántica en todas las consultas |
Medidor de precios | Pago por consulta y por GB de datos indexados | Suscripción mensual para capacidad de consultas (QPM) y almacenamiento, con pago por consulta para funciones complementarias avanzadas |
Importante: Un almacén de datos creado con el modelo de precios configurable solo puede usarse en una app de búsqueda que también use ese modelo.
Precios generales de Vertex AI Search
Este modelo se basa en precios de pago por uso para las consultas de búsqueda y el almacenamiento de datos.
Prueba gratuita: Tendrás acceso a 10,000 consultas por cuenta y por mes sin costo para explorar Vertex AI Search sin una inversión inicial. No incluye las respuestas generativas avanzadas.
Precios de las consultas de búsqueda
Tipo | Precio (USD) |
|---|---|
Search Standard Edition Incluye recuperación semántica y optimización de KPI | $1.50 por 1,000 consultas |
Search Enterprise Edition incluye respuestas generativas principales (modo IA) | $4.00 por 1,000 consultas |
Respuestas generativas avanzadas (modo de IA) (se puede agregar tanto a la edición Standard como a la Enterprise) | +$4.00 por cada 1,000 consultas de entrada del usuario |
Search Standard Edition: Búsqueda no estructurada + capacidades de búsqueda estructurada
Search Enterprise Edition: Búsqueda no estructurada + Búsqueda estructurada + Funciones de búsqueda en sitios web
Vertex AI Search Enterprise Edition incluye Generative Answers (modo de IA) básico. Proporciona respuestas, resúmenes y seguimientos sin costo adicional. Nota: Las respuestas generativas principales no incluyen sugerencias de seguimiento, manejo de consultas complejas, manejo de consultas largas y multimodalidad.
Las respuestas generativas avanzadas incluyen funciones avanzadas como sugerencias de seguimiento, manejo de consultas complejas y multimodalidad.
Consulta: La facturación se mide por solicitud individual o entrada de consulta
Una solicitud o consulta se define como cualquier llamada a la API de Enterprise Search, ya sea directa con el uso de la API o indirecta con la integración o el uso de la consola.
Por ejemplo, cuando un usuario hace una pregunta en lenguaje natural y el motor de búsqueda responde, eso es una consulta.
Las respuestas generativas avanzadas (modo de IA) se agregan a una consulta para aumentar el procesamiento y usar una función de IA generativa.
Las respuestas generativas avanzadas (Modo IA) pueden usarse indistintamente con Search Standard o Search Enterprise Edition.
Ejemplo: Ejecución de una consulta de Search Enterprise con una solicitud multimodal = 1 consulta de Search Enterprise + 1 consulta de respuestas generativas avanzadas (modo de IA)
Precios de indexación y almacenamiento de datos
Consulta la sección Precios de Index Storage
Ejemplo de precios para la funcionalidad de DG de Vertex AI Search
Ejemplo de datos no estructurados : Búsqueda de documentos
Suposición:
Elemento | Volumen de SKU | Calificar | Precio de lista total |
|---|---|---|---|
Búsqueda estándar | 10 M anuales (con 10,000 de prueba gratuita) | * $1.50 por 1,000 consultas = | USD 14,985 |
Búsqueda empresarial con respuestas generativas principales (Modo IA) | 10 M anuales (con 10,000 de prueba gratuita) | * $4.00 por 1,000 consultas = | USD 39,960 |
Respuestas generativas avanzadas (modo de IA) Cada consulta agregada a la consulta Standard o Enterprise | 2 M anuales | * +$4.00 por cada 1,000 consultas de entrada del usuario = | Más de USD 8,000 |
Datos indexados | 100 GB anuales 10 GB gratis, por lo que se usan 90 GB en el cálculo del precio | * $5.00 por GB * 12 meses = | USD 5,400 |
Precios configurables de Vertex AI Search
Este modelo proporciona costos predecibles a través de suscripciones mensuales para la capacidad de búsqueda principal, con complementos opcionales de pago por uso para funciones adicionales. Está diseñado para clientes con cargas de trabajo coherentes que buscan un mayor control de costos.
Compromiso mensual mínimo: 1,000 consultas por minuto (QPM) y 50 GB de almacenamiento.
Precios de suscripción principales (facturación mensual)
SKU | Precio (USD) | Descripción |
|---|---|---|
Unidad de consulta | USD 0.008219178 / 1 hour | Una suscripción para la capacidad de procesamiento de consultas de tu aplicación de búsqueda |
Unidad de almacenamiento | USD 0.001369863 / 1 hour | Una suscripción para los datos sin procesar almacenados para la indexación |
Complementos de pago por uso. (se factura por cada 1,000)
Complemento | Precio (USD) | Descripción |
|---|---|---|
Semántica | $0.75 por 1,000 recuentos + $1.50 por GB al mes para embeddings | Permite la comprensión semántica y la búsqueda híbrida, y es necesario para la Visión general creada por IA y el Modo IA. El cargo adicional por almacenamiento cubre el costo de generar y mantener embeddings. |
KPI y personalización | USD 0.20 / 1,000 count | Permite volver a clasificar eventos y personalizarlos para optimizar los KPIs comerciales (participación, conversión) |
Respuestas generativas principales | USD 2.00 / 1,000 count | Genera respuestas, citas y seguimientos. Requiere el complemento semántico. |
Respuestas generativas avanzadas (modo de IA) | $4.00 por 1,000 recuentos | Maneja el recuento de conversaciones complejas de varios turnos y la multimodalidad. Requiere el complemento semántico. |
Excedentes: El uso que supera tu QPM suscrito se considera un excedente. De forma predeterminada, el recuento de excesos se factura con la tarifa de la edición estándar del modelo de precios general (USD 1.50 por 1,000 consultas).
Escalamiento: Puedes escalar verticalmente tu suscripción a QPM o almacenamiento en cualquier momento, con costos prorrateados por el resto del mes. La reducción de escala se aplica al comienzo del siguiente ciclo de facturación.
Ejemplo de precios configurables de Vertex AI Search
Ejemplo de datos estructurados : Búsqueda de hoteles
Suposición:
Elemento | Volumen de SKU | Calificar | Precio de lista total |
|---|---|---|---|
Suscripción principal: Unidad de consulta | 1,500 consultas por minuto | * USD 6.00 por QPM x suscripción mensual = | $9,000 |
Suscripción básica: Unidad de almacenamiento | 100 GB | * Suscripción de $1 por GB al mes = | $100 |
Complemento: Indexación semántica | 100 GB | * $1.50 por GB al mes | $150 |
Complemento: Consultas semánticas | 30 millones | * $0.75 por cada 1,000 consultas | USD 22,500 |
Complemento: KPI y personalización | 50 millones | * $0.20 por 1,000 consultas | $10,000 |
Complemento: Respuestas generativas principales | 10 millones | * $2.00 por 1,000 consultas | $20,000 |
Precios del almacenamiento de datos de índice de Vertex AI Search
Tipo | Precio (USD) |
|---|---|
Almacenamiento de índices | USD 0.006849315 / 1 gibibyte hour |
* Se proporciona una cuota gratuita de 10 GiB por mes
** Compartido en Vertex AI Search
***El costo de almacenamiento del índice se aplica al tamaño total de los datos sin procesar, que se muestrean con regularidad y se calculan como un promedio para el mes. Las operaciones para actualizar los datos no generan costos adicionales.
**** Para el almacén de datos de sitios web, el almacenamiento se calcula como 500 kibibytes (KiB) * "cantidad de páginas en el sitio web", en la que 1 KiB equivale a 1,024 bytes. (500 KiB equivalen a ~0.000477 GiB; por lo tanto, la indexación de datos el precio de un sitio web de 1,000 páginas es de $2.38 por mes).
Vertex AI Search para la atención médica proporciona la capacidad de crear rápidamente motores de búsqueda ajustados médicamente sobre datos de atención médica.
Tipo | Precio (USD) |
|---|---|
Búsqueda para el sector de la atención médica | USD 20.00 / 1,000 count |
Vertex AI Search for Healthcare incluye algunas funciones en versión preliminar, como respuestas de IA generativa, actualizaciones de transmisión al índice y otras. Estas funciones pueden tener un precio diferente al que se indica actualmente cuando se lancen para la disponibilidad general.
Ejemplo de precios para la Búsqueda de servicios de salud
Suposición:
Volumen de SKU | Calificar | Precio de lista total |
|---|---|---|
1,000,000 búsquedas | $20/1000 | $20,000 |
1,000 GiB | $5 por GiB | $5,000 |
Vertex AI Search for Media te permite proporcionar resultados de video altamente relevantes, aprovechando la consulta y la comprensión contextual de Google para mejorar el descubrimiento en tu sitio de medios.
Tipo | Precio (USD) |
|---|---|
Vertex AI Search: Índice de datos | 0 gibibyte month to 10 gibibyte month USD 0.00 (Free) / 1 gibibyte hour, per 1 month / account 10 gibibyte month and above USD 0.006849315 / 1 gibibyte hour, per 1 month / account |
Tipo | Precio (USD) |
|---|---|
Vertex AI Search: Recuento de solicitudes de la API de búsqueda de contenido multimedia | USD 2.00 / 1,000 count |
Las únicas operaciones de Recomendaciones de medios que generan costos son los entrenamientos, los ajustes o las solicitudes de predicciones mediante una llamada al método recommend. No se aplican cargos por importar o administrar eventos de usuario o información de documentos.
Los costos de entrenamiento (por nodo por hora) se cobran a diario si entrenas tu modelo o si envías una solicitud para reanudar el entrenamiento. Cuando pauses o detengas un modelo, ya no se te cobrará. Consulta la documentación sobre la administración de entrenamiento.
Los costos de ajustes (por nodo por hora) para los modelos activos se cobrarán después de que se finalice el ajuste de forma correcta. Solo se te cobrará el ajuste incompleto si pausas o borras un modelo durante un ajuste en curso. En este caso, se te cobrará por las horas de procesamiento de nodo que se consumieron antes de que el ajuste del modelo se detuviera. Consulta la documentación sobre la administración de ajustes.
Tipo | Precio (USD) |
|---|---|
Solicitudes de predicción por mes | USD 0.20 / 1,000 count |
Tipo | Precio (USD) |
|---|---|
Entrenamiento y ajuste | USD 2.50 / 1 hour |
Ejemplo de precios para las recomendaciones de contenido multimedia
Suposición:
Volumen de SKU | Calificar | Precio de lista total |
|---|---|---|
1,000 millones de predicciones | * $0.20 por 1,000 predicciones = | USD 200,000 |
500 horas de procesamiento de nodo (entrenamiento) | * $2.50 por hora = | USD 1,250 |
100 horas de procesamiento de nodos (ajuste) | * $2.50 por hora = | $250 |
Total | USD 201,500 |
Cargos de Google Cloud Observability
Recomendaciones de contenido multimedia registra un error en Google Cloud Observability cada vez que una solicitud a la API da como resultado un error (por ejemplo, si una solicitud de evento del usuario contiene un archivo JSON con formato incorrecto o si una solicitud de importación de documento tiene un precio negativo). Además, Recomendaciones de medios registra un error cada vez que hay una solicitud de predicción con un documento que no se encuentra en el almacén de datos importado.
Google Cloud Observability genera cargos por la cantidad de GiB de registros almacenados y por la retención más allá del período de retención predeterminado. Para obtener detalles sobre la asignación gratuita y la retención de datos, consulta la página de precios de Google Cloud Observability.
El volumen de datos de los registros varía según el tamaño de la carga útil JSON, pero un GiB equivale a unos 200,000 errores de Recomendaciones de contenido multimedia.
La API de Grounded Generation te permite crear respuestas generativas a tus instrucciones usando información de la Búsqueda de Google o tus propios datos.
Tipo | Precio (USD) |
|---|---|
Instrucción de entrada (incluye la instrucción del usuario, las instrucciones del sistema y los hechos de fundamentación en línea) | Se cobra al precio del modelo de Gemini seleccionado. |
Salida | Se cobra al precio del modelo de Gemini seleccionado. |
Generación fundamentada para fundamentar con tus propios datos recuperados | USD 2.50 / 1,000 count |
Generación fundamentada para la fundamentación en la Búsqueda de Google | Consulta Fundamentación en la Búsqueda de Google. |
Los cargos adicionales por la recuperación de datos se determinan por el sistema de recuperación seleccionado (p.ej., Vertex AI Search). |
Ejemplo 1: Fundamentación en Vertex AI Search y hechos de fundamentación en línea
El usuario usa Vertex AI Search y hechos de fundamentación adicionales para generar respuestas fundamentadas. Cada instrucción de entrada tiene 2,500 caracteres (incluidos los hechos de fundamentación en línea) y cada instrucción de salida tiene 200 caracteres. El usuario seleccionó Gemini 1.5 Flash.
Volumen por solicitud | Precio por 1,000 solicitudes | |
|---|---|---|
Instrucción de entrada | 2,500 caracteres | 1,000 solicitudes * $0.000125 por 1,000 caracteres * 2,500 caracteres por solicitud = $0.3125 por 1,000 solicitudes |
Salida | 200 caracteres | 1,000 solicitudes * $0.000375 por 1,000 caracteres * 2 caracteres por solicitud = $0.075 por 1,000 solicitudes |
Grounded Generation para fundamentar tus propios datos recuperados | 1 solicitud | USD 2.50 / 1,000 count |
Recuperación de datos: Vertex AI Search (edición Enterprise) | 1 solicitud | USD 4.00 / 1,000 count |
Total: $6.8875 por 1,000 solicitudes |
Ejemplo 2: Fundamentación en la Búsqueda de Google
El usuario usa la Búsqueda de Google para generar respuestas fundamentadas. Cada instrucción de entrada tiene 500 caracteres y cada instrucción de salida tiene 200 caracteres. El usuario seleccionó Gemini 1.5 Flash.
Elemento | Volumen por solicitud | Precio por 1,000 solicitudes |
|---|---|---|
Instrucción de entrada | 500 caracteres | 1,000 solicitudes * $0.000125 por 1,000 caracteres * 500 caracteres por solicitud = $0.0625 por 1,000 solicitudes |
Salida | 200 caracteres | 1,000 solicitudes * $0.000375 por 1,000 caracteres * 200 caracteres por solicitud = $0.075 por 1,000 solicitudes |
Generación fundamentada para la fundamentación en la Búsqueda de Google | 1 solicitud | 0 count to 10,000 count USD 0.00 (Free) / 1,000 count, per 1 day / account 10,000 count and above USD 35.00 / 1,000 count, per 1 day / account |
Total: $35.1375 por cada 1,000 solicitudes |
La verificación de la fundamentación proporciona la capacidad de determinar qué tan fundamentado está un fragmento de texto (la respuesta candidata) en un conjunto determinado de textos de referencia (los hechos).
Tipo | Precio (USD) |
|---|---|
Verificar la fundamentación | USD 0.00075 / 1,000 count |
Para obtener información completa sobre los precios de todas las funciones de Document AI, consulta la página de precios de Document AI.
Para las funciones de Document AI integradas en Vertex AI Search y facturadas a través de este servicio, consulta las tablas que se muestran a continuación.
Digitaliza texto
Procesador | Precio (USD) |
|---|---|
Cantidad de páginas procesadas para el procesador de OCR. | 0 count to 1,000 count USD 0.00 (Free) / 1,000 count, per 1 month / account 1,000 count to 5,000,000 count USD 1.50 / 1,000 count, per 1 month / account 5,000,000 count and above USD 0.60 / 1,000 count, per 1 month / account |
Extrae estructuras y entidades de documentos
Elemento | Precio (USD) |
|---|---|
Analizador de diseño (incluye la fragmentación inicial) | USD 10.00 / 1,000 count |
*El tamaño de una página depende del formato del archivo.
La API de clasificación toma una lista de documentos y los vuelve a clasificar en función de su relevancia para una consulta.
En comparación con las embeddings, que solo analizan la similitud semántica de un documento y una consulta, la API de clasificación puede darte puntuaciones precisas sobre qué tan bien un documento responde a una consulta dada.
La API de clasificación se puede usar para mejorar la calidad de los resultados de búsqueda después de recuperar un conjunto inicial de documentos candidatos.
Clasificar documentos
Elemento | Precio (USD) |
|---|---|
Clasificación | USD 1.00 / 1,000 count |
Una consulta se define como que tiene hasta 100 documentos, aunque un usuario puede especificar más de 100 documentos por consulta. En el caso de que se especifiquen más de 100 documentos, el precio aumenta en 1 por cada múltiplo de 100 documentos.
¿Qué sigue?