Precios de Vertex AI Agent Builder

Los precios aparecen en dólares estadounidenses (USD).

Los precios de las funciones disponibles de forma general (DG) se invocarán el 1 de septiembre de 2023.

Vertex AI Agent Builder permite que los desarrolladores, incluso aquellos con conocimientos limitados sobre el aprendizaje automático, aprovechen las la potencia de los modelos grandes de lenguaje fundamentales de Google, la experiencia en la búsqueda y las tecnologías de IA conversacional para crear apps de IA generativa de nivel empresarial

Créditos de prueba y Asistencia

Se otorgan $ 1,000 en créditos de prueba GRATUITA por su uso con Vertex AI Agent Builder. Estos créditos son válidos por un período de 1 año a partir del registro de la cuenta en Vertex AI Agent Builder a partir del 18 de julio de 2023.

¿Tienes preguntas sobre el empaquetado y los precios de las funciones de disponibilidad general o preliminares?

Comunícate con tu equipo de Ventas de Google Cloud para obtener más información.

Precios de los agentes de Vertex AI

Vertex AI Agent Builder ofrece la capacidad de compilar con rapidez agentes virtuales (chatbots) que generan respuestas según el contenido (sitio web, documentos). que incluyas en los almacenes de datos. Con los agentes de Vertex AI puedes crear un nuevo Dialogflow CX o agregar la función a un agente virtual de Dialogflow CX existente.

Para agregar capacidades de IA generativa adicionales a tus agentes virtuales de Dialogflow CX, puedes aprovechar las opciones alternativas generadas por IA, que usan un modelo grande de lenguaje (LLM) para manejar correctamente situaciones en las que no hay coincidencia con el intent del usuario. Los generadores permiten que tus compiladores de bots inserten acciones generativas en cualquier parte de tu flujo de conversación, como resumir una conversación, personalizan una interacción o encadenan múltiples llamadas de LLM para crear todo un flujo de trabajo generativo.

Precios de la funcionalidad de disponibilidad general de los agentes de Vertex AI

Chat de agentes de Vertex AI* $12.00 por 1,000 consultas**
Vertex AI Agents Voice* $0.002 por segundo†
Dialogflow CX Chat***(capacidades estándar de IA no generativa para Chat) $7.00 por 1,000 consultas**
Dialogflow CX Voice***(capacidades estándar de IA no generativa para Voice) $0.001 por segundo†
* Todas las funciones de IA generativa: Los agentes de almacenes de datos, los resguardos generativos, los generadores y las apps de agentes se rigen por los precios del SKU de los agentes de Vertex AI y de Voice. Si usas varios tipos de funciones de IA generativa en una sola solicitud, se te cobrará por separado por cada función según su uso.

* Los clientes pueden combinar consultas/segundos de Dialogflow CX (no generativo) y de agentes de Vertex AI (generativos) en el mismo agente o flujo, y se les cobrará automáticamente por el uso real de cada conjunto de atributos. Esto te permite aprovechar la IA generativa de forma selectiva cuando corresponda y pagar solo por lo que realmente usas.

** Solicitud (o consulta): Facturación medida por solicitud o consulta individual.
Una solicitud o consulta se define como cualquier llamada a la API al servicio de Dialogflow o del servicio de agentes de Vertex AI, ya sea directa con el uso de la API o indirecta con la integración o el uso de la consola.
Por ejemplo, un usuario le hace una pregunta a un agente virtual (chatbot) y el chatbot responde 1 solicitud. Una interacción del usuario con el chatbot puede constar de varias solicitudes para realizar una tarea.

† Incluye reconocimiento de voz, voz a texto (STT), síntesis de voz, texto a voz (TTS) y telefonía. La duración total del procesamiento de audio facturado es independiente de cualquier procesamiento sin cargo que no sea de audio (latencia de la API, procesamiento de webhook, etc.) que pueda ocurrir antes, durante o después del procesamiento de audio.

* Dialogflow CX Chat y Dialogflow CX Voice no son aptos para los $1,000 en créditos de prueba GRATUITA. Dialogflow CX tiene un programa de créditos de prueba adicionales que se puede combinar con este programa de créditos de prueba GRATUITO de Vertex AI Agent Builder. Consulta definiciones adicionales de la medición de Dialogflow CX aquí.

Ejemplo de precios para la funcionalidad de disponibilidad general de los agentes de Vertex AI

Ejemplo de combinación de respuestas generativas y basadas en la intención: Asistencia al cliente en el sitio web

  • Los flujos determinísticos basados en la intención se usan para algunas preguntas específicas del cliente (facturación, pagos)
  • Respuestas generativas que se usan para manejar preguntas para las que no hay un intent definido, pero la respuesta está en el sitio web.

Suposiciones:

  • 100 millones de visitas anuales al sitio web
  • El 5% de los visitantes usa el chatbot, 3 consultas por uso, el 50% es generativo y el 50% se basa en la intención.
Volumen de SKU Tasa Precio total de lista
Chat de Dialogflow CX (basado en intents)
7.5 millones anuales
100 millones*5% de uso*3 de búsquedas*50% basadas en la intención
* $7.00 cada 1,000 consultas = USD 52,500
Chat de Dialogflow CX Enterprise (generativo)
7.5 millones anuales
100 millones*5% de uso*3 búsquedas*50% generativa
* $12.00 por 1,000 consultas = $90,000
Datos indexados
50 GB anuales
10 GB gratis, por lo que se usan 40 GB para calcular el precio
* $5.00 por GB × 12 meses = USD 2,400

Precios de Vertex AI Search

Vertex AI Agent Builder ofrece la capacidad de compilar rápidamente motores de búsqueda para sitios web, datos no estructurados y datos estructurados con el objetivo de recuperar información y generar respuestas fundamentadas. Puedes leer más sobre las funciones disponibles en Vertex AI Search.

Precios de la funcionalidad de DG de Vertex AI Search

Search Standard Edition* $2.00 por 1,000 búsqueda
Search Enterprise Edition* $4.00 por 1,000 búsqueda
Complemento de LLM de búsqueda básica** +USD 4.00 cada 1,000 consultas de entrada del usuario**
Complemento de LLM de búsqueda avanzada** +USD 10.00 cada 1,000 consultas de entrada del usuario**
Edición estándar de la Búsqueda: Capacidades de búsqueda no estructurada
Search Enterprise Edition: funciones no estructuradas de búsqueda y búsqueda en sitios web
Complemento de Búsqueda básica de LLM**: Proporciona respuestas y resúmenes a consultas simples de uno o varios turnos, con capacidad para procesar consultas simples y de varios turnos, y consultas largas y de varios turnos, además de modelos compatibles, como TextBison, la serie Gemini 1.0 y Gemini 1.5 Flash (Vínculo)
Complemento de búsqueda avanzada de LLM** (versión preliminar pública actual, DG, el 1 de julio de 2024): Proporciona respuestas y resúmenes a consultas de varios saltos (una consulta que contiene dos o más preguntas anidadas, una respuesta a una pregunta más acertada, que se podría responder) con modelos compatibles como TextBison, Gemini 1.0 Series y Gemini 1.5 Flash (vínculo). Se cobra por la cantidad de consultas de entrada del usuario, no por la cantidad de saltos
Versión preliminar privada: Búsqueda estructurada + Nuevas funciones de IA generativa (comunícate con Ventas para conocer las funciones más recientes)

*Consulta: facturación medida por solicitud individual o entrada de consulta
Una solicitud o consulta se define como cualquier llamada a la API de Enterprise Search, ya sea directa con el uso de la API o indirecta mediante la integración o el uso de la consola.
Ejemplo: Un usuario hace una pregunta en lenguaje natural y el motor de búsqueda responde es 1 consulta.

** El complemento de LLM es agregado a una consulta para aumentar el procesamiento y usar una solución atributo,
El complemento de LLM puede usarse indistintamente con Search Standard o Search Enterprise Edition.
Ejemplo: Ejecución de una consulta de Search Enterprise con una solicitud de resumen = 1 consulta de Search Enterprise + 1 consulta complementaria de LLM

Ejemplo de precios para la funcionalidad de DG de Vertex AI Search

Ejemplo de datos no estructurados : Búsqueda de documentos

Suposición:

  • 10 millones de consultas de la edición estándar al año
  • 10 millones de consultas de la edición Enterprise con 10 millones de consultas de resumen LLM al año
  • 100,000 documentos a aproximadamente 1 MB cada uno
Volumen de SKU Tasa Precio total de lista
Búsqueda estándar
10 millones anuales * $2.00 cada 1,000 consultas = $20,000
Search Enterprise
10 millones anuales * $4.00 cada 1,000 consultas = $40,000
Complemento de LLM de búsqueda básico
Cada consulta que se agrega a una consulta estándar o empresarial
10 millones anuales * + USD 4.00 cada 1,000 consultas de entrada de los usuarios = +USD 40,000
Complemento de LLM de búsqueda avanzada
Cada consulta que se agrega a una consulta estándar o empresarial
10 millones anuales * +$10.00 cada 1,000 consultas de entrada de los usuarios = +USD 100,000
Datos indexados
100 GB anuales 10 GB gratis, por lo que se usan 90 GB para calcular el precio * $5.00 por GB × 12 meses = USD 5,400

Precios del índice de datos

Precios del almacenamiento de datos de índice de Vertex AI Agent Builder

Datos indexados $5.00 por GiB al mes
* Se proporciona una cuota gratuita de 10 GiB por mes
** Se comparte en Vertex AI Agent Builder
*** El almacenamiento se calcula como 500 kibibytes (KiB) * "cantidad de páginas en el sitio web", en la que 1 KiB equivale a 1,024 bytes. (500 KiB equivalen a ~0.000477 GiB; por lo tanto, la indexación de datos el precio de un sitio web de 1,000 páginas es de 2,38 USD por mes).

Precios de Vertex AI Search for Healthcare

Vertex AI Search for Healthcare proporciona la capacidad de compilar rápidamente motores de búsqueda ajustados médicamente a partir de datos de atención médica.

Búsqueda de atención médica $20.00 por 1,000 búsqueda

Vertex AI Search for Healthcare incluye algunas funciones en versión preliminar, como respuestas de IA generativa, transmisiones de actualizaciones del índice y otras. El precio de estas funciones puede diferir del precio actual de lista cuando se lancen para el público en general.

Suposición:

  • 1,000,000 de solicitudes de búsqueda de atención médica al mes

  • 1,000 GiB de datos de atención médica indexados

Volumen de SKU Tasa Precio total de lista
1,000,000 de búsquedas USD 20 por cada 1000 $20,000
1,000 GiB $5 por GiB $5,000

Precios de Vertex AI Search for Media

Vertex AI Search for Media te permite proporcionar resultados de video altamente relevantes aprovechando las búsquedas y la comprensión contextual de Google para mejorar el descubrimiento en tu sitio de medios.

Vertex AI Agent Builder: Índice de datos $5.00 por GB por mes
Vertex AI Search: Recuento de solicitudes a la API de Media Search $2.00 por 1,000 búsqueda

Precios de Vertex AI Search para recomendaciones de contenido multimedia

Las únicas operaciones de recomendaciones de contenido multimedia que generan cargos son el entrenamiento, el ajuste o la solicitud de predicciones mediante una llamada al método recommend. No se aplican cargos por importar o administrar eventos de usuario o información de documentos.

Los costos de entrenamiento (por nodo, por hora) se cobran a diario si tu modelo se entrena de forma activa o si enviaste una solicitud para reanudar el entrenamiento. Después de pausar o borrar un modelo, ya no se te cobra. Consulta la documentación para administrar el entrenamiento.

Los costos de ajuste (por nodo y por hora) para los modelos activos se cobran una vez que se completa correctamente el ajuste. Solo se te cobra por un ajuste incompleto si pausas o borras un modelo durante un ajuste en curso. En este caso, se te cobra por las horas de procesamiento de nodo que se consumieron antes de que se detuviera el ajuste del modelo. Consulta la documentación para administrar el ajuste.

Solicitudes de Predictions por mes Precio por 1,000 predicciones
Hasta 20,000,000 $0.27
Siguientes 280,000,000 $0.18
Después de 300,000,000 $0.10
Función Precio
Entrenamiento y ajuste $2.50 por nodo por hora

Ejemplo de precios para las recomendaciones de contenido multimedia

Suposición:

  • 1,000,000,000 de solicitudes de predicción al mes

  • Entrena un solo modelo por día, que se vuelve a entrenar automáticamente una vez al día

  • Equivale a alrededor de 500 horas de procesamiento de nodo de entrenamiento de modelos y 100 horas de ajuste de modelos por mes

Volumen de SKU Tasa Precio total de lista
Primeros 20 millones de predicciones * $0.27 / 1,000 predicciones = USD 5,400
Los próximos 280 millones de predicciones * $0.18 / 1,000 predicciones = USD 50,400
Los próximos 700 millones de predicciones * $0.10 / 1,000 predicciones = $70,000
500 horas de procesamiento de nodo (entrenamiento) * $2.50 por hora = USD 1,250
100 horas de procesamiento de nodo (ajuste) * $2.50 por hora = $250
Total USD 127,300

Cargos de Google Cloud Observability

Recomendaciones de contenido multimedia registra un error en Google Cloud Observability por cada solicitud a la API que Se genera un error, como una solicitud de evento de usuario que contiene JSON con formato incorrecto. o una solicitud de importación de documentos con un precio negativo. Las recomendaciones de contenido multimedia también registran un error por cada solicitud de predicción con un que no está en el almacén de datos importado.

Los cargos de Google Cloud Observability se calculan por GiB de los registros almacenados y por la retención más allá del período de retención predeterminado. Para obtener detalles sobre la asignación gratuita y la retención de datos, consulta la página de precios de Google Cloud Observability.

El tamaño de los datos de registro depende del tamaño de tu carga útil JSON. pero un GiB equivale a unos 200,000 errores de recomendaciones de contenido multimedia.

Precios de la API de Grounded Generation

La API de Grounded Generation te permite crear respuestas generativas a tus instrucciones usando información de la Búsqueda de Google o tus propios datos.

Mensaje de entrada (incluye instrucciones para el usuario, instrucciones del sistema y datos de fundamentación intercalada) Se cobra según el precio del modelo de Gemini seleccionado.
Resultado Se cobra según el precio del modelo de Gemini seleccionado.
Generación basada en fundamentos para fundamentar tus propios datos recuperados $2.50 por 1,000 solicitudes
Generación basada en fundamentos para la Búsqueda de Google Consulta Fundamentos de la Búsqueda de Google.
Los cargos adicionales por la recuperación de datos se determinan a través del sistema de recuperación seleccionado (p.ej., Vertex AI Search).

Ejemplo 1: Bases en Vertex AI Search y hechos de fundamentación intercalada

El usuario usa Vertex AI Search y hechos fundamentales adicionales para generar respuestas fundamentadas. Cada instrucción de entrada tiene 2,500 caracteres (incluidos los hechos de fundamentación intercalada) y cada instrucción de salida tiene 200 caracteres. El usuario seleccionó Gemini 1.5 Flash.

Volumen por solicitud Precio por cada 1,000 solicitudes
Instrucción de entrada 2,500 caracteres 1,000 solicitudes × $0.000125 cada 1,000 caracteres × 2,500 caracteres por solicitud = $0.3125 cada 1,000 solicitudes
Resultado 200 caracteres 1,000 solicitudes × $0.000375 cada 1,000 caracteres × 2 caracteres por solicitud = $0.075 cada 1,000 solicitudes
Generación basada en fundamentos para fundamentar tus propios datos recuperados 1 solicitud $2.50 por 1,000 solicitudes
Recuperación de datos: Vertex AI Search (edición Enterprise) 1 solicitud $4.00 por 1,000 solicitudes
Total: $6.8875 cada 1,000 solicitudes

El usuario utiliza la Búsqueda de Google para generar respuestas fundamentadas. Cada instrucción de entrada tiene 500 caracteres y cada instrucción de salida de 200 caracteres. El usuario seleccionó Gemini 1.5 Flash.

Volumen por solicitud Precio por cada 1,000 solicitudes
Instrucción de entrada 500 caracteres 1,000 solicitudes × $0.000125 cada 1,000 caracteres × 500 caracteres por solicitud = $0.0625 cada 1,000 solicitudes
Resultado 200 caracteres 1,000 solicitudes × $0.000375 cada 1,000 caracteres × 200 caracteres por solicitud = $0.075 cada 1,000 solicitudes
Generación basada en fundamentos para la Búsqueda de Google 1 solicitud $35.00 cada 1,000 solicitudes
Total: $35.1375 cada 1,000 solicitudes

Verifica los precios de la API de Grounding

Verificar los fundamentos permite determinar qué tan fundamentado está un texto (la variante de respuesta) en un conjunto determinado de textos de referencia (los hechos).

Verifica la puesta a tierra $0.00075 por 1,000 caracteres de respuesta

Precios de las funciones de Document AI

Para obtener información completa sobre los precios de todas las funciones de Document AI, consulta la página de precios de Document AI.

Para conocer las funciones de Document AI integradas y facturadas a través de Vertex AI Search, consulta las siguientes tablas.

Digitalizar texto

Procesador De 1 a 5,000,000 de páginas al mes * A partir de 5,000,000 páginas por mes
Procesador de OCR de documentos empresariales $1.50 cada 1,000 páginas $0.60 cada 1,000 páginas

Extrae estructuras y entidades de documentos

Analizador de diseño (incluye la fragmentación inicial) $10 cada 1,000 páginas

*El tamaño de una página depende del formato de archivo:

  • Imágenes (JPEG/JPG, PNG, BMP, HEIF): Cada imagen = 1 página

  • PDF: Cada página del PDF = 1 página

  • TIFF: Cada imagen en el archivo TIFF = 1 página

  • Word (DOCX): Hasta 3,000 caracteres = 1 página

  • Excel (XLSX): Cada pestaña = 1 página

  • PowerPoint (PPTX): Cada diapositiva = 1 página

  • HTML: Hasta 3,000 caracteres = 1 página

  • Documentos analizados: hasta 3,000 caracteres = 1 página

Precios de la API de Ranking

La API de clasificación toma una lista de documentos y los vuelve a clasificar según su relevancia para una consulta.

En comparación con las incorporaciones, que solo observan la similitud semántica de un documento y una consulta, la API de clasificación puede proporcionar puntuaciones precisas sobre qué tan bien responde un documento a una consulta dada.

Se puede usar la API de clasificación para mejorar la calidad de los resultados de la búsqueda después de recuperar un conjunto inicial de documentos candidatos.

Clasificar documentos

Clasificación $1 por 1,000 consultas

Una consulta incluye hasta 100 documentos, aunque un usuario puede especificar más de 100 documentos por consulta. Cuando se especifican más de 100 documentos, el precio aumenta en 1 por cada múltiplo de 100 documentos.
Por ejemplo:

  • 132 documentos para clasificar = 2 consultas

  • 200 documentos para clasificar = 2 consultas

  • 399 documentos para clasificar = 4 consultas

  • 401 documentos para clasificar = 5 consultas

¿Qué sigue?

Solicita una cotización personalizada

Con los precios de pago por uso de Google Cloud, solo pagas por los servicios que usas. Comunícate con nuestro equipo de Ventas y obtén una cotización personalizada para tu organización.
Comunicarse con Ventas