Precios de Vertex AI Agent Builder
Los precios aparecen en dólares estadounidenses (USD).
Los precios de las funciones con disponibilidad general (DG) que se indican se aplicarán a partir del 1 de septiembre de 2023.
Vertex AI Agent Builder permite que todos los desarrolladores, incluso aquellos con habilidades limitadas respecto al aprendizaje automático, aprovechen el poder de los modelos de lenguaje de base, la experiencia de búsqueda y las tecnologías de IA conversacional de Google para compilar aplicaciones de IA generativa de nivel empresarial.
Créditos de prueba y asistencia
Se otorgan$ 1,000 en créditos de prueba GRATUITOS para usar con Vertex AI Agent Builder. Estos créditos son válidos por un período de 1 año a partir del registro de la cuenta en Vertex AI Agent Builder a partir del 18 de julio de 2023.
¿Tienes preguntas sobre la funcionalidad de GA o el paquete y el precio de las funciones de versión preliminar?
Comunícate con tu equipo de ventas de Google Cloud para obtener más información.
Precios de los agentes de Vertex AI
Vertex AI Agent Builder proporciona la capacidad de compilar rápidamente agentes virtuales (chatbots) que generan respuestas basadas en el contenido (sitio web, documentos) que incluyes en los almacenes de datos. Con Vertex AI Agents, puedes crear un nuevo agente virtual de Dialogflow CX O agregar la función a un agente virtual de Dialogflow CX existente.
Para agregar capacidades adicionales de IA generativa a tus agentes virtuales de Dialogflow CX, puedes aprovechar las respuestas alternativas generativas, que usan un modelo de lenguaje grande (LLM) para manejar con elegancia situaciones en las que no hay coincidencia con la intención del usuario. Los generadores permiten a los creadores de bots inyectar acciones generativas en cualquier parte del flujo de conversación, como resumir una conversación, personalizar una interacción o encadenar varias llamadas de LLM para crear un flujo de trabajo generativo completo.
Precios de la funcionalidad de Vertex AI Agents en versión de lanzamiento general
Chat de agentes de Vertex AI* | USD 12 por cada 1,000 consultas** |
---|---|
Voz de los agentes de Vertex AI* | $0.002 por segundo† |
Dialogflow CX Chat***(Capacidades de IA estándar, no generativas, para Chat) | USD 7 por cada 1,000 consultas** |
Dialogflow CX Voice***(Funciones de IA estándar no generativa para Voice) | $0.001 por segundo† |
* Todas las funciones de IA generativa: Los agentes de almacén de datos, las respuestas de emergencia generativas, los generadores y las apps de agentes están cubiertos por los precios del SKU de Vertex AI Agents Chat and Voice. Si usas varios tipos de atributos de IA generativa en una sola solicitud, se te cobrará por cada uno de ellos por separado según su uso. * Los clientes pueden combinar consultas/segundos de Dialogflow CX (no generativa) y Vertex AI Agents (generativa) en el mismo agente o flujo, y se les cobrará automáticamente por el uso real de cada conjunto de atributos. Esto te permite aprovechar la IA generativa de forma selectiva cuando sea aplicable y pagar solo por lo que realmente usas. **Solicitud (o consulta): Facturación medida por solicitud o consulta individual. Una solicitud o consulta se define como cualquier llamada a la API del servicio de Dialogflow o del servicio de Vertex AI Agents, ya sea directa mediante el uso de la API o indirecta mediante la integración o el uso de la consola. Por ejemplo, un usuario le hace una pregunta a un agente virtual (chatbot) y el chatbot responde es 1 solicitud. La interacción de un usuario con el chatbot puede estar compuesta de varias solicitudes para completar una tarea. † Incluye reconocimiento de voz, voz a texto (STT), síntesis de voz, texto a voz (TTS) y telefonía. La duración total del procesamiento de audio facturado es independiente del procesamiento sin cargo que no sea de audio (latencia de la API, procesamiento de webhook, etc.) que puede ocurrir antes, durante o después del procesamiento de audio. * Dialogflow CX Chat y Dialogflow CX Voice no son aptos para los créditos de prueba GRATUITOS de USD 1,000. Dialogflow CX tiene un programa de créditos de prueba adicionales que se puede combinar con este programa de créditos de prueba GRATUITA de Vertex AI Agent Builder. Consulta las definiciones adicionales de la medición de Dialogflow CX aquí. |
Ejemplo de precios para la funcionalidad de DG de Vertex AI Agents
Ejemplo de combinación de respuestas generativas y basadas en el objetivo: Asistencia al cliente en el sitio web
- Los flujos determinísticos basados en la intención se usan para algunas preguntas específicas del cliente (facturación, pago)
- Las respuestas generativas se usan para responder preguntas en las que no se define la intención, pero la respuesta está en el sitio web.
Suposiciones:
- 100 millones de visitas anuales al sitio web
- El 5% de los visitantes usan el chatbot, 3 consultas por uso, 50% generativo, 50% basado en la intención
Volumen de SKU | Tasa | Precio de lista total |
---|---|---|
Chat de Dialogflow CX (basado en la intención) | ||
7.5 millones anuales 100 millones*5% de uso*3 consultas*50% basadas en la intención |
* $7.00 / 1,000 consultas = | USD 52,500 |
Chat de Dialogflow CX Enterprise (generativo) | ||
7.5 millones anuales 100 millones*5% de uso*3 consultas*50% de generativas |
* $12.00 / 1,000 consultas = | $90,000 |
Datos indexados | ||
50 GB anuales 10 GB gratis, por lo que se usan 40 GB en el cálculo de precios |
* $5.00 / GB * 12 meses = | USD 2,400 |
Precios de Vertex AI Search
Vertex AI Agent Builder proporciona la capacidad de compilar rápidamente motores de búsqueda para sitios web, datos no estructurados y datos estructurados para recuperar información y generar respuestas fundamentadas. Puedes leer más sobre las funciones disponibles en Vertex AI Search.
Precios de la funcionalidad de Vertex AI Search en versión de lanzamiento de la versión general
Edición estándar de la Búsqueda | $2.00 / 1,000 consultas | |
---|---|---|
Búsqueda Enterprise Edition | USD 4.00 / 1,000 consultas | |
Complemento de LLM (se puede agregar a la edición Standard y a la edición Enterprise) |
Básico | +USD 4 / 1,000 de consulta de entrada del usuario |
Avanzado | +USD 10 / 1,000 consultas de entrada de usuario | |
Search Standard Edition: Funciones de búsqueda no estructurada Edición Search Enterprise: Funciones de búsqueda no estructurada y búsqueda en sitios web Complemento LLM básico: Proporciona respuestas y resúmenes para consultas simples de un solo turno o de varios turnos, con la capacidad de procesar consultas simples, consultas compuestas, consultas largas y consultas de varios turnos, y que admite modelos como TextBison, Gemini 1.0 Series y Gemini 1.5 Flash (Vínculo) Complemento LLM avanzado: Proporciona respuestas y resúmenes para consultas de varios hops (una consulta que contiene dos o más preguntas anidadas, en las que la respuesta a una pregunta aclara la siguiente pregunta que debe responderse), y que admite modelos como TextBison, Gemini 1.0 Series y Gemini 1.5 Flash (Vínculo) . Cobramos por la cantidad de consultas de entrada del usuario, no por la cantidad de saltos. Vista previa privada: Búsqueda estructurada y nuevas capacidades de IA generativa (comunícate con Ventas para conocer las funciones más recientes) Consulta: La facturación se mide por solicitud o entrada de consulta individual. Una solicitud o consulta se define como cualquier llamada a la API de Enterprise Search, ya sea directa mediante el uso de la API o indirecta mediante la integración o el uso de la consola. Por ejemplo, cuando un usuario hace una pregunta en lenguaje natural y el motor de búsqueda responde, esa es una consulta. El complemento de LLM es agregado a una consulta para aumentar el procesamiento y usar una solución atributo, El complemento de LLM puede usarse indistintamente con Search Standard o Search Enterprise Edition. Ejemplo: Ejecución de una consulta de Search Enterprise con una solicitud de resumen = 1 consulta de Search Enterprise + 1 consulta complementaria de LLM |
Ejemplo de precios para la funcionalidad de DG de Vertex AI Search
Ejemplo de datos no estructurados : Búsqueda de documentos
Suposición:
- 10 millones de búsquedas de la edición estándar al año
- 10 millones de consultas de la edición empresarial con 10 millones de consultas de resumen de LLM por año
- 100,000 documentos de ~1 MB cada uno
Volumen de SKU | Tasa | Precio de lista total |
---|---|---|
Búsqueda estándar | ||
10 millones anuales | * $2.00 / 1,000 consultas = | $20,000 |
Búsqueda empresarial | ||
10 millones anuales | * $4.00 / 1,000 búsquedas = | $40,000 |
Complemento de LLM de búsqueda básica Cada consulta agregada a la consulta estándar o Enterprise |
||
10 millones anuales | * +USD 4 / 1,000 búsquedas de entrada del usuario = | +USD 40,000 |
Complemento de LLM de Búsqueda avanzada Cada consulta agregada a una consulta estándar o Enterprise |
||
10 millones anuales | * +$10.00 / 1,000 consultas de entrada del usuario = | +USD 100,000 |
Datos indexados | ||
100 GB anuales 10 GB sin usar, por lo que se usaron 90 GB en el cálculo de precios | * $5.00 / GB * 12 meses = | USD 5,400 |
Precios de Data Index
Precios del almacenamiento de datos de índice de Vertex AI Agent Builder
Datos indexados | $5.00 por GiB al mes |
---|---|
* Se proporciona una cuota gratuita de 10 GiB por mes ** Se comparte en Vertex AI Agent Builder *** El almacenamiento se calcula como 500 kibibytes (KiB) * "cantidad de páginas en el sitio web", en la que 1 KiB equivale a 1,024 bytes. (500 KiB equivalen a ~0.000477 GiB; por lo tanto, la indexación de datos el precio de un sitio web de 1,000 páginas es de 2,38 USD por mes). |
Precios de Vertex AI Search para la atención médica
Vertex AI Search for Healthcare proporciona la capacidad de crear rápidamente motores de búsqueda ajustados médicamente con datos de atención médica.
Búsqueda de Healthcare | $20.00 / 1,000 consultas |
---|
Vertex AI Search para el sector de la salud incluye algunas funciones en versión preliminar, como las respuestas de IA generativa, las actualizaciones de transmisión al índice y otras. Es posible que estas funciones tengan un precio diferente al que se indica actualmente cuando se lancen a la disponibilidad general.
Ejemplo de precios para la Búsqueda de Healthcare
Suposición:
1,000,000 de solicitudes de búsqueda de información de salud por mes
1,000 GiB de datos de atención médica indexados
Volumen de SKU | Tasa | Precio de lista total |
---|---|---|
1,000,000 búsquedas | USD 20/1,000 | $20,000 |
1,000 GiB | $5 por GiB | $5,000 |
Precios de Vertex AI Search para contenido multimedia
Vertex AI Search for Media te permite proporcionar resultados de video muy relevantes, ya que aprovecha la consulta y la comprensión contextual de Google para mejorar el descubrimiento en tu sitio de medios.
Vertex AI Agent Builder: Índice de datos | USD 5.00 por GB al mes |
---|---|
Vertex AI Search: Cantidad de solicitudes de la API de búsqueda de contenido multimedia | $2.00 / 1,000 consultas |
Precios de Vertex AI Search para recomendaciones de contenido multimedia
Las únicas operaciones de Media Recommendations que generan costos son los entrenamientos, los ajustes o las solicitudes de predicciones mediante una llamada al método recommend. No se aplican cargos por importar o administrar eventos de usuario o información de documentos.
Los costos de entrenamiento (por nodo por hora) se cobran a diario si entrenas tu modelo o si envías una solicitud para reanudar el entrenamiento. Después de detener o borrar un modelo, ya no se te cobrará. Consulta la documentación sobre la administración de entrenamiento.
Los costos de ajustes (por nodo por hora) para los modelos activos se cobrarán después de que se finalice el ajuste de forma correcta. Solo se te cobrará el ajuste incompleto si pausas o borras un modelo durante un ajuste en curso. En este caso, se te cobrará por las horas de procesamiento de nodo que se consumieron antes de que el ajuste del modelo se detuviera. Consulta la documentación sobre la administración de ajustes.
Solicitudes de predicción por mes | Precio por 1,000 predicciones |
---|---|
Hasta 20,000,000 | $0.27 |
Siguientes 280,000,000 | $0.18 |
Después de 300,000,000 | $0.10 |
Función | Precio |
Entrenamiento y ajuste | $2.50 por nodo por hora |
Ejemplo de precios para las recomendaciones de contenido multimedia
Suposición:
1,000,000,000 de solicitudes de predicción por mes
Entrena un solo modelo por día, que vuelve a entrenar automáticamente una vez por día
Equivale a unas 500 horas de procesamiento de nodo de entrenamiento de modelos y 100 horas de ajuste de modelos por mes
Volumen de SKU | Tasa | Precio de lista total |
---|---|---|
Primeros 20 millones de predicciones | * $0.27 / 1,000 predicciones = | USD 5,400 |
Siguientes 280 millones de predicciones | * $0.18 / 1,000 predicciones = | USD 50,400 |
Las siguientes 700 millones de predicciones | * $0.10 / 1,000 predicciones = | $70,000 |
500 horas de procesamiento de nodo (entrenamiento) | * $2.50 por hora = | USD 1,250 |
100 horas de procesamiento de nodos (ajuste) | * $2.50 por hora = | $250 |
Total | USD 127,300 |
Cargos de Google Cloud Observability
Las recomendaciones de medios registran un error en Google Cloud Observability cada vez que una solicitud a la API da como resultado un error (por ejemplo, si una solicitud de evento del usuario contiene un archivo JSON con formato incorrecto o si una solicitud de importación de documentos tiene un precio negativo). Las recomendaciones de medios también registran un error cada vez que hay una solicitud de predicción con un documento que no se encuentra en el almacén de datos importado.
Google Cloud Observability cobra por la cantidad de GiB de registros almacenados y por la retención más allá del período de retención predeterminado. Para obtener más información sobre la asignación gratuita y la retención de datos, consulta la página de precios de Google Cloud Observability.
El volumen de datos de los registros varía según el tamaño de la carga útil JSON, pero un GiB equivale a unos 200,000 errores de Recomendaciones de medios.
Precios de la API de generación fundamentada
La API de Grounded Generation te permite crear respuestas generativas a tus instrucciones con información de la Búsqueda de Google o tus propios datos.
Instrucción de entrada (incluye instrucciones para el usuario, instrucciones del sistema y hechos de conexión a tierra integrados) | Se cobra al precio del modelo de Gemini seleccionado. |
Resultado | Se cobra al precio del modelo de Gemini seleccionado. |
Generación fundamentada para fundamentar con tus propios datos recuperados | $2.50 por 1,000 solicitudes |
Generación fundamentada para la fundamentación en la Búsqueda de Google | Consulta Fundamentación en la Búsqueda de Google. |
Los cargos adicionales por recuperación de datos se determinan por el sistema de recuperación seleccionado (p.ej., Vertex AI Search). |
Ejemplo 1: Fundamentación en Vertex AI Search y hechos de fundamentación integrada
El usuario usa Vertex AI Search y hechos de fundamentación adicionales para generar respuestas fundamentadas. Cada instrucción de entrada tiene 2,500 caracteres (incluidos los hechos de vinculación integrados) y cada instrucción de salida tiene 200 caracteres. El usuario seleccionó Gemini 1.5 Flash.
Volumen por solicitud | Precio por cada 1,000 solicitudes | |
---|---|---|
Instrucción de entrada | 2,500 caracteres | 1,000 solicitudes * $0.000125 por 1,000 caracteres * 2,500 caracteres por solicitud = $0.3125 por 1,000 solicitudes |
Resultado | 200 caracteres | 1,000 solicitudes * $0.000375 por cada 1,000 caracteres * 2 caracteres por solicitud = $0.075 por cada 1,000 solicitudes |
Generación fundamentada para fundamentar con tus propios datos recuperados | 1 solicitud | $2.50 por cada 1,000 solicitudes |
Recuperación de datos: Vertex AI Search (edición Enterprise) | 1 solicitud | USD 4.00 por cada 1,000 solicitudes |
Total: $6.8875 por cada 1,000 solicitudes |
Ejemplo 2: Conocimientos básicos sobre la Búsqueda de Google
El usuario usa la Búsqueda de Google para generar respuestas fundamentadas. Cada instrucción de entrada tiene 500 caracteres y cada instrucción de salida tiene 200 caracteres. El usuario seleccionó Gemini 1.5 Flash.
Volumen por solicitud | Precio por cada 1,000 solicitudes | |
---|---|---|
Instrucción de entrada | 500 caracteres | 1,000 solicitudes * $0.000125 por cada 1,000 caracteres * 500 caracteres por solicitud = $0.0625 por cada 1,000 solicitudes |
Resultado | 200 caracteres | 1,000 solicitudes * $0.000375 por cada 1,000 caracteres * 200 caracteres por solicitud = $0.075 por cada 1,000 solicitudes |
Generación fundamentada para la fundamentación en la Búsqueda de Google | 1 solicitud | USD 35 por cada 1,000 solicitudes |
Total: $35.1375 por cada 1,000 solicitudes |
Consulta los precios de la API de Grounding
La verificación de la fundamentación proporciona la capacidad de determinar qué tan fundamentado está un fragmento de texto (la respuesta candidata) en un conjunto determinado de textos de referencia (los hechos).
Verifica la conexión a tierra | $0.00075 por cada 1,000 caracteres de respuesta |
Precios de las funciones de Document AI
Para obtener información completa sobre los precios de todas las funciones de Document AI, consulta la página de precios de Document AI.
Para las funciones de Document AI integradas y facturadas a través de Vertex AI Search, consulta las tablas que se muestran a continuación.
Digitaliza texto
Procesador | Entre 1 y 5,000,000 páginas por mes * | A partir de 5,000,000 páginas por mes |
---|---|---|
Procesador de OCR de documentos empresarial | $1.50 cada 1,000 páginas | $0.60 cada 1,000 páginas |
Extrae estructuras y entidades de documentos
Parser de diseño (incluye el segmentado inicial) | $10 por cada 1,000 páginas |
*El tamaño de una página depende del formato de archivo.
Imágenes (JPEG/JPG, PNG, BMP, HEIF): Cada imagen = 1 página
PDF: Cada página del PDF = 1 página
TIFF: Cada imagen en el TIFF = 1 página
Word (DOCX): Hasta 3,000 caracteres = 1 página
Excel (XLSX): Cada pestaña = 1 página
PowerPoint (PPTX): Cada diapositiva = 1 página
HTML: Hasta 3,000 caracteres = 1 página
Documentos analizados: Hasta 3,000 caracteres = 1 página
Precios de la API de Ranking
La API de clasificación toma una lista de documentos y los vuelve a clasificar según la relevancia de los documentos para una consulta.
En comparación con las incorporaciones, que solo analizan la similitud semántica de un documento y una consulta, la API de clasificación puede darte puntuaciones precisas sobre qué tan bien responde un documento a una consulta determinada.
La API de clasificación se puede usar para mejorar la calidad de los resultados de la búsqueda después de recuperar un conjunto inicial de documentos candidatos.
Clasifica documentos
Clasificación | $1 por 1,000 consultas |
---|
Una consulta se define como tener hasta 100 documentos, aunque un usuario puede especificar más de 100 documentos por consulta. En el caso de que se especifiquen más de 100 documentos, el precio aumenta en 1 por cada múltiplo de 100 documentos.
Por ejemplo:
132 documentos para clasificar = 2 consultas
200 documentos para clasificar = 2 consultas
399 documentos para clasificar = 4 consultas
401 documentos para clasificar = 5 consultas
¿Qué sigue?
- Lee la documentación de Vertex AI Agent Builder.
- Prueba la calculadora de precios.