Precios de Vertex AI Agent Builder
Los precios aparecen en dólares estadounidenses (USD).
Los precios de las funciones disponibles de forma general (DG) se invocarán el 1 de septiembre de 2023.
Vertex AI Agent Builder permite que los desarrolladores, incluso aquellos con conocimientos limitados sobre el aprendizaje automático, aprovechen las la potencia de los modelos grandes de lenguaje fundamentales de Google, la experiencia en la búsqueda y las tecnologías de IA conversacional para crear apps de IA generativa de nivel empresarial
Créditos de prueba y Asistencia
Se otorgan $ 1,000 en créditos de prueba GRATUITA por su uso con Vertex AI Agent Builder. Estos créditos son válidos por un período de 1 año a partir del registro de la cuenta en Vertex AI Agent Builder a partir del 18 de julio de 2023.
¿Tienes preguntas sobre el empaquetado y los precios de las funciones de disponibilidad general o preliminares?
Comunícate con tu equipo de Ventas de Google Cloud para obtener más información.
Precios de los agentes de Vertex AI
Vertex AI Agent Builder ofrece la capacidad de compilar con rapidez agentes virtuales (chatbots) que generan respuestas según el contenido (sitio web, documentos). que incluyas en los almacenes de datos. Con los agentes de Vertex AI puedes crear un nuevo Dialogflow CX o agregar la función a un agente virtual de Dialogflow CX existente.
Para agregar capacidades de IA generativa adicionales a tus agentes virtuales de Dialogflow CX, puedes aprovechar las opciones alternativas generadas por IA, que usan un modelo grande de lenguaje (LLM) para manejar correctamente situaciones en las que no hay coincidencia con el intent del usuario. Los generadores permiten que tus compiladores de bots inserten acciones generativas en cualquier parte de tu flujo de conversación, como resumir una conversación, personalizan una interacción o encadenan múltiples llamadas de LLM para crear todo un flujo de trabajo generativo.
Precios de la funcionalidad de disponibilidad general de los agentes de Vertex AI
Chat de agentes de Vertex AI* | $12.00 por 1,000 consultas** |
---|---|
Vertex AI Agents Voice* | $0.002 por segundo† |
Dialogflow CX Chat***(capacidades estándar de IA no generativa para Chat) | $7.00 por 1,000 consultas** |
Dialogflow CX Voice***(capacidades estándar de IA no generativa para Voice) | $0.001 por segundo† |
* Todas las funciones de IA generativa: Los agentes de almacenes de datos, los resguardos generativos, los generadores y las apps de agentes se rigen por los precios del SKU de los agentes de Vertex AI y de Voice. Si usas varios tipos de funciones de IA generativa en una sola solicitud, se te cobrará por separado por cada función según su uso. * Los clientes pueden combinar consultas/segundos de Dialogflow CX (no generativo) y de agentes de Vertex AI (generativos) en el mismo agente o flujo, y se les cobrará automáticamente por el uso real de cada conjunto de atributos. Esto te permite aprovechar la IA generativa de forma selectiva cuando corresponda y pagar solo por lo que realmente usas. ** Solicitud (o consulta): Facturación medida por solicitud o consulta individual. Una solicitud o consulta se define como cualquier llamada a la API al servicio de Dialogflow o del servicio de agentes de Vertex AI, ya sea directa con el uso de la API o indirecta con la integración o el uso de la consola. Por ejemplo, un usuario le hace una pregunta a un agente virtual (chatbot) y el chatbot responde 1 solicitud. Una interacción del usuario con el chatbot puede constar de varias solicitudes para realizar una tarea. † Incluye reconocimiento de voz, voz a texto (STT), síntesis de voz, texto a voz (TTS) y telefonía. La duración total del procesamiento de audio facturado es independiente de cualquier procesamiento sin cargo que no sea de audio (latencia de la API, procesamiento de webhook, etc.) que pueda ocurrir antes, durante o después del procesamiento de audio. * Dialogflow CX Chat y Dialogflow CX Voice no son aptos para los $1,000 en créditos de prueba GRATUITA. Dialogflow CX tiene un programa de créditos de prueba adicionales que se puede combinar con este programa de créditos de prueba GRATUITO de Vertex AI Agent Builder. Consulta definiciones adicionales de la medición de Dialogflow CX aquí. |
Ejemplo de precios para la funcionalidad de disponibilidad general de los agentes de Vertex AI
Ejemplo de combinación de respuestas generativas y basadas en la intención: Asistencia al cliente en el sitio web
- Los flujos determinísticos basados en la intención se usan para algunas preguntas específicas del cliente (facturación, pagos)
- Respuestas generativas que se usan para manejar preguntas para las que no hay un intent definido, pero la respuesta está en el sitio web.
Suposiciones:
- 100 millones de visitas anuales al sitio web
- El 5% de los visitantes usa el chatbot, 3 consultas por uso, el 50% es generativo y el 50% se basa en la intención.
Volumen de SKU | Tasa | Precio total de lista |
---|---|---|
Chat de Dialogflow CX (basado en intents) | ||
7.5 millones anuales 100 millones*5% de uso*3 de búsquedas*50% basadas en la intención |
* $7.00 cada 1,000 consultas = | USD 52,500 |
Chat de Dialogflow CX Enterprise (generativo) | ||
7.5 millones anuales 100 millones*5% de uso*3 búsquedas*50% generativa |
* $12.00 por 1,000 consultas = | $90,000 |
Datos indexados | ||
50 GB anuales 10 GB gratis, por lo que se usan 40 GB para calcular el precio |
* $5.00 por GB × 12 meses = | USD 2,400 |
Precios de Vertex AI Search
Vertex AI Agent Builder ofrece la capacidad de compilar rápidamente motores de búsqueda para sitios web, datos no estructurados y datos estructurados con el objetivo de recuperar información y generar respuestas fundamentadas. Puedes leer más sobre las funciones disponibles en Vertex AI Search.
Precios de la funcionalidad de DG de Vertex AI Search
Search Standard Edition* | $2.00 por 1,000 búsqueda |
---|---|
Search Enterprise Edition* | $4.00 por 1,000 búsqueda |
Complemento de LLM de búsqueda básica** | +USD 4.00 cada 1,000 consultas de entrada del usuario** |
Complemento de LLM de búsqueda avanzada** | +USD 10.00 cada 1,000 consultas de entrada del usuario** |
Edición estándar de la Búsqueda: Capacidades de búsqueda no estructurada Search Enterprise Edition: funciones no estructuradas de búsqueda y búsqueda en sitios web Complemento de Búsqueda básica de LLM**: Proporciona respuestas y resúmenes a consultas simples de uno o varios turnos, con capacidad para procesar consultas simples y de varios turnos, y consultas largas y de varios turnos, además de modelos compatibles, como TextBison, la serie Gemini 1.0 y Gemini 1.5 Flash (Vínculo) Complemento de búsqueda avanzada de LLM** (versión preliminar pública actual, DG, el 1 de julio de 2024): Proporciona respuestas y resúmenes a consultas de varios saltos (una consulta que contiene dos o más preguntas anidadas, una respuesta a una pregunta más acertada, que se podría responder) con modelos compatibles como TextBison, Gemini 1.0 Series y Gemini 1.5 Flash (vínculo). Se cobra por la cantidad de consultas de entrada del usuario, no por la cantidad de saltos Versión preliminar privada: Búsqueda estructurada + Nuevas funciones de IA generativa (comunícate con Ventas para conocer las funciones más recientes) *Consulta: facturación medida por solicitud individual o entrada de consulta Una solicitud o consulta se define como cualquier llamada a la API de Enterprise Search, ya sea directa con el uso de la API o indirecta mediante la integración o el uso de la consola. Ejemplo: Un usuario hace una pregunta en lenguaje natural y el motor de búsqueda responde es 1 consulta. ** El complemento de LLM es agregado a una consulta para aumentar el procesamiento y usar una solución atributo, El complemento de LLM puede usarse indistintamente con Search Standard o Search Enterprise Edition. Ejemplo: Ejecución de una consulta de Search Enterprise con una solicitud de resumen = 1 consulta de Search Enterprise + 1 consulta complementaria de LLM |
Ejemplo de precios para la funcionalidad de DG de Vertex AI Search
Ejemplo de datos no estructurados : Búsqueda de documentos
Suposición:
- 10 millones de consultas de la edición estándar al año
- 10 millones de consultas de la edición Enterprise con 10 millones de consultas de resumen LLM al año
- 100,000 documentos a aproximadamente 1 MB cada uno
Volumen de SKU | Tasa | Precio total de lista |
---|---|---|
Búsqueda estándar | ||
10 millones anuales | * $2.00 cada 1,000 consultas = | $20,000 |
Search Enterprise | ||
10 millones anuales | * $4.00 cada 1,000 consultas = | $40,000 |
Complemento de LLM de búsqueda básico Cada consulta que se agrega a una consulta estándar o empresarial |
||
10 millones anuales | * + USD 4.00 cada 1,000 consultas de entrada de los usuarios = | +USD 40,000 |
Complemento de LLM de búsqueda avanzada Cada consulta que se agrega a una consulta estándar o empresarial |
||
10 millones anuales | * +$10.00 cada 1,000 consultas de entrada de los usuarios = | +USD 100,000 |
Datos indexados | ||
100 GB anuales 10 GB gratis, por lo que se usan 90 GB para calcular el precio | * $5.00 por GB × 12 meses = | USD 5,400 |
Precios del índice de datos
Precios del almacenamiento de datos de índice de Vertex AI Agent Builder
Datos indexados | $5.00 por GiB al mes |
---|---|
* Se proporciona una cuota gratuita de 10 GiB por mes ** Se comparte en Vertex AI Agent Builder *** El almacenamiento se calcula como 500 kibibytes (KiB) * "cantidad de páginas en el sitio web", en la que 1 KiB equivale a 1,024 bytes. (500 KiB equivalen a ~0.000477 GiB; por lo tanto, la indexación de datos el precio de un sitio web de 1,000 páginas es de 2,38 USD por mes). |
Precios de Vertex AI Search for Healthcare
Vertex AI Search for Healthcare proporciona la capacidad de compilar rápidamente motores de búsqueda ajustados médicamente a partir de datos de atención médica.
Búsqueda de atención médica | $20.00 por 1,000 búsqueda |
---|
Vertex AI Search for Healthcare incluye algunas funciones en versión preliminar, como respuestas de IA generativa, transmisiones de actualizaciones del índice y otras. El precio de estas funciones puede diferir del precio actual de lista cuando se lancen para el público en general.
Ejemplo de precios para la búsqueda de Healthcare
Suposición:
1,000,000 de solicitudes de búsqueda de atención médica al mes
1,000 GiB de datos de atención médica indexados
Volumen de SKU | Tasa | Precio total de lista |
---|---|---|
1,000,000 de búsquedas | USD 20 por cada 1000 | $20,000 |
1,000 GiB | $5 por GiB | $5,000 |
Precios de Vertex AI Search for Media
Vertex AI Search for Media te permite proporcionar resultados de video altamente relevantes aprovechando las búsquedas y la comprensión contextual de Google para mejorar el descubrimiento en tu sitio de medios.
Vertex AI Agent Builder: Índice de datos | $5.00 por GB por mes |
---|---|
Vertex AI Search: Recuento de solicitudes a la API de Media Search | $2.00 por 1,000 búsqueda |
Precios de Vertex AI Search para recomendaciones de contenido multimedia
Las únicas operaciones de recomendaciones de contenido multimedia que generan cargos son el entrenamiento, el ajuste o la solicitud de predicciones mediante una llamada al método recommend. No se aplican cargos por importar o administrar eventos de usuario o información de documentos.
Los costos de entrenamiento (por nodo, por hora) se cobran a diario si tu modelo se entrena de forma activa o si enviaste una solicitud para reanudar el entrenamiento. Después de pausar o borrar un modelo, ya no se te cobra. Consulta la documentación para administrar el entrenamiento.
Los costos de ajuste (por nodo y por hora) para los modelos activos se cobran una vez que se completa correctamente el ajuste. Solo se te cobra por un ajuste incompleto si pausas o borras un modelo durante un ajuste en curso. En este caso, se te cobra por las horas de procesamiento de nodo que se consumieron antes de que se detuviera el ajuste del modelo. Consulta la documentación para administrar el ajuste.
Solicitudes de Predictions por mes | Precio por 1,000 predicciones |
---|---|
Hasta 20,000,000 | $0.27 |
Siguientes 280,000,000 | $0.18 |
Después de 300,000,000 | $0.10 |
Función | Precio |
Entrenamiento y ajuste | $2.50 por nodo por hora |
Ejemplo de precios para las recomendaciones de contenido multimedia
Suposición:
1,000,000,000 de solicitudes de predicción al mes
Entrena un solo modelo por día, que se vuelve a entrenar automáticamente una vez al día
Equivale a alrededor de 500 horas de procesamiento de nodo de entrenamiento de modelos y 100 horas de ajuste de modelos por mes
Volumen de SKU | Tasa | Precio total de lista |
---|---|---|
Primeros 20 millones de predicciones | * $0.27 / 1,000 predicciones = | USD 5,400 |
Los próximos 280 millones de predicciones | * $0.18 / 1,000 predicciones = | USD 50,400 |
Los próximos 700 millones de predicciones | * $0.10 / 1,000 predicciones = | $70,000 |
500 horas de procesamiento de nodo (entrenamiento) | * $2.50 por hora = | USD 1,250 |
100 horas de procesamiento de nodo (ajuste) | * $2.50 por hora = | $250 |
Total | USD 127,300 |
Cargos de Google Cloud Observability
Recomendaciones de contenido multimedia registra un error en Google Cloud Observability por cada solicitud a la API que Se genera un error, como una solicitud de evento de usuario que contiene JSON con formato incorrecto. o una solicitud de importación de documentos con un precio negativo. Las recomendaciones de contenido multimedia también registran un error por cada solicitud de predicción con un que no está en el almacén de datos importado.
Los cargos de Google Cloud Observability se calculan por GiB de los registros almacenados y por la retención más allá del período de retención predeterminado. Para obtener detalles sobre la asignación gratuita y la retención de datos, consulta la página de precios de Google Cloud Observability.
El tamaño de los datos de registro depende del tamaño de tu carga útil JSON. pero un GiB equivale a unos 200,000 errores de recomendaciones de contenido multimedia.
Precios de la API de Grounded Generation
La API de Grounded Generation te permite crear respuestas generativas a tus instrucciones usando información de la Búsqueda de Google o tus propios datos.
Mensaje de entrada (incluye instrucciones para el usuario, instrucciones del sistema y datos de fundamentación intercalada) | Se cobra según el precio del modelo de Gemini seleccionado. |
Resultado | Se cobra según el precio del modelo de Gemini seleccionado. |
Generación basada en fundamentos para fundamentar tus propios datos recuperados | $2.50 por 1,000 solicitudes |
Generación basada en fundamentos para la Búsqueda de Google | Consulta Fundamentos de la Búsqueda de Google. |
Los cargos adicionales por la recuperación de datos se determinan a través del sistema de recuperación seleccionado (p.ej., Vertex AI Search). |
Ejemplo 1: Bases en Vertex AI Search y hechos de fundamentación intercalada
El usuario usa Vertex AI Search y hechos fundamentales adicionales para generar respuestas fundamentadas. Cada instrucción de entrada tiene 2,500 caracteres (incluidos los hechos de fundamentación intercalada) y cada instrucción de salida tiene 200 caracteres. El usuario seleccionó Gemini 1.5 Flash.
Volumen por solicitud | Precio por cada 1,000 solicitudes | |
---|---|---|
Instrucción de entrada | 2,500 caracteres | 1,000 solicitudes × $0.000125 cada 1,000 caracteres × 2,500 caracteres por solicitud = $0.3125 cada 1,000 solicitudes |
Resultado | 200 caracteres | 1,000 solicitudes × $0.000375 cada 1,000 caracteres × 2 caracteres por solicitud = $0.075 cada 1,000 solicitudes |
Generación basada en fundamentos para fundamentar tus propios datos recuperados | 1 solicitud | $2.50 por 1,000 solicitudes |
Recuperación de datos: Vertex AI Search (edición Enterprise) | 1 solicitud | $4.00 por 1,000 solicitudes |
Total: $6.8875 cada 1,000 solicitudes |
Ejemplo 2: fundamentos en la Búsqueda de Google
El usuario utiliza la Búsqueda de Google para generar respuestas fundamentadas. Cada instrucción de entrada tiene 500 caracteres y cada instrucción de salida de 200 caracteres. El usuario seleccionó Gemini 1.5 Flash.
Volumen por solicitud | Precio por cada 1,000 solicitudes | |
---|---|---|
Instrucción de entrada | 500 caracteres | 1,000 solicitudes × $0.000125 cada 1,000 caracteres × 500 caracteres por solicitud = $0.0625 cada 1,000 solicitudes |
Resultado | 200 caracteres | 1,000 solicitudes × $0.000375 cada 1,000 caracteres × 200 caracteres por solicitud = $0.075 cada 1,000 solicitudes |
Generación basada en fundamentos para la Búsqueda de Google | 1 solicitud | $35.00 cada 1,000 solicitudes |
Total: $35.1375 cada 1,000 solicitudes |
Verifica los precios de la API de Grounding
Verificar los fundamentos permite determinar qué tan fundamentado está un texto (la variante de respuesta) en un conjunto determinado de textos de referencia (los hechos).
Verifica la puesta a tierra | $0.00075 por 1,000 caracteres de respuesta |
Precios de las funciones de Document AI
Para obtener información completa sobre los precios de todas las funciones de Document AI, consulta la página de precios de Document AI.
Para conocer las funciones de Document AI integradas y facturadas a través de Vertex AI Search, consulta las siguientes tablas.
Digitalizar texto
Procesador | De 1 a 5,000,000 de páginas al mes * | A partir de 5,000,000 páginas por mes |
---|---|---|
Procesador de OCR de documentos empresariales | $1.50 cada 1,000 páginas | $0.60 cada 1,000 páginas |
Extrae estructuras y entidades de documentos
Analizador de diseño (incluye la fragmentación inicial) | $10 cada 1,000 páginas |
*El tamaño de una página depende del formato de archivo:
Imágenes (JPEG/JPG, PNG, BMP, HEIF): Cada imagen = 1 página
PDF: Cada página del PDF = 1 página
TIFF: Cada imagen en el archivo TIFF = 1 página
Word (DOCX): Hasta 3,000 caracteres = 1 página
Excel (XLSX): Cada pestaña = 1 página
PowerPoint (PPTX): Cada diapositiva = 1 página
HTML: Hasta 3,000 caracteres = 1 página
Documentos analizados: hasta 3,000 caracteres = 1 página
Precios de la API de Ranking
La API de clasificación toma una lista de documentos y los vuelve a clasificar según su relevancia para una consulta.
En comparación con las incorporaciones, que solo observan la similitud semántica de un documento y una consulta, la API de clasificación puede proporcionar puntuaciones precisas sobre qué tan bien responde un documento a una consulta dada.
Se puede usar la API de clasificación para mejorar la calidad de los resultados de la búsqueda después de recuperar un conjunto inicial de documentos candidatos.
Clasificar documentos
Clasificación | $1 por 1,000 consultas |
---|
Una consulta incluye hasta 100 documentos, aunque un usuario puede especificar más de 100 documentos por consulta. Cuando se especifican más de 100 documentos, el precio aumenta en 1 por cada múltiplo de 100 documentos.
Por ejemplo:
132 documentos para clasificar = 2 consultas
200 documentos para clasificar = 2 consultas
399 documentos para clasificar = 4 consultas
401 documentos para clasificar = 5 consultas
¿Qué sigue?
- Lee la documentación de Vertex AI Agent Builder.
- Prueba la calculadora de precios.