Precios de Vertex AI Agent Builder
Los precios aparecen en dólares estadounidenses (USD).
Los precios de las funciones de disponibilidad general (DG) que se muestran se invocan el 1 de septiembre de 2023.
Vertex AI Agent Builder permite a los desarrolladores, incluso aquellos con habilidades limitadas en el aprendizaje automático, aprovechar la potencia de los modelos grandes de lenguaje básicos de Google, la experiencia en la búsqueda y las tecnologías de IA conversacional para crear aplicaciones de IA generativa de nivel empresarial.
Créditos y asistencia para la prueba
Se otorgan $ 1,000 en créditos de prueba GRATUITA por usar Vertex AI Agent Builder. Estos créditos son válidos por 1 año a partir del registro de la cuenta en Vertex AI Agent Builder a partir del 18 de julio de 2023.
¿Tienes preguntas sobre el empaquetado y los precios de las funciones de DG o la versión preliminar?
Comunícate con el equipo de Ventas de Google Cloud para obtener más información.
Precios de los agentes de Vertex AI
Vertex AI Agent Builder proporciona la capacidad de compilar con rapidez agentes virtuales (chatbots) que generan respuestas en función del contenido (sitio web, documentos) que incluyes en los almacenes de datos. Con los agentes de Vertex AI, puedes crear un agente virtual nuevo de Dialogflow CX O agregar la función a un agente virtual de Dialogflow CX existente.
Para agregar más capacidades de IA generativa a tus agentes virtuales de Dialogflow CX, puedes aprovechar los resguardos generativos, que usan un modelo grande de lenguaje (LLM) para manejar correctamente situaciones en las que no hay coincidencia con el intent del usuario. Los generadores permiten a los compiladores de bots insertar acciones generativas en cualquier parte del flujo conversacional, como resumir una conversación, personalizar una interacción o encadenar varias llamadas de LLM para crear un flujo de trabajo generativo completo.
Precios de la funcionalidad de disponibilidad general de los agentes de Vertex AI
Chat de agentes de Vertex AI* | $12.00 / 1,000 consulta** |
---|---|
Vertex AI Agents Voice* | $0.002 por segundo† |
Chat de Dialogflow CX***(funciones de IA estándar no generativas para Chat) | $7.00 / 1,000 consulta** |
Dialogflow CX Voice***(funciones de IA estándar no generativas para Voice) | $0.001 por segundo† |
* Todas las funciones de IA generativa: Los agentes de almacén de datos, los resguardos generativos, los generadores y las apps de agente se incluyen en los precios del SKU de Chat y de Voice para agentes de Vertex AI. * Los clientes pueden combinar consultas/segundos de Dialogflow CX (no generativos) y agentes de Vertex AI (generativos) en el mismo agente o flujo, y se les cobrará automáticamente por el uso real de cada conjunto de atributos. Esto te permite aprovechar la IA generativa de forma selectiva cuando corresponda y pagar solo por lo que realmente usas. **Solicitud (o consulta): Facturación medida por solicitud o consulta individual. Una solicitud o consulta se define como cualquier llamada a la API hacia el servicio de Dialogflow o el servicio de los agentes de Vertex AI, ya sea directa con el uso de la API o indirecta con la integración o el uso de la consola. Por ejemplo, un usuario que le hace una pregunta a un agente virtual (chatbot) y el chatbot que responde es 1 solicitud. Una interacción del usuario con el chatbot puede constar de varias solicitudes para realizar una tarea. † Incluye reconocimiento de voz, voz a texto (STT), síntesis de voz, texto a voz (TTS) y telefonía. La duración total del procesamiento de audio facturado es independiente de cualquier procesamiento sin cargo ni de audio (latencia de la API, procesamiento de webhook, etc.) que pueda ocurrir antes, durante o después del procesamiento de audio. * Dialogflow CX Chat y Dialogflow CX Voice no son aptos para recibir los $1,000 en créditos de prueba GRATUITO. Dialogflow CX tiene un programa de créditos de prueba adicional que se puede combinar con este programa de créditos de prueba GRATUITO de Vertex AI Agent Builder. Consulta las definiciones adicionales de la medición de Dialogflow CX aquí. |
Ejemplo de precios para la funcionalidad de disponibilidad general de los agentes de Vertex AI
Ejemplo de combinación de respuestas basadas en intención y generativas: Asistencia al cliente en el sitio web
- Los flujos determinísticos basados en la intención se usan para algunas preguntas específicas del cliente (facturación, pago)
- Respuestas generativas que se usan para responder preguntas en las que no se define la intención, pero la respuesta está en el sitio web
Suposiciones:
- 100 millones de visitas anuales al sitio web
- El 5% de los visitantes usa el chatbot, 3 consultas por uso, el 50% son generativos y el 50% se basan en la intención.
Volumen de SKU | Frecuencia | Precio de lista total |
---|---|---|
Chat de Dialogflow CX (basado en intents) | ||
7.5 millones anuales 100 millones*5% de uso*3 consultas*50% basadas en la intención |
* $7.00 / 1,000 consultas = | USD 52,500 |
Chat empresarial de Dialogflow CX (generativo) | ||
7.5 millones anuales 100 millones*5% de uso*3 consultas*50% generativa |
* $12.00 / 1,000 consultas = | $90,000 |
Datos indexados | ||
50 GB anuales 10 GB gratis, por lo que 40 GB se usan para el cálculo de precio |
* USD 5.00 por GB * 12 meses = | USD 2,400 |
Precios de Vertex AI Search
Vertex AI Agent Builder proporciona la capacidad de compilar motores de búsqueda con rapidez para sitios web, datos no estructurados y datos estructurados a fin de recuperar información y generar respuestas basadas en datos. Puedes obtener más información sobre las funciones disponibles en Vertex AI Search.
Precios de la funcionalidad de DG de Vertex AI Search
Búsqueda de la edición estándar* | $2.00 / 1,000 consulta |
---|---|
Search Enterprise Edition* | $4.00 / 1,000 consulta |
Complemento de la Búsqueda de LLM** | +USD 4.00 / 1,000 búsqueda** |
Search Standard Edition: funciones de búsqueda no estructurada Search Enterprise Edition: capacidades de búsqueda no estructurada + Búsqueda de sitios web Complemento de la Búsqueda de LLM: resumen + capacidades de búsqueda de varios turnos Versión preliminar privada: búsqueda estructurada + nuevas funciones de IA generativa (comunícate con Ventas para conocer las funciones más recientes) Ejemplo: Un usuario hace una pregunta en lenguaje natural y el motor de búsqueda responde 1 consulta. (Las sugerencias de autocompletar no cuentan como búsquedas; una consulta solo se cuenta cuando el usuario envía una búsqueda final). ** Se agrega el complemento de LLM a una consulta para aumentar el procesamiento y usar una función de IA generativa. El complemento de LLM se puede usar de forma indistinta con Search Standard Edition o Search Enterprise Edition. Ejemplo: ejecución de una consulta de Search Enterprise con una solicitud de resumen = 1 consulta de Search Enterprise + 1 consulta de complemento de LLM |
Ejemplo de precios de la funcionalidad de DG de Vertex AI Search
Ejemplo de datos no estructurados : Document Search
Suposición:
- 10 millones de consultas anuales de edición estándar
- 10 millones de consultas de Enterprise Edition con 10 millones de LLM de consultas de resumen anual
- 100,000 documentos de ~1 MB cada uno
Volumen de SKU | Frecuencia | Precio de lista total |
---|---|---|
Búsqueda estándar | ||
10 millones anuales | * $2.00 / 1,000 consultas = | $20,000 |
Búsqueda para empresas | ||
10 millones anuales | * $4.00 / 1,000 consultas = | $40,000 |
Complemento de búsqueda de LLM Cada consulta se agrega a una consulta estándar o empresarial |
||
10 millones anuales | * +USD 4.00 / 1,000 consultas = | +USD 40,000 |
Datos indexados | ||
100 GB anuales 10 GB gratis, por lo que 90 GB se usan en el cálculo de precio | * USD 5.00 por GB * 12 meses = | USD 5,400 |
Precios del índice de datos
Precios del almacenamiento de datos del índice de Agent Builder de Vertex AI
Datos indexados | $5.00 por GiB al mes |
---|---|
* Se proporciona una cuota gratuita de 10 GiB por mes ** Compartida en Vertex AI Agent Builder *** El almacenamiento se calcula como 500 kibibytes (KiB) × “cantidad de páginas en el sitio web”, donde 1 KiB equivale a 1,024 bytes. (500 KiB equivalen a aproximadamente 0.000477 GiB; por lo tanto, el precio de indexación de datos para un sitio web de 1,000 páginas es de $2.38 por mes). |
Precios de Vertex AI Search para la atención médica
Vertex AI Search for Healthcare ofrece la capacidad de compilar con rapidez motores de búsqueda ajustados a aspectos médicos a partir de datos de atención médica.
Búsqueda de atención médica | $20.00 / 1,000 consulta |
---|
Vertex AI Search para la atención médica incluye algunas funciones en versión preliminar, como respuestas de IA generativa, actualizaciones de transmisión al índice y otras. Es posible que estas funciones tengan un precio diferente del precio indicado actual cuando se lancen la fase de disponibilidad general.
Ejemplo de precios de Healthcare Search
Suposición:
1,000,000 de solicitudes de búsqueda de atención médica al mes
Se indexaron 1,000 GiB de datos de atención médica
Volumen de SKU | Frecuencia | Precio de lista total |
---|---|---|
1,000,000 de búsquedas | USD 20/1,000 | $20,000 |
1,000 GiB | $5 por GiB | $5,000 |
Precios de Vertex AI Search para contenido multimedia
Vertex AI Search for Media te permite proporcionar resultados de videos de gran relevancia, ya que aprovecha la comprensión del contexto y de las consultas de Google para mejorar el descubrimiento en tu sitio de medios.
Vertex AI Agent Builder: Índice de datos | $5.00 por GB al mes |
---|---|
Vertex AI Search: Recuento de solicitudes a la API de Media Search | $2.00 / 1,000 consulta |
Precios de Vertex AI Search para recomendaciones de contenido multimedia
Las únicas operaciones de recomendaciones de contenido multimedia que generan cargos son el entrenamiento, el ajuste o la solicitud de predicciones mediante una llamada al método recommend. No se aplican cargos por importar o administrar eventos de usuario o información de documentos.
Los costos de entrenamiento (por nodo y por hora) se cobran a diario si tu modelo está entrenando de forma activa o si enviaste una solicitud para reanudar el entrenamiento. Después de pausar o borrar un modelo, ya no se te cobrará. Consulta la documentación sobre cómo administrar el entrenamiento.
Los costos de ajuste (por nodo y por hora) para los modelos activos se cobran una vez que el ajuste se completa de forma correcta. Solo se te cobra por un ajuste incompleto si pausas o borras un modelo durante un ajuste en curso. En este caso, se te cobra por las horas de procesamiento de nodo que se consumieron antes de que se detuviera el ajuste del modelo. Consulta la documentación para administrar el ajuste.
Predicciones | $0.27 por 1,000 predicción |
---|---|
Entrenamiento y ajuste | $2.50 por nodo por hora |
Ejemplo de precios para recomendaciones de contenido multimedia
Suposición:
10,000,000 de solicitudes de predicción por mes
Entrena un solo modelo por día, que se vuelve a entrenar una vez al día automáticamente.
Cantidades de alrededor de 150 horas de procesamiento de nodo de entrenamiento de modelos y 30 horas de ajuste de modelos por mes
Volumen de SKU | Frecuencia | Precio de lista total |
---|---|---|
10 millones de predicciones | * $0.27 / 1,000 predicciones = | USD 2,700 |
150 horas de procesamiento de nodo (entrenamiento) | * $2.50 por hora = | USD 375 |
30 horas de procesamiento de nodo (ajuste) | * $2.50 por hora = | USD 75 |
Total | USD 3,150 |
Cargos de observabilidad de Google Cloud
Las recomendaciones de contenido multimedia registran un error en la observabilidad de Google Cloud por cada solicitud a la API que genera un error, como una solicitud de evento de usuario que contiene un JSON con errores de formato o una solicitud de importación de documentos con un precio negativo. Las recomendaciones de contenido multimedia también registran un error por cada solicitud de predicción con un documento que no está en el almacén de datos importado.
Los cargos de observabilidad de Google Cloud se calculan por los GiB de registros almacenados y por la retención más allá del período de retención predeterminado. Para obtener detalles sobre la asignación gratuita y la retención de datos, consulta la página de precios de observabilidad de Google Cloud.
El tamaño de los datos de registro depende del tamaño de la carga útil de JSON, pero un GiB equivale a unos 200,000 errores de recomendaciones de contenido multimedia.
Consultar los precios de la API de Grounding
La verificación de fundamentos ofrece la capacidad de determinar qué tan fundamentado está un texto (la respuesta candidata) en un conjunto determinado de textos de referencia (los hechos).
Comprueba la conexión a tierra | $0.00075 por 1,000 caracteres de respuesta |
¿Qué sigue?
- Lee la documentación de Vertex AI Agent Builder.
- Prueba la calculadora de precios.