Precios de Gemini Enterprise Agent Platform

Precios de Agent Platform

Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

Precios de Agent Platform en comparación con los precios de los productos heredados

Los costos de Agent Platform siguen siendo los mismos que los de los productos heredados de AI Platform y AutoML que Agent Platform reemplaza, con las siguientes excepciones:

Las predicciones heredadas de Agent Platform Inference y AutoML Tables admiten tipos de máquinas de menor costo y menor rendimiento que no son compatibles con Agent Platform Inference ni en el modelo tabular de AutoML.
La inferencia de Agent Platform heredada admitía la reducción de escala a cero, que no es compatible con la inferencia de Agent Platform.

Agent Platform también ofrece más formas de optimizar los costos, como las siguientes:

Entorno de ejecución optimizado de TensorFlow
Compatibilidad con modelos de hosting compartido
No hay una duración mínima de uso para el entrenamiento y la predicción. En cambio, el uso se cobra en incrementos de 30 segundos.

Precios de la IA generativa en Agent Platform

Para obtener información sobre los precios de IA generativa en Agent Platform, consulta los Precios de IA generativa en Agent Platform.

Precios para modelos de AutoML

En el caso de los modelos de AutoML de Agent Platform, pagas por tres actividades principales:

Entrenar el modelo
Implementar el modelo en un extremo
Usar el modelo para hacer predicciones

Agent Platform usa parámetros de configuración predefinidos de máquinas para los modelos de AutoML de Agent Platform y la tarifa por hora de estas actividades refleja el uso de los recursos.

El tiempo necesario para entrenar tu modelo depende del tamaño y la complejidad de tus datos de entrenamiento. Se deben implementar los modelos antes de que puedan proporcionar predicciones o explicaciones en línea.

Pagas por cada modelo implementado en un extremo, incluso si no se hace ninguna predicción. Debes anular la implementación de tu modelo para evitar que se sigan generando cargos. No se cobran los modelos que no se implementaron o que fallaron.

Se paga solo por las horas de procesamiento que uses. Si el entrenamiento falla por cualquier motivo que no sea una cancelación iniciada por el usuario, no se te facturará por ese tiempo. Se te cobra el tiempo del entrenamiento si cancelas la operación.

Selecciona un tipo de modelo a continuación para obtener información sobre los precios.

Datos de imagen

Operación	Precio (clasificación) (USD)	Precio (detección de objetos) (USD)
Capacitación	USD 3.465 / 1 hour	USD 3.465 / 1 hour
Entrenamiento (modelo Edge integrado en el dispositivo)	USD 18.00 / 1 hour	USD 18.00 / 1 hour
Implementación y predicción en línea	USD 1.375 / 1 hour	USD 2.002 / 1 hour
Predicción por lotes	USD 2.222 / 1 hour	USD 2.222 / 1 hour

Datos tabulares

Operación	Precio por hora de procesamiento de nodo para clasificación o regresión	Precio de previsión
Capacitación	USD 21.252 / 1 hour	Consulta Previsión en Agent Platform
Inferencia	El mismo precio que la inferencia para modelos entrenados de forma personalizada. Agent Platform realiza la inferencia por lotes con 40 máquinas n1-highmem-8.	Consulta Previsión en Agent Platform

Operación

Precio por hora de procesamiento de nodo para clasificación o regresión

Precio de previsión

Capacitación

USD 21.252 / 1 hour

Consulta Previsión en Agent Platform

Inferencia

El mismo precio que la inferencia para modelos entrenados de forma personalizada.

Agent Platform realiza la inferencia por lotes con 40 máquinas n1-highmem-8.

Consulta Previsión en Agent Platform

Cargos de inferencia para Vertex Explainable AI

El procesamiento asociado con Vertex Explainable AI se cobra a la misma tarifa que la inferencia. Sin embargo, el procesamiento de las explicaciones demora más que el de las inferencias normales. Por lo tanto, el uso intensivo de Vertex Explainable AI junto con el ajuste de escala automático podría traer como resultado el inicio de más nodos, lo que podría aumentar los cargos de inferencia.

Previsiones en Agent Platform

AutoML

Etapa	Precios
Predicción	0 count to 1,000,000 count USD 0.20 / 1,000 count, per 1 month / account 1,000,000 count to 50,000,000 count USD 0.10 / 1,000 count, per 1 month / account 50,000,000 count and above USD 0.02 / 1,000 count, per 1 month / account
Capacitación	USD 21.252 / 1 hour
Explainable AI	Explicabilidad con los valores de Shapley. Consulta la página de precios de Inferencia y explicación de Agent Platform.

* Un dato de predicción es un punto de tiempo en el horizonte de previsión. Por ejemplo, con un nivel de detalle diario, un horizonte de 7 días tiene 7 puntos por cada serie temporal.

Se pueden incluir hasta 5 cuantiles de predicción sin costo adicional.
La cantidad de datos consumidos por nivel se actualiza por mes.

ARIMA+

Etapa	Precios
Predicción	USD 5.00 / 1,000 count
Capacitación	$250.00 por TB × cantidad de modelos de candidatos × cantidad de ventanas retrospectivas*
Explainable AI	La explicabilidad con descomposición de la serie temporal no implica ningún costo adicional. La explicabilidad con los valores de Shapley no es compatible.

Consulta la página de precios de BigQuery ML para obtener detalles adicionales. Cada trabajo de entrenamiento y predicción incurre en el costo de una ejecución de canalización administrada, como se describe en Precios de Agent Platform.

* Se crea una ventana retrospectiva para cada período en el conjunto de prueba. El AUTO_ARIMA_MAX_ORDER que se usa determina la cantidad de modelos de candidatos. Abarca de 6 a 42 en modelos con series temporales múltiples.

Modelos entrenados de forma personalizada

Capacitación

En las siguientes tablas, se indica el precio por hora aproximado de varios parámetros de configuración de entrenamiento. Puedes elegir una configuración personalizada de los tipos de máquinas seleccionados. Para calcular los precios, suma los costos de las máquinas virtuales que usas.

Si usas los tipos de máquinas de Compute Engine y les conectas aceleradores, el costo correspondiente se cobra por separado. Para calcularlo, multiplica los precios de la tabla de aceleradores a continuación por la cantidad de cada tipo de acelerador que uses.

Tipos de máquinas

Puedes usar VMs Spot con el entrenamiento personalizado de Agent Platform. Las VMs Spot se facturan según los precios de las VMs Spot de Compute Engine. Hay tarifas de administración del entrenamiento personalizado de Agent Platform, además del uso de tu infraestructura, como puedes ver en las tablas a continuación.

Puedes usar reservas de Compute Engine con el entrenamiento personalizado de Agent Platform. Cuando usas las reservas de Compute Engine, se te factura según los precios de Compute Engine, incluidos los descuentos por compromiso de uso (CUD) aplicables. Hay tarifas de administración del entrenamiento personalizado de Agent Platform, además del uso de tu infraestructura, como puedes ver en las tablas a continuación.

Tipo de máquina	Precio (USD)
g4-standard-48	USD 5.1749195 / 1 hour
g4-standard-96	USD 10.349839 / 1 hour
g4-standard-192	USD 20.699678 / 1 hour
g4-standard-384	USD 41.399356 / 1 hour
n1-standard-4	USD 0.21849885 / 1 hour
n1-standard-8	USD 0.4369977 / 1 hour
n1-standard-16	USD 0.8739954 / 1 hour
n1-standard-32	USD 1.7479908 / 1 hour
n1-standard-64	USD 3.4959816 / 1 hour
n1-standard-96	USD 5.2439724 / 1 hour
n1-highmem-2	USD 0.13604845 / 1 hour
n1-highmem-4	USD 0.2720969 / 1 hour
n1-highmem-8	USD 0.5441938 / 1 hour
n1-highmem-16	USD 1.0883876 / 1 hour
n1-highmem-32	USD 2.1767752 / 1 hour
n1-highmem-64	USD 4.3535504 / 1 hour
n1-highmem-96	USD 6.5303256 / 1 hour
n1-highcpu-16	USD 0.65180712 / 1 hour
n1-highcpu-32	USD 1.30361424 / 1 hour
n1-highcpu-64	USD 2.60722848 / 1 hour
n1-highcpu-96	USD 3.91084272 / 1 hour
a2-highgpu-1g*	USD 4.425248914 / 1 hour
a2-highgpu-2g*	USD 8.850497829 / 1 hour
a2-highgpu-4g*	USD 17.700995658 / 1 hour
a2-highgpu-8g*	USD 35.401991315 / 1 hour
a2-megagpu-16g*	USD 65.707278915 / 1 hour
a3-highgpu-8g*	USD 101.007352832 / 1 hour
a3-megagpu-8g*	USD 106.046424032 / 1 hour
a3-ultragpu-8g*	USD 99.773930496 / 1 hour
a4-highgpu-8g*	USD 148.212 / 1 hour
e2-standard-4	USD 0.154126276 / 1 hour
e2-standard-8	USD 0.308252552 / 1 hour
e2-standard-16	USD 0.616505104 / 1 hour
e2-standard-32	USD 1.233010208 / 1 hour
e2-highmem-2	USD 0.103959618 / 1 hour
e2-highmem-4	USD 0.207919236 / 1 hour
e2-highmem-8	USD 0.415838472 / 1 hour
e2-highmem-16	USD 0.831676944 / 1 hour
e2-highcpu-16	USD 0.455126224 / 1 hour
e2-highcpu-32	USD 0.910252448 / 1 hour
n2-standard-4	USD 0.2233714 / 1 hour
n2-standard-8	USD 0.4467428 / 1 hour
n2-standard-16	USD 0.8934856 / 1 hour
n2-standard-32	USD 1.7869712 / 1 hour
n2-standard-48	USD 2.6804568 / 1 hour
n2-standard-64	USD 3.5739424 / 1 hour
n2-standard-80	USD 4.467428 / 1 hour
n2-highmem-2	USD 0.1506661 / 1 hour
n2-highmem-4	USD 0.3013322 / 1 hour
cloud-tpu	Los precios se determinan por el tipo de acelerador. Consulta “Aceleradores”.
n2-highmem-8	USD 0.6026644 / 1 hour
n2-highmem-16	USD 1.2053288 / 1 hour
n2-highmem-32	USD 2.4106576 / 1 hour
n2-highmem-48	USD 3.6159864 / 1 hour
n2-highmem-64	USD 4.8213152 / 1 hour
n2-highmem-80	USD 6.026644 / 1 hour
n2-highcpu-16	USD 0.6596032 / 1 hour
n2-highcpu-32	USD 1.3192064 / 1 hour
n2-highcpu-48	USD 1.9788096 / 1 hour
n2-highcpu-64	USD 2.6384128 / 1 hour
n2-highcpu-80	USD 3.298016 / 1 hour
n4-standard-2	USD 0.104305 / 1 hour
n4-standard-4	USD 0.20861 / 1 hour
n4-standard-8	USD 0.41722 / 1 hour
n4-standard-16	USD 0.83444 / 1 hour
n4-standard-32	USD 1.66888 / 1 hour
n4-standard-48	USD 2.50332 / 1 hour
n4-standard-64	USD 3.33776 / 1 hour
n4-standard-80	USD 4.1722 / 1 hour
n4-highcpu-2	USD 0.088021 / 1 hour
n4-highcpu-4	USD 0.176042 / 1 hour
n4-highcpu-8	USD 0.352084 / 1 hour
n4-highcpu-16	USD 0.704168 / 1 hour
n4-highcpu-32	USD 1.408336 / 1 hour
n4-highcpu-48	USD 2.112504 / 1 hour
n4-highcpu-64	USD 2.816672 / 1 hour
n4-highcpu-80	USD 3.52084 / 1 hour
n4-highmem-2	USD 0.088021 / 1 hour
n4-highmem-4	USD 0.273746 / 1 hour
n4-highmem-8	USD 0.547492 / 1 hour
n4-highmem-16	USD 1.094984 / 1 hour
n4-highmem-48	USD 3.284952 / 1 hour
n4-highmem-64	USD 4.379936 / 1 hour
n4-highmem-80	USD 5.47492 / 1 hour
c2-standard-4	USD 0.2401292 / 1 hour
c2-standard-8	USD 0.4802584 / 1 hour
c2-standard-16	USD 0.9605168 / 1 hour
c2-standard-30	USD 1.800969 / 1 hour
c2-standard-60	USD 3.601938 / 1 hour
m1-ultramem-40	USD 7.237065 / 1 hour
m1-ultramem-80	USD 14.47413 / 1 hour
m1-ultramem-160	USD 28.94826 / 1 hour
m1-megamem-96	USD 12.249984 / 1 hour

*Este importe incluye el precio de la GPU, ya que este tipo de instancia siempre requiere una cantidad fija de aceleradores de GPU.

Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

Aceleradores

Tipo de máquina	Precio (USD)	Tarifa de administración
NVIDIA_TESLA_A100	USD 2.933908 / 1 hour	USD 0.4400862 / 1 hour
NVIDIA_TESLA_A100_80GB	USD 3.92808 / 1 hour	USD 0.589212 / 1 hour
NVIDIA_H100_80GB	USD 9.79655057 / 1 hour	USD 1.4694826 / 1 hour
NVIDIA_H200_141GB	USD 10.708501 / 1 hour	No disponible
NVIDIA_H100_MEGA_80GB	USD 11.8959171 / 1 hour	No disponible
NVIDIA_TESLA_L4	USD 0.644046276 / 1 hour	No disponible
NVIDIA_TESLA_P4	USD 0.69 / 1 hour	No disponible
NVIDIA_TESLA_P100	USD 1.679 / 1 hour	No disponible
NVIDIA_TESLA_T4	USD 0.4025 / 1 hour	No disponible
NVIDIA_TESLA_V100	USD 2.852 / 1 hour	No disponible
TPU_V2 Single (8 núcleos)	USD 5.175 / 1 hour	No disponible
Pod de TPU_V2 (32 núcleos)^*	USD 27.60 / 1 hour	No disponible
TPU_V3 Single (8 núcleos)	USD 9.20 / 1 hour	No disponible
Pod de TPU_V3 (32 núcleos)^*	USD 36.80 / 1 hour	No disponible
tpu7x-standard-4t (1 chip)	USD 13.80 / 1 hour	No disponible

Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

* El precio por el entrenamiento con el pod de Cloud TPU se basa en la cantidad de núcleos en el pod. La cantidad de núcleos en un pod siempre es un múltiplo de 32. Para determinar el precio del entrenamiento en un Pod que tiene más de 32 núcleos, multiplica el precio de un Pod de 32 núcleos por la cantidad de núcleos, dividido por 32. Por ejemplo, el precio de un pod de 128 núcleos es (precio del pod de 32 núcleos) × (128/32). Para obtener información sobre cuáles Pods de Cloud TPU están disponibles en una región específica, consulta Arquitectura del sistema en la documentación de Cloud TPU.

Discos

Tipo de máquina	Precio (USD)
pd-standard	USD 0.000063014 / 1 gibibyte hour
pd-ssd	USD 0.000267808 / 1 gibibyte hour

Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

Todo el uso está sujeto a la política de cuotas de Agent Platform.
Debes almacenar los datos y los archivos de programa en buckets de Google Cloud Storage durante el ciclo de vida de Agent Platform. Obtén más información sobre el uso de Cloud Storage.

Se cobra el entrenamiento de tus modelos desde el momento en que los recursos se aprovisionan para un trabajo hasta que el trabajo finaliza.

Advertencia: La política de cuotas de Agent Platform limita tus trabajos de entrenamiento. Si seleccionas un clúster de procesamiento potente para los primeros trabajos de entrenamiento, es probable que superes la cuota.

Niveles de escala para las configuraciones predefinidas (AI Platform Training)

Puedes controlar el tipo de clúster de procesamiento que se usará para entrenar un modelo. La forma más sencilla es seleccionar uno de los parámetros de configuración predeterminados, denominados niveles de escala. Obtén más información acerca de los niveles de escala.

Tipos de máquinas para las configuraciones personalizadas

Si usas Agent Platform o seleccionas PERSONALIZADO como el nivel de escala para AI Platform Training, puedes controlar la cantidad y el tipo de las máquinas virtuales que se usarán para la instancia principal del clúster, el trabajador y los servidores de parámetros. Obtén más información sobre los tipos de máquinas para Agent Platform y los tipos de máquinas para AI Platform Training.

El costo del entrenamiento con un clúster de procesamiento personalizado es la suma de todas las máquinas que especifiques. Se te cobra el tiempo total del trabajo, no el tiempo de procesamiento activo de las máquinas individuales.

Evaluaciones de IA generativa

En el caso de las métricas basadas en modelos, los cargos se aplican solo a los costos de predicción asociados con el modelo de evaluador automático subyacente. Se facturan en función de los tokens de entrada que proporcionas en tu conjunto de datos de evaluación y la salida del evaluador automático.

Gen AI Evals tiene disponibilidad general (DG). El cambio de precio entró en vigencia el 14 de abril de 2025.

métrico	Precios
Por puntos	Modelo de calificación automática predeterminado Gemini 2.0 Flash
Por pares	Modelo de calificación automática predeterminado Gemini 2.0 Flash

métrico

Precios

Por puntos

Modelo de calificación automática predeterminado

Gemini 2.0 Flash

Por pares

Modelo de calificación automática predeterminado

Gemini 2.0 Flash

Las métricas basadas en procesamiento se cobran a $0.00003 por 1,000 caracteres de entrada y $0.00009 por 1,000 caracteres de salida. Se conocen como métricas automáticas en SKU.

Nombre de la métrica	Tipo
Concordancia exacta	Basada en procesamiento
Bleu	Basada en procesamiento
Rouge	Basada en procesamiento
Llamada a la herramienta válida	Basada en procesamiento
Coincidencia de nombre de la herramienta	Basada en procesamiento
Coincidencia de clave de parámetro de la herramienta	Basada en procesamiento
Coincidencia de KV del parámetro de la herramienta	Basada en procesamiento

Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

Las métricas heredadas basadas en modelos se cobran a $0.005 por 1,000 caracteres de entrada y $0.015 por 1,000 caracteres de salida.

Nombre de la métrica	Tipo
Coherencia	Por puntos
Fluidez	Por puntos
Entrega	Por puntos
Seguridad	Por puntos
Fundamentación	Por puntos
Calidad de resumen	Por puntos
Utilidad de los resúmenes	Por puntos
Nivel de detalle del resumen	Por puntos
Calidad de la búsqueda de respuestas	Por puntos
Relevancia de la búsqueda de respuestas	Por puntos
Utilidad de la búsqueda de respuestas	Por puntos
Exactitud de la búsqueda de respuestas	Por puntos
Calidad de resumen por pares	Por pares
Calidad de la respuesta a preguntas por pares	Por pares

Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

Agentes

Los productos de Agent Platform para escalar tienen una estructura de precios unificada que usa 3 tipos de recursos: procesamiento, memoria y almacenamiento. Todos los productos de Scale se facturan con estos SKUs. Algunos servicios se miden por la cantidad de solicitudes, pero se facturan en CPU virtual-h de Agent Compute, según las tarifas descritas en las secciones a continuación. Se aplica un nivel de uso gratuito por mes y por cuenta para cada recurso.

Recurso	Precio (USD)
Procesamiento del agente	0 hour to 50 hour USD 0.00 (Free) / 1 hour, per 1 month / account 50 hour and above USD 0.085 / 1 hour, per 1 month / account
Memoria del agente (RAM)	0 gibibyte hour to 100 gibibyte hour USD 0.00 (Free) / 1 gibibyte hour, per 1 month / account 100 gibibyte hour and above USD 0.009 / 1 gibibyte hour, per 1 month / account
Almacenamiento de agentes	0 gibibyte month to 1 gibibyte month USD 0.00 (Free) / 1 gibibyte hour, per 1 month / account 1 gibibyte month and above USD 0.000410959 / 1 gibibyte hour, per 1 month / account

Agente de Compute

Los entornos de ejecución y de sandbox, incluidos la ejecución de código y el uso de la computadora, se facturan según el uso de recursos de Agent Compute (horas de CPU virtual) y Agent Memory (horas de GiB).

Procesamiento: Recursos de CPU virtual asignados al agente, facturados como procesamiento del agente (USD 0.085 por vCPU-h)
Memoria: Recursos de memoria (RAM) asignados al agente, facturados como memoria del agente (USD 0.009/GiB-h)

Todo el uso se redondea al segundo más cercano. En Runtime, el tiempo de inactividad que se pasa esperando la siguiente instrucción entre turnos no se factura.

Agent Gateway (Agent-to-Anywhere) se factura según el uso de recursos de Agent Compute (horas de CPU virtual).

Agente Compute vCPU-h ($0.085) corresponde a 15,000 llamadas a la API o solicitudes de autorización procesadas a través de Agent Gateway (Agent-to-Anywhere) durante la ejecución del agente.
Esto se aplica a todos los agentes en Agent Runtime y la app de Gemini Enterprise.
La facturación se prorratea según tu uso real por hora y por proyecto.

Nota: La facturación por el uso de Agent Gateway (agente a cualquier lugar) entrará en vigor el 13 de julio de 2026.

Memory Bank

Nota: La facturación de Memory Bank con esta estructura de precios comenzará el 1 de septiembre de 2026.

Memory Bank es un servicio completamente administrado para la generación, el almacenamiento, la recuperación y la incorporación de memoria de agentes. Se te factura por lo siguiente:

Almacenamiento: Datos totales almacenados (incluidas las revisiones), facturados como almacenamiento de agentes (USD 0.30/GiB-mes).
Operaciones: Operaciones de lectura y escritura
Solicitudes a la API de Read: 1 CPU virtual-h de Agent Compute ($0.085) por cada 3 millones de operaciones de lectura. Incluye cualquier solicitud de API que recupere información almacenada, como buscar en el banco de memoria o recuperar variables de estado (si la solicitud también escribe datos, solo se factura como una operación de escritura).
Solicitudes de la API de escritura: 1 vCPU-h de procesamiento del agente ($0.085) por cada millón de operaciones de escritura. Incluye cualquier solicitud a la API que crea o actualiza datos, como publicar nuevos recuerdos a largo plazo o borrar datos vencidos. Todos los importes se prorratean según tu uso real.
Tokens: Los tokens del modelo que se usan para la generación de memoria y las embeddings se facturan por separado en sus SKU de modelo respectivos.

Política de administración semántica

Nota: La facturación de la política de administración semántica en esta estructura de precios comenzará el 1 de agosto de 2026.

Las políticas de administración semántica son restricciones de lenguaje natural que configuras para administrar agentes de IA a través de sus llamadas a herramientas. Se te facturan las evaluaciones de respuestas de modelos de agentes y los tokens de modelos de evaluación (que se usan para las evaluaciones de respuestas de modelos de agentes) en sus SKU de modelos respectivos.

Todos los importes se prorratean según tu uso real.

Esto se aplica a todos los agentes en Agent Runtime y la app de Gemini Enterprise.

Sesiones

Nota: La facturación de sesiones con esta estructura de precios comenzará el 1 de septiembre de 2026.

Las sesiones administran el historial y el estado de la conversación. Se te factura por lo siguiente:

Almacenamiento: Datos totales almacenados, facturados como almacenamiento de agentes (USD 0.30 por GiB al mes).
Operaciones: Operaciones de lectura y escritura
Solicitudes a la API de Read: 1 CPU virtual-h de Agent Compute ($0.085) por cada 3 millones de operaciones de lectura. Incluye cualquier operación que recupere información almacenada, como cargar el historial de conversaciones y enumerar sesiones.
Solicitudes de la API de escritura: 1 vCPU-h de procesamiento del agente ($0.085) por cada millón de operaciones de escritura. Incluye cualquier solicitud a la API que crea o actualiza datos, como guardar nuevos turnos de chat, actualizar estados de sesión o borrar datos vencidos.

Registro de habilidades

Nota: La facturación del Registro de habilidades comenzará el 1 de julio de 2026.

Los precios de Skill Registry se basan en los siguientes componentes.

Almacenamiento: Datos totales almacenados, facturados como almacenamiento de agentes (USD 0.30 por GiB al mes).
Operaciones: Operaciones de lectura y escritura
Solicitudes a la API de Read: 1 CPU virtual-h de Agent Compute ($0.085) por cada 3 millones de operaciones de lectura. Incluye búsqueda, lectura y carga dinámica de habilidades
Solicitudes de la API de escritura: 1 vCPU-h de procesamiento del agente ($0.085) por cada millón de operaciones de escritura. Incluye la creación, actualización y eliminación de habilidades.
Tokens: Los tokens de modelo que se usan para el análisis de vulnerabilidades se facturan por separado en sus SKU de modelo respectivos.

Ray on Agent Platform

Capacitación

En las siguientes tablas, se indica el precio por hora aproximado de varios parámetros de configuración de entrenamiento. Puedes elegir una configuración personalizada de los tipos de máquinas seleccionados. Para calcular los precios, suma los costos de las máquinas virtuales que usas.

Si usas los tipos de máquinas de Compute Engine y les conectas aceleradores, el costo correspondiente se cobra por separado. Para calcularlo, multiplica los precios de la tabla de aceleradores a continuación por la cantidad de cada tipo de acelerador que uses.

Tipos de máquinas

Tipo de máquina	Precio (USD)
n1-standard-4	USD 0.2279988 / 1 hour
n1-standard-8	USD 0.4559976 / 1 hour
n1-standard-16	USD 0.9119952 / 1 hour
n1-standard-32	USD 1.8239904 / 1 hour
n1-standard-64	USD 3.6479808 / 1 hour
n1-standard-96	USD 5.4719712 / 1 hour
n1-highmem-2	USD 0.1419636 / 1 hour
n1-highmem-4	USD 0.2839272 / 1 hour
n1-highmem-8	USD 0.5678544 / 1 hour
n1-highmem-16	USD 1.1357088 / 1 hour
n1-highmem-32	USD 2.2714176 / 1 hour
n1-highmem-64	USD 4.5428352 / 1 hour
n1-highmem-96	USD 6.8142528 / 1 hour
n1-highcpu-16	USD 0.68014656 / 1 hour
n1-highcpu-32	USD 1.36029312 / 1 hour
n1-highcpu-64	USD 2.72058624 / 1 hour
n1-highcpu-96	USD 4.08087936 / 1 hour
a2-highgpu-1g*	USD 4.408062 / 1 hour
a2-highgpu-2g*	USD 8.816124 / 1 hour
a2-highgpu-4g*	USD 17.632248 / 1 hour
a2-highgpu-8g*	USD 35.264496 / 1 hour
a2-highgpu-16g*	USD 70.528992 / 1 hour
a3-highgpu-8g*	USD 105.39898088 / 1 hour
a3-megagpu-8g*	USD 110.65714224 / 1 hour
a4-highgpu-8g*	USD 148.212 / 1 hour
e2-standard-4	USD 0.16082748 / 1 hour
e2-standard-4	USD 0.32165496 / 1 hour
e2-standard-16	USD 0.64330992 / 1 hour
e2-standard-32	USD 1.28661984 / 1 hour
e2-highmem-2	USD 0.10847966 / 1 hour
e2-highmem-4	USD 0.21695932 / 1 hour
e2-highmem-8	USD 0.43391864 / 1 hour
e2-highmem-16	USD 0.86783728 / 1 hour
e2-highcpu-16	USD 0.4749144 / 1 hour
e2-highcpu-32	USD 0.9498288 / 1 hour
n2-standard-4	USD 0.2330832 / 1 hour
n2-standard-8	USD 0.4661664 / 1 hour
n2-standard-16	USD 0.9323328 / 1 hour
n2-standard-32	USD 1.8646656 / 1 hour
n2-standard-48	USD 2.7969984 / 1 hour
n2-standard-64	USD 3.7293312 / 1 hour
n2-standard-80	USD 4.661664 / 1 hour
n2-highmem-2	USD 0.1572168 / 1 hour
n2-highmem-4	USD 0.3144336 / 1 hour
n2-highmem-8	USD 0.6288672 / 1 hour
n2-highmem-16	USD 1.2577344 / 1 hour
n2-highmem-32	USD 2.5154688 / 1 hour
n2-highmem-48	USD 3.7732032 / 1 hour
n2-highmem-64	USD 5.0309376 / 1 hour
n2-highmem-80	USD 6.288672 / 1 hour
n2-highcpu-16	USD 0.6882816 / 1 hour
n2-highcpu-32	USD 1.3765632 / 1 hour
n2-highcpu-48	USD 2.0648448 / 1 hour
n2-highcpu-64	USD 2.7531264 / 1 hour
n2-highcpu-80	USD 3.441408 / 1 hour
c2-standard-4	USD 0.2505696 / 1 hour
c2-standard-8	USD 0.5011392 / 1 hour
c2-standard-16	USD 1.0022784 / 1 hour
c2-standard-30	USD 1.879272 / 1 hour
c2-standard-60	USD 3.758544 / 1 hour
m1-ultramem-40	USD 7.55172 / 1 hour
m1-ultramem-80	USD 15.10344 / 1 hour
m1-ultramem-160	USD 30.20688 / 1 hour
m1-megamem-96	USD 12.782592 / 1 hour
cloud-tpu	Los precios se determinan por el tipo de acelerador. Consulta “Aceleradores”.

Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

Aceleradores

Tipo de GPU	Precio (USD)
NVIDIA_TESLA_A100	USD 3.5206896 / 1 hour
NVIDIA_TESLA_A100_80GB	USD 4.517292 / 1 hour
NVIDIA_H100_80GB	USD 11.75586073 / 1 hour
NVIDIA_TESLA_P4	USD 0.72 / 1 hour
NVIDIA_TESLA_P100	USD 1.752 / 1 hour
NVIDIA_TESLA_T4	USD 0.42 / 1 hour
NVIDIA_TESLA_V100	USD 2.976 / 1 hour
TPU_V2 Single (8 núcleos)	USD 5.40 / 1 hour
Pod de TPU_V2 (32 núcleos)^*	USD 28.80 / 1 hour
TPU_V3 Single (8 núcleos)	USD 9.60 / 1 hour
Pod de TPU_V3 (32 núcleos)^*	USD 38.40 / 1 hour

Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

* El precio por el entrenamiento con el pod de Cloud TPU se basa en la cantidad de núcleos en el pod. La cantidad de núcleos en un pod siempre es un múltiplo de 32. Para determinar el precio del entrenamiento en un Pod que tiene más de 32 núcleos, multiplica el precio de un Pod de 32 núcleos por la cantidad de núcleos, dividido por 32. Por ejemplo, el precio de un pod de 128 núcleos es (precio del pod de 32 núcleos) × (128/32). Para obtener información sobre cuáles Pods de Cloud TPU están disponibles en una región específica, consulta Arquitectura del sistema en la documentación de Cloud TPU.

Discos

Tipo de disco	Precio (USD)
pd-standard	USD 0.000065753 / 1 gibibyte hour
pd-ssd	USD 0.000279452 / 1 gibibyte hour

Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

Todo el uso está sujeto a la política de cuotas de Agent Platform.
Debes almacenar los datos y los archivos de programa en buckets de Google Cloud Storage durante el ciclo de vida de Agent Platform. Obtén más información sobre el uso de Cloud Storage.

Se cobra el entrenamiento de tus modelos desde el momento en que los recursos se aprovisionan para un trabajo hasta que el trabajo finaliza.

Advertencia: La política de cuotas de Agent Platform limita tus trabajos de entrenamiento. Si seleccionas un clúster de procesamiento potente para los primeros trabajos de entrenamiento, es probable que superes la cuota.

Predicción y explicación

Las tablas siguientes proporcionan los precios de la predicción por lotes, la predicción en línea y la explicación en línea por hora de procesamiento de nodo. Una hora de procesamiento de nodo representa el tiempo que una máquina virtual dedica a la ejecución del trabajo de predicción o espera en estado activo (un extremo con uno o más modelos implementados) para administrar solicitudes de predicción o explicación.

Puedes usar VMs Spot con la inferencia de Agent Platform. Las VMs Spot se facturan según los precios de las VMs Spot de Compute Engine. Hay tarifas de administración de inferencia de Agent Platform además de tu uso de la infraestructura, como puedes ver en las tablas a continuación.

Puedes usar reservas de Compute Engine con la inferencia de la plataforma de agentes. Cuando usas las reservas de Compute Engine, se te factura según los precios de Compute Engine, incluidos los descuentos por compromiso de uso (CUD) aplicables. Hay tarifas de administración de inferencia de Agent Platform además de tu uso de la infraestructura, como puedes ver en las tablas a continuación.

Serie E2

Tipo de máquina	Precio (USD)
e2-standard-2	USD 0.0770564 / 1 hour
e2-standard-4	USD 0.1541128 / 1 hour
e2-standard-8	USD 0.3082256 / 1 hour
e2-standard-16	USD 0.6164512 / 1 hour
e2-standard-32	USD 1.2329024 / 1 hour
e2-highmem-2	USD 0.1039476 / 1 hour
e2-highmem-4	USD 0.2078952 / 1 hour
e2-highmem-8	USD 0.4157904 / 1 hour
e2-highmem-16	USD 0.8315808 / 1 hour
e2-highcpu-2	USD 0.056888 / 1 hour
e2-highcpu-4	USD 0.113776 / 1 hour
e2-highcpu-8	USD 0.227552 / 1 hour
e2-highcpu-16	USD 0.455104 / 1 hour
e2-highcpu-32	USD 0.910208 / 1 hour

Serie N1

Tipo de máquina	Precio (USD)
n1-standard-2	USD 0.1095 / 1 hour
n1-standard-4	USD 0.219 / 1 hour
n1-standard-8	USD 0.438 / 1 hour
n1-standard-16	USD 0.876 / 1 hour
n1-standard-32	USD 1.752 / 1 hour
n1-highmem-2	USD 0.137 / 1 hour
n1-highmem-4	USD 0.274 / 1 hour
n1-highmem-8	USD 0.548 / 1 hour
n1-highmem-16	USD 1.096 / 1 hour
n1-highcpu-2	USD 0.081 / 1 hour
n1-highcpu-4	USD 0.162 / 1 hour
n1-highcpu-8	USD 0.324 / 1 hour
n1-highcpu-16	USD 0.648 / 1 hour
n1-highcpu-32	USD 1.296 / 1 hour

Serie N2

Tipo de máquina	Precio (USD)
n2-standard-2	USD 0.1116854 / 1 hour
n2-standard-4	USD 0.2233708 / 1 hour
n2-standard-8	USD 0.4467416 / 1 hour
n2-standard-16	USD 0.8934832 / 1 hour
n2-standard-32	USD 1.7869664 / 1 hour
n2-highmem-2	USD 0.1506654 / 1 hour
n2-highmem-4	USD 0.3013308 / 1 hour
n2-highmem-8	USD 0.6026616 / 1 hour
n2-highmem-16	USD 1.2053232 / 1 hour
n2-highcpu-2	USD 0.0824504 / 1 hour
n2-highcpu-4	USD 0.1649008 / 1 hour
n2-highcpu-8	USD 0.3298016 / 1 hour
n2-highcpu-16	USD 0.6596032 / 1 hour
n2-highcpu-32	USD 1.3192064 / 1 hour

Serie N2D

Tipo de máquina	Precio (USD)
n2d-standard-2	USD 0.0971658 / 1 hour
n2d-standard-4	USD 0.1943316 / 1 hour
n2d-standard-8	USD 0.3886632 / 1 hour
n2d-standard-16	USD 0.7773264 / 1 hour
n2d-standard-32	USD 1.5546528 / 1 hour
n2d-highmem-2	USD 0.131077 / 1 hour
n2d-highmem-4	USD 0.262154 / 1 hour
n2d-highmem-8	USD 0.524308 / 1 hour
n2d-highmem-16	USD 1.048616 / 1 hour
n2d-highcpu-2	USD 0.0717324 / 1 hour
n2d-highcpu-4	USD 0.1434648 / 1 hour
n2d-highcpu-8	USD 0.2869296 / 1 hour
n2d-highcpu-16	USD 0.5738592 / 1 hour
n2d-highcpu-32	USD 1.1477184 / 1 hour

Serie C2

Tipo de máquina	Precio (USD)
c2-standard-4	USD 0.240028 / 1 hour
c2-standard-8	USD 0.480056 / 1 hour
c2-standard-16	USD 0.960112 / 1 hour
c2-standard-30	USD 1.80021 / 1 hour
c2-standard-60	USD 3.60042 / 1 hour

Serie C2D

Tipo de máquina	Precio (USD)
c2d-standard-2	USD 0.1044172 / 1 hour
c2d-standard-4	USD 0.2088344 / 1 hour
c2d-standard-8	USD 0.4176688 / 1 hour
c2d-standard-16	USD 0.8353376 / 1 hour
c2d-standard-32	USD 1.6706752 / 1 hour
c2d-standard-56	USD 2.9236816 / 1 hour
c2d-standard-112	USD 5.8473632 / 1 hour
c2d-highmem-2	USD 0.1408396 / 1 hour
c2d-highmem-4	USD 0.2816792 / 1 hour
c2d-highmem-8	USD 0.5633584 / 1 hour
c2d-highmem-16	USD 1.1267168 / 1 hour
c2d-highmem-32	USD 2.2534336 / 1 hour
c2d-highmem-56	USD 3.9435088 / 1 hour
c2d-highmem-112	USD 7.8870176 / 1 hour
c2d-highcpu-2	USD 0.086206 / 1 hour
c2d-highcpu-4	USD 0.172412 / 1 hour
c2d-highcpu-8	USD 0.344824 / 1 hour
c2d-highcpu-16	USD 0.689648 / 1 hour
c2d-highcpu-32	USD 1.379296 / 1 hour
c2d-highcpu-56	USD 2.413768 / 1 hour
c2d-highcpu-112	USD 4.827536 / 1 hour

Serie C3

Tipo de máquina	Precio (USD)
c3-highcpu-4	USD 0.19824 / 1 hour
c3-highcpu-8	USD 0.39648 / 1 hour
c3-highcpu-22	USD 1.09032 / 1 hour
c3-highcpu-44	USD 2.18064 / 1 hour
c3-highcpu-88	USD 4.36128 / 1 hour
c3-highcpu-176	USD 8.72256 / 1 hour

Serie C4

Tipo de máquina	Precio (USD)
c4-standard-2	USD 0.1113959 / 1 hour
c4-standard-4	USD 0.2273205 / 1 hour
c4-standard-8	USD 0.454641 / 1 hour
c4-standard-16	USD 0.909282 / 1 hour
c4-standard-24	USD 1.363923 / 1 hour
c4-standard-32	USD 1.818564 / 1 hour
c4-standard-48	USD 2.727846 / 1 hour
c4-standard-96	USD 5.455692 / 1 hour
c4-standard-144	USD 8.183538 / 1 hour
c4-standard-192	USD 10.911384 / 1 hour
c4-standard-288	USD 16.367076 / 1 hour
c4-highcpu-2	USD 0.0978098 / 1 hour
c4-highcpu-4	USD 0.1956196 / 1 hour
c4-highcpu-8	USD 0.3912392 / 1 hour
c4-highcpu-16	USD 0.7824784 / 1 hour
c4-highcpu-24	USD 1.1737176 / 1 hour
c4-highcpu-32	USD 1.5649568 / 1 hour
c4-highcpu-48	USD 2.3474352 / 1 hour
c4-highcpu-96	USD 4.6948704 / 1 hour
c4-highcpu-144	USD 7.0423056 / 1 hour
c4-highcpu-192	USD 9.3897408 / 1 hour
c4-highcpu-288	USD 14.0846112 / 1 hour
c4-highmem-2	USD 0.1476255 / 1 hour
c4-highmem-4	USD 0.2997797 / 1 hour
c4-highmem-8	USD 0.5995594 / 1 hour
c4-highmem-16	USD 1.1991188 / 1 hour
c4-highmem-24	USD 1.7941495 / 1 hour
c4-highmem-32	USD 2.3982376 / 1 hour
c4-highmem-48	USD 3.5973564 / 1 hour
c4-highmem-96	USD 7.1947128 / 1 hour
c4-highmem-144	USD 10.7920692 / 1 hour
c4-highmem-192	USD 14.3894256 / 1 hour
c4-highmem-288	USD 21.5841384 / 1 hour
c4-highmem-288-metal	USD 21.5841384 / 1 hour

Serie A2

Tipo de máquina	Precio (USD)
a2-highgpu-1g	USD 4.2244949 / 1 hour
a2-highgpu-2g	USD 8.4489898 / 1 hour
a2-highgpu-4g	USD 16.8979796 / 1 hour
a2-highgpu-8g	USD 33.7959592 / 1 hour
a2-megagpu-16g	USD 64.1020592 / 1 hour
a2-ultragpu-1g	USD 5.7818474 / 1 hour
a2-ultragpu-2g	USD 11.5636948 / 1 hour
a2-ultragpu-4g	USD 23.1273896 / 1 hour
a2-ultragpu-8g	USD 46.2547792 / 1 hour

Cuando se consume de una reserva o capacidad de instancia interrumpible, la facturación se distribuye en dos SKUs: el SKU de GCE con la etiqueta “vertex-ai-online-prediction” y el SKU de tarifa de administración de la plataforma de agentes. Esto te permite usar tus descuentos por compromiso de uso (CUD) en Agent Platform.

Serie A3

Tipo de máquina	Precio (USD)
a3-ultragpu-8g	USD 96.015616 / 1 hour
a3-megagpu-8g	USD 106.65474 / 1 hour

Cuando se consume de una reserva o capacidad de instancia interrumpible, la facturación se distribuye en dos SKUs: el SKU de GCE con la etiqueta “vertex-ai-online-prediction” y el SKU de tarifa de administración de la plataforma de agentes. Esto te permite usar tus descuentos por compromiso de uso (CUD) en Agent Platform.

Serie A4

Tipo de máquina	Precio (USD)
a4-highgpu-8g	USD 148.212 / 1 hour

Cuando se consume de una reserva o capacidad de instancia interrumpible, la facturación se distribuye en dos SKUs: el SKU de GCE con la etiqueta “vertex-ai-online-prediction” y el SKU de tarifa de administración de la plataforma de agentes. Esto te permite usar tus descuentos por compromiso de uso (CUD) en Agent Platform.

Serie A4X

Tipo de máquina	Precio (USD)
a4x-highgpu-4g	USD 74.75 / 1 hour

Cuando se consume de una reserva o capacidad de instancia interrumpible, la facturación se distribuye en dos SKUs: el SKU de GCE con la etiqueta “vertex-ai-online-prediction” y el SKU de tarifa de administración de la plataforma de agentes. Esto te permite usar tus descuentos por compromiso de uso (CUD) en Agent Platform.

a4x-highgpu-4g requiere al menos 18 VMs.

Serie G2

Tipo de máquina	Precio (USD)
g2-standard-4	USD 0.81293 / 1 hour
g2-standard-8	USD 0.98181 / 1 hour
g2-standard-12	USD 1.15069 / 1 hour
g2-standard-16	USD 1.31957 / 1 hour
g2-standard-24	USD 2.30138 / 1 hour
g2-standard-32	USD 1.99509 / 1 hour
g2-standard-48	USD 4.60276 / 1 hour
g2-standard-96	USD 9.20552 / 1 hour

Cuando se consume de una reserva o capacidad de instancia interrumpible, la facturación se distribuye en dos SKUs: el SKU de GCE con la etiqueta “vertex-ai-online-prediction” y el SKU de tarifa de administración de la plataforma de agentes. Esto te permite usar tus descuentos por compromiso de uso (CUD) en Agent Platform.

Serie G4

Tipo de máquina	Precio (USD)
g4-standard-48	USD 5.1749195 / 1 hour
g4-standard-96	USD 10.349839 / 1 hour
g4-standard-192	USD 20.699678 / 1 hour
g4-standard-384	USD 41.399356 / 1 hour

Precios de TPU v5e

Tipo de máquina	Precio (USD)
ct5lp-hightpu-1t	USD 1.38 / 1 hour
ct5lp-hightpu-4t	USD 5.52 / 1 hour
ct5lp-hightpu-8t	USD 5.52 / 1 hour

Precios de TPU v6e

Tipo de máquina	Precio (USD)
ct6e-standard-1t	USD 3.105 / 1 hour
ct6e-standard-4t	USD 12.42 / 1 hour
ct6e-standard-8t	USD 24.84 / 1 hour

Cada tipo de máquina se cobra como los siguientes SKU en tu factura de Google Cloud:

Costo de CPU virtual: medido en horas de CPU virtual
Costo de RAM: medido en GB-hora
Costo de GPU: si está incorporado en la máquina o configurado de manera opcional, medido en GPU-hora

Los precios de los tipos de máquinas son usados para aproximar el costo total por hora para cada nodo de predicción de una versión del modelo que usa ese tipo de máquina.

Por ejemplo, un tipo de máquina de n1-highcpu-32 incluye 32 CPU virtuales y 32 GB de RAM. Por lo tanto, el precio por hora es igual a 32 horas de CPU virtual + 32 horas de GB.

Serie E2

Elemento	Precio (USD)
vCPU	USD 0.0250826 / 1 hour
RAM	USD 0.0033614 / 1 gibibyte hour

Serie N1

Elemento	Precio (USD)
vCPU	USD 0.036 / 1 hour
RAM	USD 0.005 / 1 gibibyte hour

Serie N2

Elemento	Precio (USD)
vCPU	USD 0.0363527 / 1 hour
RAM	USD 0.0048725 / 1 gibibyte hour

Serie N2D

Elemento	Precio (USD)
vCPU	USD 0.0316273 / 1 hour
RAM	USD 0.0042389 / 1 gibibyte hour

Serie C2

Elemento	Precio (USD)
vCPU	USD 0.039077 / 1 hour
RAM	USD 0.0052325 / 1 gibibyte hour

Serie C2D

Elemento	Precio (USD)
vCPU	USD 0.0339974 / 1 hour
RAM	USD 0.0045528 / 1 gibibyte hour

Serie C3

Elemento	Precio (USD)
vCPU	USD 0.03908 / 1 hour
RAM	USD 0.00524 / 1 gibibyte hour

Serie C4

Elemento	Precio (USD)
vCPU	USD 0.0398475 / 1 hour
RAM	USD 0.0045287 / 1 gibibyte hour

Serie A2

Elemento	Precio (USD)
vCPU	USD 0.0363527 / 1 hour
RAM	USD 0.0048725 / 1 gibibyte hour
GPU (A100 de 40 GB)	USD 3.3741 / 1 hour
GPU (A100 de 80 GB)	USD 4.51729 / 1 hour

Serie A3

Elemento	Precio (USD)
vCPU	USD 0.0293227 / 1 hour
RAM	USD 0.0025534 / 1 gibibyte hour
GPU (H100 de 80 GB)	USD 11.2660332 / 1 hour
GPU (H200)	USD 10.708501 / 1 hour

Serie G2

Elemento	Precio (USD)
vCPU	USD 0.02874 / 1 hour
RAM	USD 0.00337 / 1 gibibyte hour
GPU (L4)	USD 0.64405 / 1 hour

Algunos tipos de máquina te permiten agregar aceleradores opcionales de GPU para predicciones. Las GPU opcionales incurren en un cargo adicional, separado de los descritos en la tabla anterior. Consulta cada tabla de precios, que describen los precios de cada tipo de GPU opcional.

Precio por hora de los aceleradores

Tipo de GPU	Precio (USD)
NVIDIA_TESLA_P4	USD 0.69 / 1 hour
NVIDIA_TESLA_P100	USD 1.679 / 1 hour
NVIDIA_TESLA_T4	USD 0.402 / 1 hour
NVIDIA_TESLA_V100	USD 2.852 / 1 hour

Los precios son por GPU. Si usas varias GPUs por nodo de predicción (o si tu versión se ajusta para usar varios nodos),los costos se ajustan en consecuencia.

Agent Platform Inference te permite realizar predicciones de tu modelo ejecutando varias máquinas virtuales (“nodos”). De forma predeterminada, Agent Platform escala automáticamente la cantidad de nodos que se ejecutan a la vez. En el caso de la predicción en línea, se escala la cantidad de nodos para satisfacer la demanda. Cada nodo puede responder a varias solicitudes de predicción. En el caso de la predicción por lotes, se escala la cantidad de nodos a fin de reducir el tiempo total que se necesita para ejecutar un trabajo. Puedes personalizar la escala de los nodos de predicción.

Se cobra el tiempo que se ejecuta cada nodo en tu modelo, incluido lo siguiente:

Cuando el nodo procesa un trabajo de predicción por lotes
Cuando el nodo procesa una solicitud de predicción en línea
Cuando el nodo está listo para realizar predicciones en línea

El costo de ejecución de un nodo por una hora es una hora de procesamiento de nodo. En la tabla de precios de predicción, se describe el precio de una hora de procesamiento de nodo, que varía según la región y si se trata de predicción en línea o por lotes.

Puedes consumir horas de procesamiento de nodo en incrementos fraccionarios. Por ejemplo, ejecutar un nodo durante 30 minutos cuesta 0.5 horas de procesamiento de nodo.

Cálculos de costos para los tipos de máquinas de Compute Engine (N1)

El tiempo de ejecución de un nodo se factura en incrementos de 30 segundos. Esto significa que, cada 30 segundos, tu proyecto se factura por 30 segundos de los recursos de CPU virtual, RAM y GPU que use tu nodo en ese momento.

Más información sobre el ajuste de escala automático de los nodos de predicción

Predicción en línea	Predicción por lotes
La prioridad del escalamiento es reducir la latencia de las solicitudes individuales. El servicio mantiene el modelo preparado durante unos minutos de inactividad después de inspeccionar una solicitud.	La prioridad del escalamiento es reducir el tiempo transcurrido total del trabajo.
El escalamiento afecta los costos totales cada mes: cuanto más numerosas y frecuentes sean las solicitudes, más nodos se usarán.	El escalamiento no debería afectar mucho el precio del trabajo, aunque se pueden generar sobrecargas si se agrega un nuevo nodo.
Puedes elegir dejar que el servicio escale como respuesta al tráfico (ajuste de escala automático) o puedes especificar una cantidad de nodos para que se ejecuten constantemente y evitar así la latencia (escalamiento manual). Si eliges el ajuste de escala automático, la cantidad de nodos escala automáticamente. En las implementaciones de tipo de máquina heredadas (MLS1) de Agent Platform Inference, la cantidad de nodos puede reducirse verticalmente a cero en períodos sin tráfico. Las implementaciones de Agent Platform y otros tipos de implementaciones de Agent Platform Inference no pueden reducir la escala verticalmente a cero nodos. Si eliges el escalamiento manual, especificas una cantidad de nodos para que se sigan ejecutando todo el tiempo. Se cobra todo el tiempo en el que los nodos se ejecutan, a partir del momento de la implementación y hasta que borres la versión del modelo.	Puedes modificar el escalamiento configurando una cantidad máxima de nodos que se usará en un trabajo de predicción por lotes y la cantidad de nodos que deben seguir ejecutándose para un modelo cuando lo implementas.

Predicción en línea

Predicción por lotes

La prioridad del escalamiento es reducir la latencia de las solicitudes individuales. El servicio mantiene el modelo preparado durante unos minutos de inactividad después de inspeccionar una solicitud.

La prioridad del escalamiento es reducir el tiempo transcurrido total del trabajo.

El escalamiento afecta los costos totales cada mes: cuanto más numerosas y frecuentes sean las solicitudes, más nodos se usarán.

El escalamiento no debería afectar mucho el precio del trabajo, aunque se pueden generar sobrecargas si se agrega un nuevo nodo.

Puedes elegir dejar que el servicio escale como respuesta al tráfico (ajuste de escala automático) o puedes especificar una cantidad de nodos para que se ejecuten constantemente y evitar así la latencia (escalamiento manual).

Si eliges el ajuste de escala automático, la cantidad de nodos escala automáticamente. En las implementaciones de tipo de máquina heredadas (MLS1) de Agent Platform Inference, la cantidad de nodos puede reducirse verticalmente a cero en períodos sin tráfico. Las implementaciones de Agent Platform y otros tipos de implementaciones de Agent Platform Inference no pueden reducir la escala verticalmente a cero nodos.
Si eliges el escalamiento manual, especificas una cantidad de nodos para que se sigan ejecutando todo el tiempo. Se cobra todo el tiempo en el que los nodos se ejecutan, a partir del momento de la implementación y hasta que borres la versión del modelo.

Puedes modificar el escalamiento configurando una cantidad máxima de nodos que se usará en un trabajo de predicción por lotes y la cantidad de nodos que deben seguir ejecutándose para un modelo cuando lo implementas.

Los trabajos de predicción por lotes se cobran después de que se completa el trabajo

Los trabajos de predicción por lotes se cobran después de que se completan los trabajos, no de manera incremental durante el trabajo. Las alertas de presupuesto de Facturación de Cloud que configuraste no se activan mientras se ejecuta un trabajo. Antes de comenzar un trabajo grande, considera ejecutar algunos trabajos comparativos de costos con datos de entrada pequeños.

Ejemplo de un cálculo de predicción

Una empresa inmobiliaria de una región de América ejecuta una predicción semanal del valor de las viviendas en las áreas en las que trabaja. En un mes, ejecuta predicciones para cuatro semanas en lotes de 3920, 4277, 3849 y 3961. Los trabajos se limitan a un nodo y cada instancia demora un promedio de procesamiento de 0.72 segundos.

Primero, calcula la cantidad de tiempo de ejecución de cada trabajo:

Cargando...

Dado que cada trabajo se ejecutó durante más de diez minutos, se cobra por cada minuto de procesamiento:

Cargando...

El cargo total del mes es de $0.26.

En este ejemplo, hicimos la suposición de que los trabajos se ejecutaron en un único nodo y requirieron una cantidad de tiempo uniforme por cada instancia de entrada. En los cálculos de uso real, asegúrate de tener en cuenta el uso de varios nodos y el tiempo real de ejecución de cada nodo.

Cargos por Vertex Explainable AI

Explicaciones basadas en atributos

Las explicaciones basadas en atributos no tienen cargo adicional a los precios de predicción. Sin embargo, el procesamiento de las explicaciones demora más que el de las predicciones normales. Por lo tanto, el uso intensivo de las Vertex Explainable AI junto con el ajuste de escala automático podrían traer como resultado el inicio de más nodos, lo que podría aumentar los cargos de predicción.

Explicaciones basadas en ejemplos

Los precios de las explicaciones basadas en ejemplos consisten en lo siguiente:

Cuando cargas un modelo o actualizas el conjunto de datos de un modelo, se te factura lo siguiente:
por hora de procesamiento de nodo por el trabajo de predicción por lotes que se usa para generar las representaciones de ejemplos de espacio latente. Esto se factura con la misma tarifa que la predicción.
un costo para crear o actualizar índices. El costo es el mismo que los costos de indexación de la búsqueda de vectores, que es cantidad de ejemplos * cantidad de dimensiones * 4 bytes por número de punto flotante * $3.00 por GB. Por ejemplo, si tienes 1 millón de ejemplos y 1,000 dimensiones de espacio latente, el costo es $12 (1,000,000 * 1,000 * 4 * 3.00 / 1,000,000,000).
Cuando implementas un modelo en un extremo, se te factura por hora de procesamiento de nodo por cada nodo en tu extremo. Todo el procesamiento asociado con el extremo se cobra a la misma tarifa que la predicción. Sin embargo, porque las explicaciones basadas en ejemplos necesitan recursos de procesamiento adicionales para entregar el índice de búsqueda de vectores, se inician más nodos, lo que aumenta los cargos de predicción.

Búsqueda de arquitectura neuronal en la plataforma de agentes

En las siguientes tablas, se resumen los precios de cada región en la que está disponible Neural Architecture Search.

Precios

En las siguientes tablas, se indica el precio por hora de diversos parámetros de configuración.

Puedes elegir un nivel de escala predefinido o una configuración personalizada de tipos de máquinas seleccionados. Si eliges una configuración personalizada, suma los costos de las máquinas virtuales utilizadas.

Los precios de los tipos de máquinas heredadas con acelerador incluyen el costo de los aceleradores. Si usas los tipos de máquinas de Compute Engine y les conectas aceleradores, el costo correspondiente se cobra por separado. Para calcular este costo, multiplica los precios de la siguiente tabla de aceleradores por la cantidad de cada tipo de acelerador que uses.

Tipos de máquinas

Tipo de máquina	Precio (USD)
n1-standard-4	USD 0.2849985 / 1 hour
n1-standard-8	USD 0.569997 / 1 hour
n1-standard-16	USD 1.139994 / 1 hour
n1-standard-32	USD 2.279988 / 1 hour
n1-standard-64	USD 4.559976 / 1 hour
n1-standard-96	USD 6.839964 / 1 hour
n1-highmem-2	USD 0.1774545 / 1 hour
n1-highmem-4	USD 0.1774545 / 1 hour
n1-highmem-8	USD 0.709818 / 1 hour
n1-highmem-16	USD 1.419636 / 1 hour
n1-highmem-32	USD 2.839272 / 1 hour
n1-highmem-64	USD 5.678544 / 1 hour
n1-highmem-96	USD 8.517816 / 1 hour
n1-highcpu-16	USD 0.8501832 / 1 hour
n1-highcpu-32	USD 1.7003664 / 1 hour
n1-highcpu-64	USD 3.4007328 / 1 hour
n1-highcpu-96	USD 5.1010992 / 1 hour
a2-highgpu-1g	USD 5.641070651 / 1 hour
a2-highgpu-2g	USD 11.282141301 / 1 hour
a2-highgpu-4g	USD 22.564282603 / 1 hour
a2-highgpu-8g	USD 45.128565205 / 1 hour
a2-highgpu-16g	USD 90.257130411 / 1 hour
e2-standard-4	USD 0.20103426 / 1 hour
e2-standard-8	USD 0.40206852 / 1 hour
e2-standard-16	USD 0.80413704 / 1 hour
e2-standard-32	USD 1.60827408 / 1 hour
e2-highmem-2	USD 0.13559949 / 1 hour
e2-highmem-4	USD 0.27119898 / 1 hour
e2-highmem-8	USD 0.54239796 / 1 hour
e2-highmem-16	USD 1.08479592 / 1 hour
e2-highcpu-16	USD 0.59364288 / 1 hour
e2-highcpu-32	USD 1.18728576 / 1 hour
n2-standard-4	USD 0.291354 / 1 hour
n2-standard-8	USD 0.582708 / 1 hour
n2-standard-16	USD 1.165416 / 1 hour
n2-standard-32	USD 2.330832 / 1 hour
n2-standard-48	USD 3.496248 / 1 hour
n2-standard-64	USD 4.661664 / 1 hour
n2-standard-80	USD 5.82708 / 1 hour
n2-highmem-2	USD 0.196521 / 1 hour
n2-highmem-4	USD 0.393042 / 1 hour
n2-highmem-8	USD 0.786084 / 1 hour
n2-highmem-16	USD 1.572168 / 1 hour
n2-highmem-32	USD 3.144336 / 1 hour
n2-highmem-48	USD 4.716504 / 1 hour
n2-highmem-64	USD 6.288672 / 1 hour
n2-highmem-80	USD 7.86084 / 1 hour
n2-highcpu-16	USD 0.860352 / 1 hour
n2-highcpu-32	USD 1.720704 / 1 hour
n2-highcpu-64	USD 3.441408 / 1 hour
n2-highcpu-80	USD 4.30176 / 1 hour
c2-standard-4	USD 0.313212 / 1 hour
c2-standard-8	USD 0.626424 / 1 hour
c2-standard-16	USD 1.252848 / 1 hour
c2-standard-30	USD 2.34909 / 1 hour
c2-standard-60	USD 4.69818 / 1 hour
c4-standard-2	USD 0.1113959 / 1 hour
c2-standard-4	USD 0.2273205 / 1 hour
c4-standard-8	USD 0.454641 / 1 hour
c4-standard-16	USD 0.909282 / 1 hour
c4-standard-24	USD 1.363923 / 1 hour
c4-standard-32	USD 1.818564 / 1 hour
c4-standard-48	USD 2.727846 / 1 hour
c4-standard-96	USD 5.455692 / 1 hour
c4-standard-144	USD 8.183538 / 1 hour
c4-standard-192	USD 10.911384 / 1 hour
c4-standard-288	USD 16.367076 / 1 hour
c4-highcpu-2	USD 0.0978098 / 1 hour
c4-highcpu-4	USD 0.1956196 / 1 hour
c4-highcpu-8	USD 0.3912392 / 1 hour
c4-highcpu-16	USD 0.7824784 / 1 hour
c4-highcpu-24	USD 1.1737176 / 1 hour
c4-highcpu-32	USD 0.3912392 / 1 hour
c4-highcpu-48	USD 2.3474352 / 1 hour
c4-highcpu-96	USD 4.6948704 / 1 hour
c4-highcpu-144	USD 7.0423056 / 1 hour
c4-highcpu-192	USD 9.3897408 / 1 hour
c4-highcpu-288	USD 14.0846112 / 1 hour
c4-highmem-2	USD 0.1476255 / 1 hour
c4-highmem-4	USD 0.2997797 / 1 hour
c4-highmem-8	USD 0.5995594 / 1 hour
c4-highmem-16	USD 1.1991188 / 1 hour
c4-highmem-24	USD 1.7941495 / 1 hour
c4-highmem-32	USD 2.3982376 / 1 hour
c4-highmem-48	USD 3.5973564 / 1 hour
c4-highmem-96	USD 7.1947128 / 1 hour
c4-highmem-144	USD 10.7920692 / 1 hour
c4-highmem-192	USD 14.3894256 / 1 hour
c4-highmem-288	USD 21.5841384 / 1 hour
c4-highmem-288-metal	USD 21.5841384 / 1 hour

Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

Los precios de instancias de a2-highgpu incluyen los cargos por los aceleradores NVIDIA_TESLA_A100 adjuntos.

Aceleradores

Tipo de GPU	Precio (USD)
NVIDIA_TESLA_A100	USD 4.400862 / 1 hour
NVIDIA_TESLA_P4	USD 0.90 / 1 hour
NVIDIA_TESLA_P100	USD 2.19 / 1 hour
NVIDIA_TESLA_T4	USD 0.525 / 1 hour
NVIDIA_TESLA_V100	USD 3.72 / 1 hour

Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

Discos

Tipo de disco	Precio (USD)
pd-standard	USD 0.000082192 / 1 gibibyte hour
pd-ssd	USD 0.000349315 / 1 gibibyte hour

Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

Notas:

Todo el uso está sujeto a la política de cuotas de Neural Architecture Search.
Debes almacenar los datos y archivos del programa en buckets de Cloud Storage durante el ciclo de vida de Neural Architecture Search. Obtén más información sobre el uso de Cloud Storage.
Para ver los descuentos por volumen, comunícate con el equipo de ventas.
El precio del disco solo se cobra cuando configuras el tamaño de disco de cada VM en un tamaño superior a 100 GB. No se cobran los primeros 100 GB (el tamaño de disco predeterminado) de un disco para cada VM. Por ejemplo, si configuras cada VM para que tenga 105 GB de disco, se te cobra por 5 GB de disco por cada VM.

Uso obligatorio de Cloud Storage

Además de los costos que se describen en este documento, debes almacenar los datos y archivos del programa en buckets de Cloud Storage durante el ciclo de vida de Neural Architecture Search. Este almacenamiento está sujeto a la política de precios de Cloud Storage.

El uso obligatorio de Cloud Storage incluye lo siguiente:

Realizar la etapa de pruebas del paquete de aplicaciones de entrenamiento
Almacenar tus datos de entrada de entrenamiento

Nota: Puedes usar otro servicio de Google Cloud para almacenar los datos de entrada, como BigQuery, que tiene sus propios precios asociados.

Almacenar los resultados de los trabajos. La búsqueda de arquitectura neuronal no requiere almacenamiento a largo plazo de estos elementos. así que puedes quitar los archivos apenas finalice la operación

Operaciones gratuitas para la administración de los recursos

Las operaciones de administración de recursos de Neural Architecture Search son sin costo adicional. Sin embargo, puede que algunas de estas operaciones se vean limitadas por la política de cuotas de Neural Architecture Search.

Recurso	Operaciones gratuitas
trabajos	get, list, cancel
operaciones	get, list, cancel, delete

Canalizaciones de Agent Platform

Las canalizaciones de la plataforma de agentes cobran una tarifa de ejecución de $0.03 por cada ejecución de canalización. No se te cobrará la tarifa de ejecución durante la versión preliminar. También pagas por los recursos de Google Cloud que usas con las canalizaciones de Agent Platform, como los recursos de Compute Engine que consumen los componentes de canalización (se cobran con la misma tarifa que la de entrenamiento administrado de Agent Platform). Por último, eres responsable del costo de cualquier servicio (como Dataflow) que llame tu canalización.

Agent Platform Feature Store

Agent Platform Feature Store cuenta con disponibilidad general (DG) desde noviembre de 2023. Para obtener información sobre las versiones previas de los productos, consulta Agent Platform Feature Store (heredada).

Nuevo Agent Platform Feature Store

El nuevo Agent Platform Feature Store asiste la funcionalidad en 2 tipos de operaciones:

Las operaciones sin conexión son las operaciones para transferir, almacenar, extraer y transformar datos en el almacén sin conexión (BigQuery)
Las operaciones en línea son las operaciones para transferir datos en el almacenamiento en línea y las operaciones de datos mientras están en el almacén en línea.

Precios de las operaciones sin conexión

Ya que BigQuery se usa para las operaciones sin conexión, consulta los precios de BigQuery para funcionalidades como la transferencia al almacén sin conexión, búsquedas en el almacén sin conexión y el almacenamiento sin conexión.

Precios de las operaciones en línea

Para las operaciones en línea, Agent Platform Feature Store cobra por todas las funciones de DG para transferir datos al almacén en línea, entregar datos o almacenar datos. Un nodo-hora representa el tiempo que gasta una máquina virtual en completar una operación, que se cobra por minuto.

Operación	Precio (USD)
Nodo de procesamiento de datos Procesamiento de datos (p.ej., transferencia a cualquier almacenamiento, supervisión, etcétera)	USD 0.08 / 1 hour
Nodo de entrega en línea optimizada Entrega con baja latencia y entrega de embeddings Cada nodo incluye 200 GB de almacenamiento	USD 0.30 / 1 hour
Nodo de entrega en línea de Bigtable Entrega con Cloud Bigtable	USD 0.94 / 1 hour
Almacenamiento de entrega en línea de Bigtable Almacenamiento para la entrega con Cloud Bigtable	USD 0.000342466 / 1 gibibyte hour

La entrega en línea optimizada y la entrega en línea de Bigtable usan arquitecturas diferentes, por lo tanto, sus nodos no son comparables.

Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

Estimados de la carga de trabajo de las operaciones en línea

Ten en cuenta los siguientes lineamientos cuando estimes tus cargas de trabajo. La cantidad de nodos necesarios para una carga de trabajo pueden variar en cada método de entrega.

Procesamiento de datos:
Transferencia: Un nodo puede transferir un mínimo de 100 MiB de datos por hora a un almacén en línea de Bigtable o a un almacén en línea optimizado si no se usan funciones analíticas.
Entrega en línea de Bigtable: cada nodo puede soportar alrededor de 15,000 QPS y hasta 5 TB de almacenamiento.
Entrega en línea optimizada: El rendimiento se basa en el tipo de máquina y las réplicas, que se configuran automáticamente para minimizar los costos sujetos a la carga de trabajo. Cada nodo puede tener un mínimo de 2 y un máximo de 6 réplicas para alta disponibilidad y ajuste de escala automático. Se te cobra por la cantidad de réplicas correspondientes. Para obtener más detalles, consulta los ejemplos de situaciones mensuales.
Para cargas de trabajo no relacionadas con embeddings, cada nodo puede admitir aproximadamente 500 QPS y hasta 200 GB de almacenamiento.
Para cargas de trabajo relacionadas con embeddings, cada nodo puede admitir aproximadamente 500 QPS y hasta 4 GB de almacenamiento de datos de 512 dimensiones.

Puedes ver la cantidad de nodos (con réplicas) en el Explorador de métricas:

Explorador de métricas para averiguar la cantidad de nodos que se usaron.

Ejemplo de casos mensuales (suponiendo que la región es us-central1)

Carga de trabajo de transmisión de datos: Entrega en línea de Bigtable con 2.5 TB de datos (1 GB actualizado a diario) y 1,200 QPS

Operaciones	Uso mensual	Costo mensual
Nodo de procesamiento de datos	(1 GB por día) × (30 días por mes) × (1,000 MB por GB) × (1 nodo-hora por 100 MB) = 300 nodo-hora	300 nodo-hora × ($0.08 por nodo-hora) = $24
Nodo de entrega en línea optimizada	N/A	N/A
Nodo de entrega en línea de Bigtable	(1 nodo) * (24 horas por día) * (30 días por mes) = 720 nodo-hora	720 nodo-hora * ($0.94 por nodo-hora) = $677
Almacenamiento de entrega en línea de Bigtable	(2.5 TB por mes) * (1000 GB por TB) = 2500 GB por mes	2500 GB por mes * ($0.25 por mes de GB) = $625
Total		$1,326

Carga de trabajo de QPS alta: Entrega en línea optimizada con 10 GB de datos sin embeddings (5 GB actualizados a diario) y 2,000 QPS

Operaciones	Uso mensual	Costo mensual
Nodo de procesamiento de datos	(5 GB por día) * (30 días por mes) * (1,000 MB por GB) * (1 nodo-hora por 100 MB) = 1,500 nodo-hora	1,500 nodo-hora * ($0.08 por nodo-hora) = $120
Nodo de entrega en línea optimizada	Redondeo(10 GB * (1 nodo / 200 GB)) = 1 * máx(2 réplicas predeterminadas, 2,000 QPS * (1 réplica / 500 QPS)) = 4 nodos totales * (24 h por día) * (30 días por mes) =2,880 nodo-hora	2,880 nodo-hora * ($0.30 por nodo-hora) = $864
Nodo de entrega en línea de Bigtable	N/A	N/A
Almacenamiento de entrega en línea de Bigtable	N/A	N/A
Total		$984

Carga de trabajo de entrega de embeddings: Entrega en línea optimizada con 20 GB de datos de embeddings (2 GB actualizados a diario) y 800 QPS

Operaciones	Uso mensual	Costo mensual
Nodo de procesamiento de datos	(2 GB por día) * (30 días por mes) * (1,000 MB por GB) * (1 nodo-hora por 100 MB) = 600 nodo-hora	600 nodo-hora × ($0.08 por nodo-hora) = $48
Nodo de entrega en línea optimizada	Redondeo(20 GB* (1 nodo / 4 GB) = 5 * máx.(2 réplicas predeterminadas, 800 QPS * (1 réplica / 500 QPS)) = 10 nodos totales * (24 h/día) * (30 días/mes) = 7,200 nodo-hora	7,200 nodo-hora * ($0.30 por nodo-hora) = $2,160
Nodo de entrega en línea de Bigtable	N/A	N/A
Almacenamiento de entrega en línea de Bigtable	N/A	N/A
Total		USD 2,208

Agent Platform Feature Store (heredado)

Los precios de Agent Platform Feature Store (heredado) se basan en la cantidad de datos de atributos en el almacenamiento en línea y sin conexión, así como en la disponibilidad de la entrega en línea. Un nodo por hora representa el tiempo que una máquina virtual dedica a entregar datos de atributos o el que tiempo que espera en un estado listo para manejar las solicitudes de datos de atributos.

Operación	Precio (USD)
Almacenamiento en línea	$0.25 por GB por mes
Almacenamiento sin conexión	$0.023 por GB por mes
Entrega en línea	$0.94 por nodo por hora
Exportación por lotes	$0.005 por GB
Transferencia de transmisión	$0.10 por GB de transferencia

Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

Cuando habilitas la supervisión del valor de los atributos, la facturación incluye los cargos correspondientes mencionados anteriormente, además de los cargos correspondientes a continuación:

$3.50 por GB para todos los datos analizados. Con el análisis de instantáneas habilitado, se incluyen las instantáneas tomadas para los datos en Agent Platform Feature Store (heredado). Con el análisis de importación de atributos habilitado, se incluyen los lotes de datos transferidos.
Los cargos adicionales por otras operaciones de Agent Platform Feature Store (heredado) usadas con la supervisión del valor de los atributos incluyen los siguientes:
La función de análisis de instantáneas toma una instantánea, de manera periódica, de los valores de las funciones según tu configuración del intervalo de supervisión.
El cargo por la exportación de una instantánea es el mismo que para una operación de exportación en lote.

Ejemplo de análisis de instantáneas

Un científico de datos habilita la supervisión del valor de los atributos para su Agent Platform Feature Store (heredado) y activa la supervisión para el análisis diario de instantáneas. Una canalización se ejecuta a diario para la supervisión de los tipos de entidades. La canalización escanea 2 GB de datos en Agent Platform Feature Store (heredado) y exporta una instantánea que contiene 0.1 GB de datos. El cargo total por un día de análisis es:

(0.1 GB * $3.50) + (2 GB * $0.005) = $0.36

Ejemplo de análisis de transferencia

Un científico de datos habilita la supervisión del valor de los atributos para su Agent Platform Feature Store (heredado) y activa la supervisión para las operaciones de transferencia. Una operación de transferencia importa 1 GB de datos a Agent Platform Feature Store (heredado). El cargo total por la supervisión del valor de los atributos es el siguiente:

(1 GB * $3.50) = $3.50

Vertex ML Metadata

El almacenamiento de metadatos se mide en gigabytes binarios (GiB), y 1 GiB equivale a 1,073,741,824 bytes. Esta unidad de medida también se conoce como gibibyte.

Vertex ML Metadata cobra $10 por gibibyte (GiB) al mes por almacenamiento de metadatos. Los precios están prorrateados por megabyte (MB). Por ejemplo, si almacenas 10 MB de metadatos, se te cobrará $0.10 por mes por los 10 MB de metadatos.

Los precios son los mismos en todas las regiones donde se admite Vertex ML Metadata.

TensorBoard de Agent Platform

Para usar Agent Platform TensorBoard, solicita que el administrador de IAM del proyecto te asigne el rol de “Usuario de la app web de Agent Platform TensorBoard”. El rol de administrador de Agent Platform también tiene acceso.

A partir de agosto de 2023, los precios de TensorBoard de Agent Platform cambiaron de una licencia mensual por usuario de $300 al mes a $10 GiB por mes por el almacenamiento de datos de registros y métricas. Esto significa que ya no hay tarifas de suscripción. Pagarás solo por el almacenamiento que hayas usado. Consulta el instructivo Agent Platform TensorBoard: Borra los experimentos de TensorBoard desactualizados para obtener información para administrar el almacenamiento.

Agent Platform Vizier

Agent Platform Vizier es un servicio de optimización de caja negra de Agent Platform. El modelo de precios de Vizier de la plataforma de agentes consta de los siguientes elementos:

No se aplican cargos por las pruebas que usan RANDOM_SEARCH y GRID_SEARCH. Obtén más información sobre los algoritmos de búsqueda.
Las primeras 100 pruebas de Vizier de Agent Platform al mes calendario están disponibles sin cargo (las pruebas que usan RANDOM_SEARCH y GRID_SEARCH no se toman en cuenta en este total).
Después de 100 pruebas de Vizier de Agent Platform, las pruebas posteriores durante el mismo mes calendario se cobran a $1 por prueba (las que usan RANDOM_SEARCH o GRID_SEARCH no generan cargos).

Recuperación de agentes

Agent Retrieval es un motor de recuperación completamente administrado que unifica la indexación de vectores y el almacenamiento de cargas útiles en un solo servicio. Los precios se basan en dos componentes principales: Index Serving (los recursos de procesamiento aprovisionados para la búsqueda de vecinos más cercanos aproximados o ANN) y la Payload Database (el almacenamiento y las operaciones para tus vectores y documentos).

1. Publicación de índices (ANN)

Las unidades de capacidad de entrega de índices (CUs) se usan exclusivamente para los índices de vecino más cercano aproximado (ANN).

Componente	Precio	Descripción
CU con optimización de almacenamiento	USD 2.30 / 1 hour	Incluye SSD de 1 TB. Diseñado para grandes conjuntos de datos.
CU con optimización de rendimiento	USD 0.065 / 1 hour	Incluye 2 GB de RAM.
Escritura o actualización de datos	USD 0.45 / 1 gibibyte	Se aplica a cualquier actualización de índice (escritura o actualización de datos en el índice ANN), incluida la creación inicial del índice y la sobrescritura completa del índice.

2. Base de datos de cargas útiles (almacenamiento y operaciones)

La base de datos integrada almacena tus datos y también se puede consultar directamente para realizar búsquedas exactas de K-vecino más cercano (KNN).

Componente	Precio	Descripción
Datos almacenados	USD 0.000410959 / 1 gibibyte hour	Costo mensual de almacenamiento para vectores y metadatos.
Operaciones de lectura	USD 0.06 / 100,000 count	Se cobra por las búsquedas y las lecturas directas. (Consulta los detalles del cálculo a continuación).
Operaciones de escritura, actualización y eliminación	USD 0.18 / 100,000 count	Se cobra por la modificación de datos. (1 documento = 1 operación de escritura).

3. Componentes de búsqueda adicionales

Componente	Precio
Modelo de embedding	Se factura por separado según el precio del modelo de embedding seleccionado por el cliente.

Comprende la medición de las operaciones de bases de datos

Las operaciones de base de datos se calculan en función de cómo interactúas con tus datos:

Consultas de búsqueda: Cuando se ejecuta una consulta de búsqueda, la cantidad total de operaciones de lectura se calcula como la suma del costo de análisis de índice más el costo de recuperación de documentos.
Costo del análisis de índice: 1 operación de lectura por cada lote de hasta 100 objetos de datos en el índice.
Costo de recuperación de documentos: 1 operación de lectura por cada documento individual devuelto.
Lecturas directas de documentos: Cuando se leen documentos directamente desde la base de datos, 1 documento = 1 operación de lectura.
Escrituras, actualizaciones y eliminaciones: 1 documento = 1 operación de escritura.

Búsqueda de vectores

El precio del servicio de la búsqueda de vectores vecino más cercano aproximado incluye lo siguiente:

Precios por hora de procesamiento de nodo para cada VM que se usa a fin de alojar un índice implementado
Un costo para crear índices nuevos, actualizar los existentes y usar actualizaciones de índices de transmisión

Los datos procesados durante la creación y actualización de índices se miden en gigabytes binarios (GiB), en los que 1 GiB equivale a 1,073,741,824 bytes. Esta unidad de medida también se conoce como gibibyte.

La búsqueda de vectores cobra $3.00 por gibibyte (GiB) de datos procesados en todas las regiones. La búsqueda de vectores cobra $0.45 por GiB transferido para inserciones de la actualización de transmisión.

En las siguientes tablas se resumen los precios de entrega de índices en cada región donde la búsqueda de vectores está disponible. El precio corresponde al tipo de máquina, por región, y se cobra por hora de procesamiento de nodo.

Tipo de máquina	Precio (USD)
e2-standard-2	USD 0.0938084 / 1 hour
e2-standard-16	USD 0.7504672 / 1 hour
e2-highmem-16	USD 1.012368 / 1 hour
n2d-standard-32	USD 1.8926208 / 1 hour
n1-standard-16	USD 1.0639944 / 1 hour
n1-standard-32	USD 2.1279888 / 1 hour

Ejemplos de precios de búsqueda de vectores

Los precios de la búsqueda de vectores se determinan por el tamaño de tus datos, la cantidad de consultas por segundo (QPS) que quieres ejecutar y la cantidad de nodos que usas. Para obtener el costo de entrega estimado, debes calcular tu tamaño total de datos. Tu tamaño de datos es la cantidad de embeddings o vectores* la cantidad de dimensiones que tienes* 4 bytes por dimensión. Cuando tengas el tamaño de tus datos, puedes calcular el costo de entrega y el costo de creación. El costo de entrega más el costo de creación es tu costo mensual total.

El tamaño del conjunto de datos y las restricciones (filtrado) afectan el recuento de fragmentos. Una gran cantidad de restricciones aumenta el uso de memoria y hace que se creen más fragmentos para distribuir la carga de memoria.

Costo de entrega: cantidad de réplicas o fragmentos * cantidad de fragmentos (~tamaño de los datos o fragmentos) * costo por hora * 730 horas
Costo de creación: tamaño de los datos(en GiB) * $3 por GiB * cantidad de actualizaciones mensuales

Actualización de transmisión: Vector Search usa métricas basadas en heurísticas para determinar cuándo activar la compactación. Si los datos sin compactar más antiguos tienen cinco días de antigüedad, siempre se activa la compactación. Se te factura por el costo de volver a compilar el índice con la misma tarifa de una actualización por lotes, además de los costos de actualización de transmisión.

Cantidad de incorporaciones o vectores	Cantidad de dimensiones	Consultas por segundo (QPS)	Tipo de máquina	Nodos	Costo de entrega mensual estimado (USD)
2 millones	128	100	e2-standard-2	1	$68
20 millones	256	1,000	e2-standard-16	1	$547
20 millones	256	3,000	e2-standard-16	3	$1,642
100 millones	256	500	e2-highmem-16	2	$1,477
1,000 millones	100	500	e2-highmem-16	8	$5,910

Todos los ejemplos están basados en tipos de máquina en us-central1. El costo que incurras variará con la tarifa de recuperación y requisitos de latencia. El costo de entrega mensual estimado se relaciona directamente con la cantidad de nodos usados en la consola. Para obtener más información sobre los parámetros de configuración que afectan los costos, consulta Parámetros de configuración que afectan la recuperación y latencia.

Si tu cantidad de consultas por segundo (QPS) es alta, agruparlas en lote puede reducir los costos totales hasta un 30% o 40%.

Nivel de búsqueda de vectores optimizado para el almacenamiento

En lugar de administrar y pagar por VMs individuales y trabajos de compactación separados, hay dos SKUs:

Unidades de capacidad (CU): Este es el medidor principal para la entrega. Una CU es una unidad combinada de procesamiento y almacenamiento SSD activo, de hasta 1 TiB cada una, con un precio de $2.30 por CU, por hora y por réplica. Esta tarifa única incluye el costo de la entrega y la administración continua del índice. El servicio se ajusta automáticamente y se agregan CU adicionales a medida que crece el tamaño del índice.
Unidades de escritura: Para agregar datos, se cobra $0.45 por GiB. Crear índice y completar la sobrescritura se cobrarían por el tamaño completo del índice. El cargo se aplica a las actualizaciones de índices por lotes y de transmisión.

Unidad	Precio
Unidad de capacidad optimizada para almacenamiento	USD 2.30 / 1 hour
Unidad de escritura	USD 0.45 / 1 gibibyte

Model Registry

Model Registry es un repositorio central que monitorea y enumera tus modelos y versiones de modelos. Puedes importar modelos en Agent Platform y aparecen en Model Registry. No hay un costo relacionado con tener tus modelos en el Model Registry. Solo se generan costos cuando implementas el modelo en un extremo o realizas una predicción por lotes en el modelo. Este costo está determinado por el tipo de modelo que implementas.

Para obtener más información sobre los precios de implementar modelos personalizados desde Model Registry, consulta Modelos entrenados de forma personalizada. Para obtener más información sobre los precios de implementar modelos de AutoML, consulta Precios de modelos de AutoML.

Supervisión de modelos en Agent Platform

Agent Platform te permite supervisar la eficacia continua de tu modelo después de implementarlo en producción. Para obtener más información, consulta Introducción a Model Monitoring en la plataforma de agentes.

Cuando usas Model Monitoring en Agent Platform, se te factura lo siguiente:

$3.50 por GB para todos los datos analizados, incluidos los datos de entrenamiento proporcionados y los datos de predicción registrados en una tabla de BigQuery.
Cargos por otros productos de Google Cloud que usa con Model Monitoring, como el almacenamiento de BigQuery o Batch Explain cuando la supervisión de atribución esté habilitada.

La supervisión de modelos en Agent Platform es compatible con las siguientes regiones: us-central1, europe-west4, asia-east1 y asia-southeast1. Los precios son los mismos en todas las regiones.

Los tamaños de los datos se miden después de que se convierten al formato TfRecord.

Los conjuntos de datos de entrenamiento incurren en un cargo único cuando configuras un trabajo de Model Monitoring en Agent Platform.

Los conjuntos de datos de predicción consisten en registros recopilados del servicio de predicción en línea. A medida que las solicitudes de predicción llegan durante diferentes períodos, se recopilan los datos para cada período y se usa la suma de los datos analizados para cada período de predicción a fin de calcular el cargo.

Ejemplo: Un científico de datos ejecuta la supervisión de modelos en el tráfico de predicción que pertenece a su modelo.

El modelo se entrena a partir de un conjunto de datos de BigQuery. El tamaño de los datos después de convertir a TfRecord es 1.5 GB.
Los datos de predicción registrados entre la 1:00 p.m. y las 2:00 p.m. son 0.1 GB, entre las 3:00 p.m. y las 4:00 p.m. son 0.2 GB.
El precio total para configurar el trabajo de supervisión de modelos es el siguiente:
(1.5 GB * $3.50) + ((0.1 GB + 0.2 GB) * $3.50) = $6.30

Agent Platform Workbench

Selecciona instancias, notebooks administrados o notebooks administrados por el usuario para obtener información sobre los precios.

Instancias

En las siguientes tablas, se indica el precio por hora aproximado de diferentes parámetros de configuración para VMs. Puedes elegir una configuración personalizada de los tipos de máquinas seleccionados. Para calcular los precios, suma los costos de las máquinas virtuales que usas.

Si usas los tipos de máquinas de Compute Engine y les conectas aceleradores, el costo correspondiente se cobra por separado. Para calcularlo, multiplica los precios de la tabla de aceleradores a continuación por la cantidad de cada tipo de acelerador que uses.

CPUs

Tipo de máquina	Precio por CPU virtual (USD)
N1	USD 0.0379332 / 1 hour
N2	USD 0.0379332 / 1 hour
E2	USD 0.026173908 / 1 hour
A2	USD 0.0379332 / 1 hour

Memoria

Tipo de máquina	Precio (USD)
N1	USD 0.0050844 / 1 gibibyte hour
N2	USD 0.0050844 / 1 gibibyte hour
E2	USD 0.003508236 / 1 gibibyte hour
A2	USD 0.0050844 / 1 gibibyte hour

Aceleradores

Tipo de máquina	Precio (USD)
Nvidia Tesla A100	USD 4.400862 / 1 hour
Nvidia Tesla A100 de 80 GB	USD 4.51729 / 1 hour
Nvidia Tesla T4	USD 0.525 / 1 hour
Nvidia Tesla V100	USD 3.72 / 1 hour
Nvidia Tesla P100	USD 2.19 / 1 hour

Discos

Tipo de máquina	Precio (USD)
Espacio aprovisionado de Hyperdisk Extreme	USD 0.000205479 / 1 gibibyte hour
Espacio aprovisionado balanceado	USD 0.000164384 / 1 gibibyte hour
Espacio aprovisionado extremo	USD 0.000205479 / 1 gibibyte hour
Espacio aprovisionado para SSD	USD 0.000279452 / 1 gibibyte hour
Espacio aprovisionado estándar	USD 0.000065753 / 1 gibibyte hour

Tu instancia de Agent Platform Workbench incurre en cargos de la siguiente manera:

En el caso del uso de CPU y aceleradores, se te cobra cuando la instancia está en los siguientes estados:
INICIANDO
APROVISIONAMIENTO
ACTIVO
ACTUALIZACIÓN
REVERTIENDO
RESTAURACIÓN
DETENIENDO
SUSPENDER
En el caso del almacenamiento en disco, se te cobra cuando la instancia está en los siguientes estados:
INICIANDO
APROVISIONAMIENTO
ACTIVO
ACTUALIZACIÓN
REVERTIENDO
RESTAURACIÓN
DETENIENDO
DETENIDO
SUSPENDER
SUSPENDIDO

Notebooks administrados

Los precios están compuestos por los recursos de procesamiento y almacenamiento que uses, las tarifas de administración para tus instancias de Agent Platform Workbench y cualquier recurso adicional de la nube que uses. Consulta las siguientes secciones para obtener más detalles.

Recursos de procesamiento y almacenamiento

Los recursos de procesamiento y almacenamiento se cobran al mismo precio que pagas actualmente por Compute Engine y Cloud Storage.

Tarifas de administración

Hay tarifas de administración de Agent Platform Workbench además de tu uso de la infraestructura, como puedes ver en las tablas a continuación.

SKU	Precio (USD)
vCPU	$0.05 por CPU virtual
T4 y P4 (GPU estándar)	$0.35 por GPU
P100, V100, L4 y A100 GPU (GPU premium)	$2.48 por GPU

Notebooks administrados por el usuario

Los precios están compuestos por los recursos de procesamiento y almacenamiento que uses, las tarifas de administración para tus instancias de Agent Platform Workbench y cualquier recurso adicional de la nube que uses. Consulta las siguientes secciones para obtener más detalles.

Recursos de procesamiento y almacenamiento

Los recursos de procesamiento y almacenamiento se cobran al mismo precio que pagas actualmente por Compute Engine y Cloud Storage.

Tarifas de administración

Hay tarifas de administración de Agent Platform Workbench además de tu uso de la infraestructura, como puedes ver en las tablas a continuación.

SKU	Precio (USD)
vCPU	$0.005 por CPU virtual
T4 y P4 (GPU estándar)	$0.035 por GPU
P100, V100 y A100 GPU (GPU premium)	$0.25 por GPU

Recursos adicionales de Google Cloud

Además de los costos mencionados anteriormente, también pagas por los recursos de Google Cloud que uses. Por ejemplo:

Servicios de análisis de datos: Generas costos de BigQuery cuando envías consultas de SQL en un notebook (consulta Precios de BigQuery).
Claves de encriptación administradas por el cliente: Generas cargos cuando las usas. Cada vez que tus notebooks administrados o la instancia de notebooks administrados por el usuario usan una clave de Cloud Key Management Service, esa operación se factura según la tarifa de las operaciones de clave de Cloud KMS (consulta los Precios de Cloud Key Management Service).

Colab Enterprise

Para obtener información sobre los precios de Colab Enterprise, consulta Precios de Colab Enterprise.

Contenedores de aprendizaje profundo, Deep Learning VM y AI Platform Pipelines

En el caso de los contenedores de aprendizaje profundo, las imágenes de VM de aprendizaje profundo y AI Platform Pipelines, los precios se calculan según los recursos de procesamiento y almacenamiento que uses. Estos recursos se cobran a la misma tarifa que pagas actualmente por Compute Engine y Cloud Storage.

Además de los costos de procesamiento y almacenamiento, también pagas por los recursos de Google Cloud que uses. Por ejemplo:

Servicios de análisis de datos: Generas costos de BigQuery cuando envías consultas de SQL en un notebook (consulta Precios de BigQuery).
Claves de encriptación administradas por el cliente: Generas cargos cuando las usas. Cada vez que tus notebooks administrados o la instancia de notebooks administrados por el usuario usan una clave de Cloud Key Management Service, esa operación se factura según la tarifa de las operaciones de clave de Cloud KMS (consulta los Precios de Cloud Key Management Service).

Etiquetado de datos

Agent Platform te permite solicitar el etiquetado manual de un conjunto de datos que tengas planeado usar para entrenar un modelo de aprendizaje automático personalizado. Los precios del servicio se calculan en función del tipo de tarea de etiquetado.

Para las tareas de etiquetado regulares, los precios se calculan según la cantidad de unidades de anotación.
Para las tareas de clasificación de imágenes, las unidades se calculan según la cantidad de imágenes y de etiquetadores manuales. Por ejemplo, una imagen con 3 etiquetadores manuales se considera como 3 unidades (1 * 3 = 3). El precio de la clasificación con una o varias etiquetas es el mismo.
Para las tareas de cuadro delimitador de imágenes, las unidades se calculan por la cantidad de cuadros delimitadores identificados en las imágenes y la cantidad de etiquetadores manuales. Por ejemplo, una imagen con 2 cuadros delimitadores y 3 etiquetadores manuales se considera como 6 unidades (2 * 3 = 6). Las imágenes sin cuadros de límites no se cobrarán.
En el caso de las tareas de polígono, polilínea, cuadro rotado o segmentación de imágenes, las unidades se calculan de la misma manera que para las tareas de cuadro delimitador de imágenes.
Para las tareas de clasificación de videos, las unidades se calculan según la duración del video (cada fragmento de 5 segundos constituye una unidad de precio) y la cantidad de etiquetadores manuales. Por ejemplo, un video de 25 segundos con 3 etiquetadores humanos se considera como 15 unidades (25 / 5 * 3 = 15). El precio de la clasificación con una o varias etiquetas es el mismo.
Para las tareas de seguimiento de objetos en un video, las unidades se calculan según la cantidad de objetos identificados y la cantidad de etiquetadores manuales. Por ejemplo, un video con 2 objetos y 3 etiquetadores manuales se considerará como 6 unidades (2 * 3 = 6). Los videos sin objetos no se cobran.
Para una tarea de reconocimiento de acciones en video, las unidades se determinan de la misma manera que una tarea de seguimiento de objetos de video.
Para las tareas de clasificación de texto, las unidades se calculan según la longitud del texto (cada fragmento de 50 palabras constituye una unidad de precio) y la cantidad de etiquetadores manuales. Por ejemplo, un fragmento de texto con 100 palabras y 3 etiquetadores manuales se considera como 6 unidades (100 / 50 * 3 = 6). El precio de la clasificación con una o varias etiquetas es el mismo.
En el caso de las tareas de análisis de opiniones en texto, las unidades se calculan de la misma manera que para las tareas de clasificación de texto.
Para las tareas de extracción de entidades en un texto, las unidades se calculan según la longitud del texto (cada fragmento de 50 palabras constituye una unidad de precio), la cantidad de entidades identificadas y la cantidad de etiquetadores manuales. Por ejemplo, un fragmento de texto con 100 palabras, 2 entidades identificadas y 3 etiquetadores manuales se considera como 12 unidades (100 / 50 * 2 * 3 = 12). El texto sin entidades no se cobra.
Para las tareas de análisis de opiniones en texto y clasificación de imágenes, video y texto, los etiquetadores manuales pueden perder de vista las clases si el tamaño del conjunto de etiquetas es demasiado grande. Por ello, enviamos un máximo de 20 clases a los etiquetadores manuales a la vez. Por ejemplo, si el tamaño del conjunto de etiquetas de una tarea de etiquetado es de 40, cada elemento de datos se enviará a revisión humana 2 veces (40 / 20 = 2). En consecuencia, cobraremos 2 veces el precio (según el cálculo anterior).
Para una tarea de etiquetado que habilita la función de etiquetador personalizado, cada elemento de datos se cuenta como 1 unidad de etiquetador personalizado.
En una tarea de etiquetado de aprendizaje activo para los elementos de datos con anotaciones que generan los modelos (sin ayuda del etiquetador), cada elemento de datos se cuenta como 1 unidad de aprendizaje activo.
En una tarea de etiquetado de aprendizaje activo para los elementos de datos con anotaciones que generan los etiquetadores manuales, cada elemento de datos se cuenta como una tarea de etiquetado regular, como se describió anteriormente.

En la siguiente tabla, se muestra el precio por 1,000 unidades por etiquetador manual, según la unidad que se indica para cada objetivo. Los precios del nivel 1 se aplican a las primeras 50,000 unidades por mes en cada proyecto de Google Cloud; los precios del nivel 2 se aplican a las siguientes 950,000 unidades por mes en el proyecto, hasta 1,000,000 de unidades. Comunícate con nosotros para conocer los precios para más de 1,000,000 de unidades por mes.

Tipo de datos	Objetivo	Unidad	Precio del nivel 1 (USD)	Precio de nivel 2 (USD)
Imagen	Clasificación	Imagen	$35	$25
	Cuadro delimitador	Cuadro delimitador	$63	$49
	Segmentación	Para segmentación	$870	$850
	Cuadro rotado	Cuadro delimitador	$86	$60
	Polígono/polilínea	Polígono/polilínea	$257	$180
Video	Clasificación	Video de 5 s	$86	$60
	Seguimiento de objetos	Cuadro delimitador	$86	$60
	Reconocimiento de acciones	Evento en 30 s de video	$214	$150
Texto	Clasificación	50 palabras	$129	$90
	Opinión	50 palabras	$200	$140
	Extracción de entidades	Entidad	$86	$60
Aprendizaje activo	Todos	Elemento de datos	$80	$56
Etiquetador personalizado	Todos	Elemento de datos	$80	$56

Uso obligatorio de Cloud Storage

Además de los costos que se describen en este documento, debes almacenar los datos y los archivos de programa en buckets de Cloud Storage durante el ciclo de vida de Agent Platform. Este almacenamiento está sujeto a la política de precios de Cloud Storage.

El uso obligatorio de Cloud Storage incluye lo siguiente:

Realizar la etapa de pruebas de tu paquete de aplicación de entrenamiento para modelos con entrenamiento personalizado.
Almacenar tus datos de entrada de entrenamiento.
Almacenar el resultado de tus trabajos de entrenamiento. Agent Platform no requiere el almacenamiento a largo plazo de estos elementos. así que puedes quitar los archivos apenas finalice la operación

Operaciones gratuitas para la administración de los recursos

Las operaciones de administración de recursos que proporciona AI Platform están disponibles sin costo. La política de cuotas de AI Platform limita algunas de estas operaciones.

Recurso	Operaciones gratuitas
modelos	create, get, list, delete
versiones	create, get, list, delete, setDefault
trabajos	get, list, cancel
operaciones	get, list, cancel, delete

Costos de Google Cloud

Si almacenas imágenes que se analizarán en Cloud Storage o usas otros recursos de Google Cloud en conjunto con Agent Platform, también se te facturará por el uso de esos servicios.

Para ver el estado actual de tu facturación en la consola de Google Cloud, junto con el uso y la factura actual, consulta la página Facturación. Si quieres obtener más información sobre la administración de tu cuenta, consulta la documentación de la Facturación de Cloud o la asistencia para facturación y pagos.

¿Qué sigue?

Lee la documentación de Agent Platform.
Obtén información sobre las soluciones y los casos de uso de Agent Platform.

Solicita una cotización personalizada

Con los precios de pago por uso de Google Cloud, solo pagas por los servicios que usas. Comunícate con nuestro equipo de Ventas y obtén una cotización personalizada para tu organización.

Precios de Agent Platform

Precios de Agent Platform en comparación con los precios de los productos heredados

Precios de la IA generativa en Agent Platform

Precios para modelos de AutoML

Datos de imagen

Datos tabulares

Previsiones en Agent Platform

AutoML

ARIMA+

Modelos entrenados de forma personalizada

Capacitación

Tipos de máquinas

Aceleradores

Discos

Evaluaciones de IA generativa

Agentes

Agente de Compute

Memory Bank

Política de administración semántica

Sesiones

Registro de habilidades﻿

Ray on Agent Platform

Capacitación

Tipos de máquinas

Aceleradores

Discos

Predicción y explicación

Serie E2

Serie N1

Serie N2

Serie N2D

Serie C2

Serie C2D

Serie C3

Serie C4

Serie A2

Serie A3

Serie A4

Serie A4X

Serie G2

Serie G4

Precios de TPU v5e

Precios de TPU v6e

Serie E2

Serie N1

Serie N2

Serie N2D

Serie C2

Serie C2D

Serie C3

Serie C4

Serie A2

Serie A3

Serie G2

Precio por hora de los aceleradores

Cargos por Vertex Explainable AI

Búsqueda de arquitectura neuronal en la plataforma de agentes

Precios

Tipos de máquinas

Aceleradores

Discos

Uso obligatorio de Cloud Storage

Operaciones gratuitas para la administración de los recursos

Canalizaciones de Agent Platform

Agent Platform Feature Store

Nuevo Agent Platform Feature Store

Agent Platform Feature Store (heredado)

Vertex ML Metadata

TensorBoard de Agent Platform

Agent Platform Vizier

Recuperación de agentes

Búsqueda de vectores

Ejemplos de precios de búsqueda de vectores

Nivel de búsqueda de vectores optimizado para el almacenamiento

Model Registry

Supervisión de modelos en Agent Platform

Agent Platform Workbench

Instancias

CPUs

Memoria

Registro de habilidades