Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
Los costos de Vertex AI siguen siendo los mismos que los de los productos heredados de AI Platform y AutoML que Vertex AI reemplaza, con las siguientes excepciones:
Vertex AI también ofrece más formas de optimizar los costos, como las siguientes:
Para obtener información sobre los precios de IA generativa en Vertex AI, consulta Precios de IA generativa en Vertex AI.
En el caso de los modelos de Vertex AI AutoML, pagas por tres actividades principales:
Vertex AI usa parámetros de configuración predefinidos de máquinas para los modelos de Vertex AutoML y la tarifa por hora de estas actividades refleja el uso de los recursos.
El tiempo necesario para entrenar tu modelo depende del tamaño y la complejidad de tus datos de entrenamiento. Se deben implementar los modelos antes de que puedan proporcionar predicciones o explicaciones en línea.
Pagas por cada modelo implementado en un extremo, incluso si no se hace ninguna predicción. Debes anular la implementación de tu modelo para evitar que se sigan generando cargos. No se cobran los modelos que no se implementaron o que fallaron.
Se paga solo por las horas de procesamiento que uses. Si el entrenamiento falla por cualquier motivo que no sea una cancelación iniciada por el usuario, no se te facturará por ese tiempo. Se te cobra el tiempo del entrenamiento si cancelas la operación.
Selecciona un tipo de modelo a continuación para obtener información sobre los precios.
Datos de imagen
Operación | Precio (clasificación) (USD) | Precio (detección de objetos) (USD) |
|---|---|---|
Entrenamiento | USD 3.465 / 1 hour | USD 3.465 / 1 hour |
Entrenamiento (modelo Edge integrado en el dispositivo) | USD 18.00 / 1 hour | USD 18.00 / 1 hour |
Implementación y predicción en línea | USD 1.375 / 1 hour | USD 2.002 / 1 hour |
Predicción por lotes | USD 2.222 / 1 hour | USD 2.222 / 1 hour |
Datos tabulares
Operación | Precio por hora de procesamiento de nodo para clasificación o regresión | Precio de previsión |
|---|---|---|
Entrenamiento | USD 21.252 / 1 hour | Consulta Previsión de Vertex AI |
Predicción | El mismo precio que las predicciones para modelos entrenados de forma personalizada. Vertex AI realiza predicción por lotes con 40 máquinas n1-highmem-8. | Consulta Previsión de Vertex AI |
Cargos de predicción para Vertex Explainable AI
El procesamiento asociado con Vertex Explainable AI se cobra a la misma tarifa que la predicción. Sin embargo, el procesamiento de las explicaciones demora más que el de las predicciones normales. Por lo tanto, el uso intensivo de las Vertex Explainable AI junto con el ajuste de escala automático podrían traer como resultado el inicio de más nodos, lo que podría aumentar los cargos de predicción.
AutoML
Etapa | Precios |
|---|---|
Predicción | 0 count to 1,000,000 count USD 0.20 / 1,000 count, per 1 month / account 1,000,000 count to 50,000,000 count USD 0.10 / 1,000 count, per 1 month / account 50,000,000 count and above USD 0.02 / 1,000 count, per 1 month / account |
Entrenamiento | USD 21.252 / 1 hour |
Explainable AI | Explicabilidad con los valores de Shapley. Consulta la página de precios de Inferencia y explicación de Vertex AI. |
* Un dato de predicción es un punto de tiempo en el horizonte de previsión. Por ejemplo, con un nivel de detalle diario, un horizonte de 7 días tiene 7 puntos por cada serie temporal.
ARIMA+
Etapa | Precios |
|---|---|
Predicción | USD 5.00 / 1,000 count |
Entrenamiento | $250.00 por TB × cantidad de modelos de candidatos × cantidad de ventanas retrospectivas* |
Explainable AI | La explicabilidad con descomposición de la serie temporal no implica ningún costo adicional. La explicabilidad con los valores de Shapley no es compatible. |
Consulta la página de precios de BigQuery ML para obtener detalles adicionales. Cada trabajo de entrenamiento y predicción incurre en el costo de una ejecución de canalización administrada, como se describe en Precios de Vertex AI.
* Se crea una ventana retrospectiva para cada período en el conjunto de prueba. El AUTO_ARIMA_MAX_ORDER que se usa determina la cantidad de modelos de candidatos. Abarca de 6 a 42 en modelos con series temporales múltiples.
Capacitación
En las siguientes tablas, se indica el precio por hora aproximado de varios parámetros de configuración de entrenamiento. Puedes elegir una configuración personalizada de los tipos de máquinas seleccionados. Para calcular los precios, suma los costos de las máquinas virtuales que usas.
Si usas los tipos de máquinas de Compute Engine y les conectas aceleradores, el costo correspondiente se cobra por separado. Para calcularlo, multiplica los precios de la tabla de aceleradores a continuación por la cantidad de cada tipo de acelerador que uses.
Tipos de máquinas
Puedes usar VMs Spot con el entrenamiento personalizado de Vertex AI. Las VMs Spot se facturan de acuerdo con los precios de las VMs Spot de Compute Engine. Hay tarifas de administración del entrenamiento personalizado de Vertex AI además de tu uso de la infraestructura, como puedes ver en las tablas a continuación.
Puedes usar reservas de Compute Engine con el entrenamiento personalizado de Vertex AI. Cuando usas las reservas de Compute Engine, se te factura según los precios de Compute Engine, incluidos los descuentos por compromiso de uso (CUD) aplicables. Hay tarifas de administración del entrenamiento personalizado de Vertex AI además de tu uso de la infraestructura, como puedes ver en las tablas a continuación.
Tipo de máquina | Precio (USD) |
|---|---|
n1-standard-4 | USD 0.21849885 / 1 hour |
n1-standard-8 | USD 0.4369977 / 1 hour |
n1-standard-16 | USD 0.8739954 / 1 hour |
n1-standard-32 | USD 1.7479908 / 1 hour |
n1-standard-64 | USD 3.4959816 / 1 hour |
n1-standard-96 | USD 5.2439724 / 1 hour |
n1-highmem-2 | USD 0.13604845 / 1 hour |
n1-highmem-4 | USD 0.2720969 / 1 hour |
n1-highmem-8 | USD 0.5441938 / 1 hour |
n1-highmem-16 | USD 1.0883876 / 1 hour |
n1-highmem-32 | USD 2.1767752 / 1 hour |
n1-highmem-64 | USD 4.3535504 / 1 hour |
n1-highmem-96 | USD 6.5303256 / 1 hour |
n1-highcpu-16 | USD 0.65180712 / 1 hour |
n1-highcpu-32 | USD 1.30361424 / 1 hour |
n1-highcpu-64 | USD 2.60722848 / 1 hour |
n1-highcpu-96 | USD 3.91084272 / 1 hour |
a2-highgpu-1g* | USD 4.425248914 / 1 hour |
a2-highgpu-2g* | USD 8.850497829 / 1 hour |
a2-highgpu-4g* | USD 17.700995658 / 1 hour |
a2-highgpu-8g* | USD 35.401991315 / 1 hour |
a2-megagpu-16g* | USD 65.707278915 / 1 hour |
a3-highgpu-8g* | USD 101.007352 / 1 hour |
a3-megagpu-8g* | USD 106.0464232 / 1 hour |
a3-ultragpu-8g* | USD 99.7739296 / 1 hour |
a4-highgpu-8g* | - |
e2-standard-4 | USD 0.154126276 / 1 hour |
e2-standard-8 | USD 0.308252552 / 1 hour |
e2-standard-16 | USD 0.616505104 / 1 hour |
e2-standard-32 | USD 1.233010208 / 1 hour |
e2-highmem-2 | USD 0.103959618 / 1 hour |
e2-highmem-4 | USD 0.207919236 / 1 hour |
e2-highmem-8 | USD 0.415838472 / 1 hour |
e2-highmem-16 | USD 0.831676944 / 1 hour |
e2-highcpu-16 | USD 0.455126224 / 1 hour |
e2-highcpu-32 | USD 0.910252448 / 1 hour |
n2-standard-4 | USD 0.2233714 / 1 hour |
n2-standard-8 | USD 0.4467428 / 1 hour |
n2-standard-16 | USD 0.8934856 / 1 hour |
n2-standard-32 | USD 1.7869712 / 1 hour |
n2-standard-48 | USD 2.6804568 / 1 hour |
n2-standard-64 | USD 3.5739424 / 1 hour |
n2-standard-80 | USD 4.467428 / 1 hour |
n2-highmem-2 | USD 0.1506661 / 1 hour |
n2-highmem-4 | USD 0.3013322 / 1 hour |
n2-highmem-8 | USD 0.6026644 / 1 hour |
n2-highmem-16 | USD 1.2053288 / 1 hour |
n2-highmem-32 | USD 2.4106576 / 1 hour |
n2-highmem-48 | USD 3.6159864 / 1 hour |
n2-highmem-64 | USD 4.8213152 / 1 hour |
n2-highmem-80 | USD 6.026644 / 1 hour |
n2-highcpu-16 | USD 0.6596032 / 1 hour |
n2-highcpu-32 | USD 1.3192064 / 1 hour |
n2-highcpu-48 | USD 1.9788096 / 1 hour |
n2-highcpu-64 | USD 2.6384128 / 1 hour |
n2-highcpu-80 | USD 3.298016 / 1 hour |
c2-standard-4 | USD 0.2401292 / 1 hour |
c2-standard-8 | USD 0.4802584 / 1 hour |
c2-standard-16 | USD 0.9605168 / 1 hour |
c2-standard-30 | USD 1.800969 / 1 hour |
c2-standard-60 | USD 3.601938 / 1 hour |
m1-ultramem-40 | USD 7.237065 / 1 hour |
m1-ultramem-80 | USD 14.47413 / 1 hour |
m1-ultramem-160 | USD 28.94826 / 1 hour |
m1-megamem-96 | USD 12.249984 / 1 hour |
cloud-tpu | Los precios se determinan por el tipo de acelerador. Consulta “Aceleradores”. |
*Este importe incluye el precio de la GPU, ya que este tipo de instancia siempre requiere una cantidad fija de aceleradores de GPU.
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
Aceleradores
Tipo de máquina | Precio (USD) | Tarifa de administración de Vertex |
|---|---|---|
NVIDIA_TESLA_A100 | USD 2.933908 / 1 hour | USD 0.4400862 / 1 hour |
NVIDIA_TESLA_A100_80GB | USD 3.92808 / 1 hour | USD 0.589212 / 1 hour |
NVIDIA_H100_80GB | USD 9.79655057 / 1 hour | USD 1.4694826 / 1 hour |
NVIDIA_H200_141GB | USD 10.708501 / 1 hour | No disponible |
NVIDIA_H100_MEGA_80GB | USD 11.8959171 / 1 hour | No disponible |
NVIDIA_TESLA_L4 | USD 0.644046276 / 1 hour | No disponible |
NVIDIA_TESLA_P4 | USD 0.69 / 1 hour | No disponible |
NVIDIA_TESLA_P100 | USD 1.679 / 1 hour | No disponible |
NVIDIA_TESLA_T4 | USD 0.4025 / 1 hour | No disponible |
NVIDIA_TESLA_V100 | USD 2.852 / 1 hour | No disponible |
TPU_V2 Single (8 núcleos) | USD 5.175 / 1 hour | No disponible |
Pod de TPU_V2 (32 núcleos)* | USD 27.60 / 1 hour | No disponible |
TPU_V3 Single (8 núcleos) | USD 9.20 / 1 hour | No disponible |
Pod de TPU_V3 (32 núcleos)* | USD 36.80 / 1 hour | No disponible |
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* El precio por el entrenamiento con el pod de Cloud TPU se basa en la cantidad de núcleos en el pod. La cantidad de núcleos en un pod siempre es un múltiplo de 32. Para determinar el precio del entrenamiento en un Pod que tiene más de 32 núcleos, multiplica el precio de un Pod de 32 núcleos por la cantidad de núcleos, dividido por 32. Por ejemplo, el precio de un pod de 128 núcleos es (precio del pod de 32 núcleos) * (128/32). Para obtener información sobre cuáles pods de Cloud TPU están disponibles en una región específica, consulta Arquitectura del sistema en la documentación de Cloud TPU.
Discos
Tipo de máquina | Precio (USD) |
|---|---|
pd-standard | USD 0.000063014 / 1 gibibyte hour |
pd-ssd | USD 0.000267808 / 1 gibibyte hour |
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
Se cobra el entrenamiento de tus modelos desde el momento en que los recursos se aprovisionan para un trabajo hasta que el trabajo finaliza.
Advertencia: La política de cuotas de Vertex AI limita tus trabajos de entrenamiento. Si seleccionas un clúster de procesamiento potente para los primeros trabajos de entrenamiento, es probable que superes la cuota.
Niveles de escala para las configuraciones predefinidas (AI Platform Training)
Puedes controlar el tipo de clúster de procesamiento que se usará para entrenar un modelo. La forma más sencilla es seleccionar uno de los parámetros de configuración predeterminados, denominados niveles de escala. Obtén más información acerca de los niveles de escala.
Tipos de máquinas para las configuraciones personalizadas
Si usas Vertex AI o seleccionas PERSONALIZADO como el nivel de escala para AI Platform Training, puedes controlar la cantidad y el tipo de las máquinas virtuales que se usarán para la instancia principal del clúster, el trabajador y los servidores de parámetro. Obtén más información sobre los tipos de máquinas para Vertex AI y los tipos de máquinas para AI Platform Training.
El costo del entrenamiento con un clúster de procesamiento personalizado es la suma de todas las máquinas que especifiques. Se te cobra el tiempo total del trabajo, no el tiempo de procesamiento activo de las máquinas individuales.
En el caso de las métricas basadas en modelos, los cargos se aplican solo a los costos de predicción asociados con el modelo de evaluador automático subyacente. Se facturan en función de los tokens de entrada que proporcionas en tu conjunto de datos de evaluación y la salida del evaluador automático.
Gen AI Evaluation Service tiene disponibilidad general (DG). El cambio de precio entró en vigencia el 14 de abril de 2025.
métrico | Precios |
|---|---|
Por puntos | Modelo de calificación automática predeterminado Gemini 2.0 Flash |
Por pares | Modelo de calificación automática predeterminado Gemini 2.0 Flash |
Las métricas basadas en procesamiento se cobran a $0.00003 por 1,000 caracteres de entrada y $0.00009 por 1,000 caracteres de salida. Se denominan métricas automáticas en SKU.
Nombre de la métrica | Tipo |
|---|---|
Concordancia exacta | Basado en procesamiento |
Bleu | Basado en procesamiento |
Rouge | Basado en procesamiento |
Llamada a la herramienta válida | Basado en procesamiento |
Coincidencia con el nombre de la herramienta | Basado en procesamiento |
Coincidencia de clave de parámetro de la herramienta | Basado en procesamiento |
Coincidencia de KV del parámetro de la herramienta | Basado en procesamiento |
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
Las métricas basadas en modelos heredados se cobran a $0.005 por 1,000 caracteres de entrada y $0.015 por 1,000 caracteres de salida.
Nombre de la métrica | Tipo |
|---|---|
Coherencia | Por puntos |
Fluidez | Por puntos |
Entrega | Por puntos |
Seguridad | Por puntos |
Fundamentación | Por puntos |
Calidad de resumen | Por puntos |
Utilidad de los resúmenes | Por puntos |
Nivel de detalle del resumen | Por puntos |
Calidad de la búsqueda de respuestas | Por puntos |
Relevancia de la búsqueda de respuestas | Por puntos |
Utilidad de la búsqueda de respuestas | Por puntos |
Exactitud de la búsqueda de respuestas | Por puntos |
Calidad de resumen por pares | Por pares |
Calidad de la respuesta a preguntas por pares | Por pares |
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
Los precios se basan en los recursos de procesamiento (horas de CPU virtuales) y memoria (horas de GiB) que usan los agentes implementados en el entorno de ejecución administrado de Agent Engine.
Recurso | Precio (USD) |
|---|---|
vCPU | USD 0.0994 / 1 hour |
RAM | USD 0.0105 / 1 gibibyte hour |
La facturación del entorno de ejecución de Vertex AI Agent Engine se determina por el nivel de región (1 o 2) en el que usas tu servicio. Los precios se basan en los recursos de procesamiento (horas de CPU virtual) y memoria (horas de GiB) que usan los agentes para procesar solicitudes. Además, no se factura el tiempo de inactividad del agente.
Unidad | Precio por unidad del nivel 1 | Precio por unidad del nivel 2 |
|---|---|---|
vCPU | USD 0.0994 / 1 hour | $0.1391 por hora de CPU virtual |
GiB | USD 0.0105 / 1 gibibyte hour | $0.0145 por GiB-hora |
Nivel por región:
Región | Ubicación | Nivel |
|---|---|---|
us-central1 | Iowa | 1 |
us-east4 | Virginia del Norte | 1 |
us-west1 | Oregón | 1 |
europe-west1 | Bélgica | 1 |
europe-west2 | Londres | 2 |
europe-west3 | Fráncfort | 2 |
europe-west4 | Países Bajos | 1 |
europe-southwest1 | Madrid | 1 |
asia-east1 | Taiwán | 1 |
asia-northeast1 | Tokio | 1 |
asia-south1 | Bombay | 1 |
asia-southeast1 | Singapur | 2 |
australia-southeast2 | Melbourne | 2 |
Capacitación
En las siguientes tablas, se indica el precio por hora aproximado de varios parámetros de configuración de entrenamiento. Puedes elegir una configuración personalizada de los tipos de máquinas seleccionados. Para calcular los precios, suma los costos de las máquinas virtuales que usas.
Si usas los tipos de máquinas de Compute Engine y les conectas aceleradores, el costo correspondiente se cobra por separado. Para calcularlo, multiplica los precios de la tabla de aceleradores a continuación por la cantidad de cada tipo de acelerador que uses.
Tipos de máquinas
Tipo de máquina | Precio (USD) |
|---|---|
n1-standard-4 | USD 0.2279988 / 1 hour |
n1-standard-8 | USD 0.4559976 / 1 hour |
n1-standard-16 | USD 0.9119952 / 1 hour |
n1-standard-32 | USD 1.8239904 / 1 hour |
n1-standard-64 | USD 3.6479808 / 1 hour |
n1-standard-96 | USD 5.4719712 / 1 hour |
n1-highmem-2 | USD 0.1419636 / 1 hour |
n1-highmem-4 | USD 0.2839272 / 1 hour |
n1-highmem-8 | USD 0.5678544 / 1 hour |
n1-highmem-16 | USD 1.1357088 / 1 hour |
n1-highmem-32 | USD 2.2714176 / 1 hour |
n1-highmem-64 | USD 4.5428352 / 1 hour |
n1-highmem-96 | USD 6.8142528 / 1 hour |
n1-highcpu-16 | USD 0.68014656 / 1 hour |
n1-highcpu-32 | USD 1.36029312 / 1 hour |
n1-highcpu-64 | USD 2.72058624 / 1 hour |
n1-highcpu-96 | USD 4.08087936 / 1 hour |
a2-highgpu-1g* | USD 4.408062 / 1 hour |
a2-highgpu-2g* | USD 8.816124 / 1 hour |
a2-highgpu-4g* | USD 17.632248 / 1 hour |
a2-highgpu-8g* | USD 35.264496 / 1 hour |
a2-highgpu-16g* | USD 70.528992 / 1 hour |
a3-highgpu-8g* | USD 105.39898088 / 1 hour |
a3-megagpu-8g* | USD 110.65714224 / 1 hour |
a4-highgpu-8g* | USD 148.212 / 1 hour |
e2-standard-4 | USD 0.16082748 / 1 hour |
e2-standard-4 | USD 0.32165496 / 1 hour |
e2-standard-16 | USD 0.64330992 / 1 hour |
e2-standard-32 | USD 1.28661984 / 1 hour |
e2-highmem-2 | USD 0.10847966 / 1 hour |
e2-highmem-4 | USD 0.21695932 / 1 hour |
e2-highmem-8 | USD 0.43391864 / 1 hour |
e2-highmem-16 | USD 0.86783728 / 1 hour |
e2-highcpu-16 | USD 0.4749144 / 1 hour |
e2-highcpu-32 | USD 0.9498288 / 1 hour |
n2-standard-4 | USD 0.2330832 / 1 hour |
n2-standard-8 | USD 0.4661664 / 1 hour |
n2-standard-16 | USD 0.9323328 / 1 hour |
n2-standard-32 | USD 1.8646656 / 1 hour |
n2-standard-48 | USD 2.7969984 / 1 hour |
n2-standard-64 | USD 3.7293312 / 1 hour |
n2-standard-80 | USD 4.661664 / 1 hour |
n2-highmem-2 | USD 0.1572168 / 1 hour |
n2-highmem-4 | USD 0.3144336 / 1 hour |
n2-highmem-8 | USD 0.6288672 / 1 hour |
n2-highmem-16 | USD 1.2577344 / 1 hour |
n2-highmem-32 | USD 2.5154688 / 1 hour |
n2-highmem-48 | USD 3.7732032 / 1 hour |
n2-highmem-64 | USD 5.0309376 / 1 hour |
n2-highmem-80 | USD 6.288672 / 1 hour |
n2-highcpu-16 | USD 0.6882816 / 1 hour |
n2-highcpu-32 | USD 1.3765632 / 1 hour |
n2-highcpu-48 | USD 2.0648448 / 1 hour |
n2-highcpu-64 | USD 2.7531264 / 1 hour |
n2-highcpu-80 | USD 3.441408 / 1 hour |
c2-standard-4 | USD 0.2505696 / 1 hour |
c2-standard-8 | USD 0.5011392 / 1 hour |
c2-standard-16 | USD 1.0022784 / 1 hour |
c2-standard-30 | USD 1.879272 / 1 hour |
c2-standard-60 | USD 3.758544 / 1 hour |
m1-ultramem-40 | USD 7.55172 / 1 hour |
m1-ultramem-80 | USD 15.10344 / 1 hour |
m1-ultramem-160 | USD 30.20688 / 1 hour |
m1-megamem-96 | USD 12.782592 / 1 hour |
cloud-tpu | Los precios se determinan por el tipo de acelerador. Consulta “Aceleradores”. |
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
Aceleradores
Tipo de GPU | Precio (USD) |
|---|---|
NVIDIA_TESLA_A100 | USD 3.5206896 / 1 hour |
NVIDIA_TESLA_A100_80GB | USD 4.517292 / 1 hour |
NVIDIA_H100_80GB | USD 11.75586073 / 1 hour |
NVIDIA_TESLA_P4 | USD 0.72 / 1 hour |
NVIDIA_TESLA_P100 | USD 1.752 / 1 hour |
NVIDIA_TESLA_T4 | USD 0.42 / 1 hour |
NVIDIA_TESLA_V100 | USD 2.976 / 1 hour |
TPU_V2 Single (8 núcleos) | USD 5.40 / 1 hour |
Pod de TPU_V2 (32 núcleos)* | USD 28.80 / 1 hour |
TPU_V3 Single (8 núcleos) | USD 9.60 / 1 hour |
Pod de TPU_V3 (32 núcleos)* | USD 38.40 / 1 hour |
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* El precio por el entrenamiento con el pod de Cloud TPU se basa en la cantidad de núcleos en el pod. La cantidad de núcleos en un pod siempre es un múltiplo de 32. Para determinar el precio del entrenamiento en un Pod que tiene más de 32 núcleos, multiplica el precio de un Pod de 32 núcleos por la cantidad de núcleos, dividido por 32. Por ejemplo, el precio de un pod de 128 núcleos es (precio del pod de 32 núcleos) * (128/32). Para obtener información sobre cuáles pods de Cloud TPU están disponibles en una región específica, consulta Arquitectura del sistema en la documentación de Cloud TPU.
Discos
Tipo de disco | Precio (USD) |
|---|---|
pd-standard | USD 0.000065753 / 1 gibibyte hour |
pd-ssd | USD 0.000279452 / 1 gibibyte hour |
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
Se cobra el entrenamiento de tus modelos desde el momento en que los recursos se aprovisionan para un trabajo hasta que el trabajo finaliza.
Advertencia: La política de cuotas de Vertex AI limita tus trabajos de entrenamiento. Si seleccionas un clúster de procesamiento potente para los primeros trabajos de entrenamiento, es probable que superes la cuota.
Las tablas siguientes proporcionan los precios de la predicción por lotes, la predicción en línea y la explicación en línea por hora de procesamiento de nodo. Una hora de procesamiento de nodo representa el tiempo que una máquina virtual dedica a la ejecución del trabajo de predicción o espera en estado activo (un extremo con uno o más modelos implementados) para administrar solicitudes de predicción o explicación.
Puedes usar VMs Spot con la inferencia de Vertex AI. Las VMs Spot se facturan de acuerdo con los precios de las VMs Spot de Compute Engine. Hay tarifas de administración de la inferencia de Vertex AI además de tu uso de la infraestructura, como puedes ver en las tablas a continuación.
Puedes usar reservas de Compute Engine con la inferencia de Vertex AI. Cuando usas las reservas de Compute Engine, se te factura según los precios de Compute Engine, incluidos los descuentos por compromiso de uso (CUD) aplicables. Hay tarifas de administración de la inferencia de Vertex AI además de tu uso de la infraestructura, como puedes ver en las tablas a continuación.
Serie E2
Tipo de máquina | Precio (USD) |
|---|---|
e2-standard-2 | USD 0.0770564 / 1 hour |
e2-standard-4 | USD 0.1541128 / 1 hour |
e2-standard-8 | USD 0.3082256 / 1 hour |
e2-standard-16 | USD 0.6164512 / 1 hour |
e2-standard-32 | USD 1.2329024 / 1 hour |
e2-highmem-2 | USD 0.1039476 / 1 hour |
e2-highmem-4 | USD 0.2078952 / 1 hour |
e2-highmem-8 | USD 0.4157904 / 1 hour |
e2-highmem-16 | USD 0.8315808 / 1 hour |
e2-highcpu-2 | USD 0.056888 / 1 hour |
e2-highcpu-4 | USD 0.113776 / 1 hour |
e2-highcpu-8 | USD 0.227552 / 1 hour |
e2-highcpu-16 | USD 0.455104 / 1 hour |
e2-highcpu-32 | USD 0.910208 / 1 hour |
Serie N1
Tipo de máquina | Precio (USD) |
|---|---|
n1-standard-2 | USD 0.1095 / 1 hour |
n1-standard-4 | USD 0.219 / 1 hour |
n1-standard-8 | USD 0.438 / 1 hour |
n1-standard-16 | USD 0.876 / 1 hour |
n1-standard-32 | USD 1.752 / 1 hour |
n1-highmem-2 | USD 0.137 / 1 hour |
n1-highmem-4 | USD 0.274 / 1 hour |
n1-highmem-8 | USD 0.548 / 1 hour |
n1-highmem-16 | USD 1.096 / 1 hour |
n1-highcpu-2 | USD 0.081 / 1 hour |
n1-highcpu-4 | USD 0.162 / 1 hour |
n1-highcpu-8 | USD 0.324 / 1 hour |
n1-highcpu-16 | USD 0.648 / 1 hour |
n1-highcpu-32 | USD 1.296 / 1 hour |
Serie N2
Tipo de máquina | Precio (USD) |
|---|---|
n2-standard-2 | USD 0.1116854 / 1 hour |
n2-standard-4 | USD 0.2233708 / 1 hour |
n2-standard-8 | USD 0.4467416 / 1 hour |
n2-standard-16 | USD 0.8934832 / 1 hour |
n2-standard-32 | USD 1.7869664 / 1 hour |
n2-highmem-2 | USD 0.1506654 / 1 hour |
n2-highmem-4 | USD 0.3013308 / 1 hour |
n2-highmem-8 | USD 0.6026616 / 1 hour |
n2-highmem-16 | USD 1.2053232 / 1 hour |
n2-highcpu-2 | USD 0.0824504 / 1 hour |
n2-highcpu-4 | USD 0.1649008 / 1 hour |
n2-highcpu-8 | USD 0.3298016 / 1 hour |
n2-highcpu-16 | USD 0.6596032 / 1 hour |
n2-highcpu-32 | USD 1.3192064 / 1 hour |
Serie N2D
Tipo de máquina | Precio (USD) |
|---|---|
n2d-standard-2 | USD 0.0971658 / 1 hour |
n2d-standard-4 | USD 0.1943316 / 1 hour |
n2d-standard-8 | USD 0.3886632 / 1 hour |
n2d-standard-16 | USD 0.7773264 / 1 hour |
n2d-standard-32 | USD 1.5546528 / 1 hour |
n2d-highmem-2 | USD 0.131077 / 1 hour |
n2d-highmem-4 | USD 0.262154 / 1 hour |
n2d-highmem-8 | USD 0.524308 / 1 hour |
n2d-highmem-16 | USD 1.048616 / 1 hour |
n2d-highcpu-2 | USD 0.0717324 / 1 hour |
n2d-highcpu-4 | USD 0.1434648 / 1 hour |
n2d-highcpu-8 | USD 0.2869296 / 1 hour |
n2d-highcpu-16 | USD 0.5738592 / 1 hour |
n2d-highcpu-32 | USD 1.1477184 / 1 hour |
Serie C2
Tipo de máquina | Precio (USD) |
|---|---|
c2-standard-4 | USD 0.240028 / 1 hour |
c2-standard-8 | USD 0.480056 / 1 hour |
c2-standard-16 | USD 0.960112 / 1 hour |
c2-standard-30 | USD 1.80021 / 1 hour |
c2-standard-60 | USD 3.60042 / 1 hour |
Serie C2D
Tipo de máquina | Precio (USD) |
|---|---|
c2d-standard-2 | USD 0.1044172 / 1 hour |
c2d-standard-4 | USD 0.2088344 / 1 hour |
c2d-standard-8 | USD 0.4176688 / 1 hour |
c2d-standard-16 | USD 0.8353376 / 1 hour |
c2d-standard-32 | USD 1.6706752 / 1 hour |
c2d-standard-56 | USD 2.9236816 / 1 hour |
c2d-standard-112 | USD 5.8473632 / 1 hour |
c2d-highmem-2 | USD 0.1408396 / 1 hour |
c2d-highmem-4 | USD 0.2816792 / 1 hour |
c2d-highmem-8 | USD 0.5633584 / 1 hour |
c2d-highmem-16 | USD 1.1267168 / 1 hour |
c2d-highmem-32 | USD 2.2534336 / 1 hour |
c2d-highmem-56 | USD 3.9435088 / 1 hour |
c2d-highmem-112 | USD 7.8870176 / 1 hour |
c2d-highcpu-2 | USD 0.086206 / 1 hour |
c2d-highcpu-4 | USD 0.172412 / 1 hour |
c2d-highcpu-8 | USD 0.344824 / 1 hour |
c2d-highcpu-16 | USD 0.689648 / 1 hour |
c2d-highcpu-32 | USD 1.379296 / 1 hour |
c2d-highcpu-56 | USD 2.413768 / 1 hour |
c2d-highcpu-112 | USD 4.827536 / 1 hour |
Serie C3
Tipo de máquina | Precio (USD) |
|---|---|
c3-highcpu-4 | USD 0.19824 / 1 hour |
c3-highcpu-8 | USD 0.39648 / 1 hour |
c3-highcpu-22 | USD 1.09032 / 1 hour |
c3-highcpu-44 | USD 2.18064 / 1 hour |
c3-highcpu-88 | USD 4.36128 / 1 hour |
c3-highcpu-176 | USD 8.72256 / 1 hour |
Serie A2
Tipo de máquina | Precio (USD) |
|---|---|
a2-highgpu-1g | USD 4.2244949 / 1 hour |
a2-highgpu-2g | USD 8.4489898 / 1 hour |
a2-highgpu-4g | USD 16.8979796 / 1 hour |
a2-highgpu-8g | USD 33.7959592 / 1 hour |
a2-megagpu-16g | USD 64.1020592 / 1 hour |
a2-ultragpu-1g | USD 5.7818474 / 1 hour |
a2-ultragpu-2g | USD 11.5636948 / 1 hour |
a2-ultragpu-4g | USD 23.1273896 / 1 hour |
a2-ultragpu-8g | USD 46.2547792 / 1 hour |
Cuando se consume de una reserva o capacidad de instancia interrumpible, la facturación se distribuye en dos SKUs: el SKU de GCE con la etiqueta “vertex-ai-online-prediction” y el SKU de tarifa de administración de Vertex AI. Esto te permite usar tus descuentos por uso comprometido (CUD) en Vertex AI.
Serie A3
Tipo de máquina | Precio (USD) |
|---|---|
a3-ultragpu-8g | USD 96.015616 / 1 hour |
a3-megagpu-8g | USD 106.65474 / 1 hour |
Cuando se consume de una reserva o capacidad de instancia interrumpible, la facturación se distribuye en dos SKUs: el SKU de GCE con la etiqueta “vertex-ai-online-prediction” y el SKU de tarifa de administración de Vertex AI. Esto te permite usar tus descuentos por uso comprometido (CUD) en Vertex AI.
Serie A4
Tipo de máquina | Precio (USD) |
|---|---|
a4-highgpu-8g | USD 148.212 / 1 hour |
Cuando se consume de una reserva o capacidad de instancia interrumpible, la facturación se distribuye en dos SKUs: el SKU de GCE con la etiqueta “vertex-ai-online-prediction” y el SKU de tarifa de administración de Vertex AI. Esto te permite usar tus descuentos por uso comprometido (CUD) en Vertex AI.
Serie A4X
Tipo de máquina | Precio (USD) |
|---|---|
a4x-highgpu-4g | USD 74.75 / 1 hour |
Cuando se consume de una reserva o capacidad de instancia interrumpible, la facturación se distribuye en dos SKUs: el SKU de GCE con la etiqueta “vertex-ai-online-prediction” y el SKU de tarifa de administración de Vertex AI. Esto te permite usar tus descuentos por uso comprometido (CUD) en Vertex AI.
a4x-highgpu-4g requiere al menos 18 VMs.
Serie G2
Tipo de máquina | Precio (USD) |
|---|---|
g2-standard-4 | USD 0.81293 / 1 hour |
g2-standard-8 | USD 0.98181 / 1 hour |
g2-standard-12 | USD 1.15069 / 1 hour |
g2-standard-16 | USD 1.31957 / 1 hour |
g2-standard-24 | USD 2.30138 / 1 hour |
g2-standard-32 | USD 1.99509 / 1 hour |
g2-standard-48 | USD 4.60276 / 1 hour |
g2-standard-96 | USD 9.20552 / 1 hour |
Cuando se consume de una reserva o capacidad de instancia interrumpible, la facturación se distribuye en dos SKUs: el SKU de GCE con la etiqueta “vertex-ai-online-prediction” y el SKU de tarifa de administración de Vertex AI. Esto te permite usar tus descuentos por uso comprometido (CUD) en Vertex AI.
Precios de TPU v5e
Tipo de máquina | Precio (USD) |
|---|---|
ct5lp-hightpu-1t | USD 1.38 / 1 hour |
ct5lp-hightpu-4t | USD 5.52 / 1 hour |
ct5lp-hightpu-8t | USD 5.52 / 1 hour |
Cada tipo de máquina se cobra como los siguientes SKU en tu factura de Google Cloud:
Los precios de los tipos de máquinas son usados para aproximar el costo total por hora para cada nodo de predicción de una versión del modelo que usa ese tipo de máquina.
Por ejemplo, un tipo de máquina de n1-highcpu-32 incluye 32 CPU virtuales y 32 GB de RAM. Por lo tanto, el precio por hora es igual a 32 horas de CPU virtual + 32 horas de GB.
Serie E2
Elemento | Precio (USD) |
|---|---|
vCPU | USD 0.0250826 / 1 hour |
RAM | USD 0.0033614 / 1 gibibyte hour |
Serie N1
Elemento | Precio (USD) |
|---|---|
vCPU | USD 0.036 / 1 hour |
RAM | USD 0.005 / 1 gibibyte hour |
Serie N2
Elemento | Precio (USD) |
|---|---|
vCPU | USD 0.0363527 / 1 hour |
RAM | USD 0.0048725 / 1 gibibyte hour |
Serie N2D
Elemento | Precio (USD) |
|---|---|
vCPU | USD 0.0316273 / 1 hour |
RAM | USD 0.0042389 / 1 gibibyte hour |
Serie C2
Elemento | Precio (USD) |
|---|---|
vCPU | USD 0.039077 / 1 hour |
RAM | USD 0.0052325 / 1 gibibyte hour |
Serie C2D
Elemento | Precio (USD) |
|---|---|
vCPU | USD 0.0339974 / 1 hour |
RAM | USD 0.0045528 / 1 gibibyte hour |
Serie C3
Elemento | Precio (USD) |
|---|---|
vCPU | USD 0.03908 / 1 hour |
RAM | USD 0.00524 / 1 gibibyte hour |
Serie A2
Elemento | Precio (USD) |
|---|---|
vCPU | USD 0.0363527 / 1 hour |
RAM | USD 0.0048725 / 1 gibibyte hour |
GPU (A100 de 40 GB) | USD 3.3741 / 1 hour |
GPU (A100 de 80 GB) | USD 4.51729 / 1 hour |
Serie A3
Elemento | Precio (USD) |
|---|---|
vCPU | USD 0.0293227 / 1 hour |
RAM | USD 0.0025534 / 1 gibibyte hour |
GPU (H100 de 80 GB) | USD 11.2660332 / 1 hour |
GPU (H200) | USD 10.708501 / 1 hour |
Serie G2
Elemento | Precio (USD) |
|---|---|
vCPU | USD 0.02874 / 1 hour |
RAM | USD 0.00337 / 1 gibibyte hour |
GPU (L4) | USD 0.64405 / 1 hour |
Algunos tipos de máquina te permiten agregar aceleradores opcionales de GPU para predicciones. Las GPU opcionales incurren en un cargo adicional, separado de los descritos en la tabla anterior. Consulta cada tabla de precios, que describen los precios de cada tipo de GPU opcional.
Precio por hora de los aceleradores
Tipo de GPU | Precio (USD) |
|---|---|
NVIDIA_TESLA_P4 | USD 0.69 / 1 hour |
NVIDIA_TESLA_P100 | USD 1.679 / 1 hour |
NVIDIA_TESLA_T4 | USD 0.402 / 1 hour |
NVIDIA_TESLA_V100 | USD 2.852 / 1 hour |
El precio es por GPU. Si usas varias GPUs por nodo de predicción (o si tu versión se ajusta para usar varios nodos),los costos se ajustan en consecuencia.
AI Platform Prediction te permite realizar predicciones de tu modelo ejecutando varias máquinas virtuales (“nodos”). De forma predeterminada, Vertex AI escala automáticamente la cantidad de nodos que se ejecutan a la vez. En el caso de la predicción en línea, se escala la cantidad de nodos para satisfacer la demanda. Cada nodo puede responder a varias solicitudes de predicción. En el caso de la predicción por lotes, se escala la cantidad de nodos a fin de reducir el tiempo total que se necesita para ejecutar un trabajo. Puedes personalizar la escala de los nodos de predicción.
Se cobra el tiempo que se ejecuta cada nodo en tu modelo, incluido lo siguiente:
El costo de ejecución de un nodo por una hora es una hora de procesamiento de nodo. En la tabla de precios de predicción, se describe el precio de una hora de procesamiento de nodo, que varía según la región y si se trata de predicción en línea o por lotes.
Puedes consumir horas de procesamiento de nodo en incrementos fraccionarios. Por ejemplo, ejecutar un nodo durante 30 minutos cuesta 0.5 horas de procesamiento de nodo.
Cálculos de costos para los tipos de máquinas de Compute Engine (N1)
Más información sobre el ajuste de escala automático de los nodos de predicción
Predicción en línea | Predicción por lotes |
|---|---|
La prioridad del escalamiento es reducir la latencia de las solicitudes individuales. El servicio mantiene el modelo preparado durante unos minutos de inactividad después de inspeccionar una solicitud. | La prioridad del escalamiento es reducir el tiempo transcurrido total del trabajo. |
El escalamiento afecta los costos totales cada mes: cuanto más numerosas y frecuentes sean las solicitudes, más nodos se usarán. | El escalamiento no debería afectar mucho el precio del trabajo, aunque se pueden generar sobrecargas si se agrega un nuevo nodo. |
Puedes elegir dejar que el servicio escale como respuesta al tráfico (ajuste de escala automático) o puedes especificar una cantidad de nodos para que se ejecuten constantemente y evitar así la latencia (escalamiento manual).
| Puedes modificar el escalamiento configurando una cantidad máxima de nodos que se usará en un trabajo de predicción por lotes y la cantidad de nodos que deben seguir ejecutándose para un modelo cuando lo implementas. |
Los trabajos de predicción por lotes se cobran después de que se completa el trabajo
Los trabajos de predicción por lotes se cobran después de que se completan los trabajos, no de manera incremental durante el trabajo. Las alertas de presupuesto de Facturación de Cloud que configuraste no se activan mientras se ejecuta un trabajo. Antes de comenzar un trabajo grande, considera ejecutar algunos trabajos comparativos de costos con datos de entrada pequeños.
Ejemplo de un cálculo de predicción
Una empresa inmobiliaria de una región de América ejecuta una predicción semanal del valor de las viviendas en las áreas en las que trabaja. En un mes, ejecuta predicciones para cuatro semanas en lotes de 3920, 4277, 3849 y 3961. Los trabajos se limitan a un nodo y cada instancia demora un promedio de procesamiento de 0.72 segundos.
Primero, calcula la cantidad de tiempo de ejecución de cada trabajo:
Dado que cada trabajo se ejecutó durante más de diez minutos, se cobra por cada minuto de procesamiento:
El cargo total del mes es de $0.26.
En este ejemplo, hicimos la suposición de que los trabajos se ejecutaron en un único nodo y requirieron una cantidad de tiempo uniforme por cada instancia de entrada. En los cálculos de uso real, asegúrate de tener en cuenta el uso de varios nodos y el tiempo real de ejecución de cada nodo.
Cargos por Vertex Explainable AI
Explicaciones basadas en atributos
Las explicaciones basadas en atributos no tienen cargo adicional a los precios de predicción. Sin embargo, el procesamiento de las explicaciones demora más que el de las predicciones normales. Por lo tanto, el uso intensivo de las Vertex Explainable AI junto con el ajuste de escala automático podrían traer como resultado el inicio de más nodos, lo que podría aumentar los cargos de predicción.
Explicaciones basadas en ejemplos
Los precios de las explicaciones basadas en ejemplos consisten en lo siguiente:
En las siguientes tablas, se resumen los precios de cada región en la que está disponible Neural Architecture Search.
Precios
En las siguientes tablas, se indica el precio por hora de diversos parámetros de configuración.
Puedes elegir un nivel de escala predefinido o una configuración personalizada de tipos de máquinas seleccionados. Si eliges una configuración personalizada, suma los costos de las máquinas virtuales utilizadas.
Los precios de los tipos de máquinas heredadas con acelerador incluyen el costo de los aceleradores. Si usas los tipos de máquinas de Compute Engine y les conectas aceleradores, el costo correspondiente se cobra por separado. Para calcular este costo, multiplica los precios de la siguiente tabla de aceleradores por la cantidad de cada tipo de acelerador que uses.
Tipos de máquinas
Tipo de máquina | Precio (USD) |
|---|---|
n1-standard-4 | USD 0.2849985 / 1 hour |
n1-standard-8 | USD 0.569997 / 1 hour |
n1-standard-16 | USD 1.139994 / 1 hour |
n1-standard-32 | USD 2.279988 / 1 hour |
n1-standard-64 | USD 4.559976 / 1 hour |
n1-standard-96 | USD 6.839964 / 1 hour |
n1-highmem-2 | USD 0.1774545 / 1 hour |
n1-highmem-4 | USD 0.1774545 / 1 hour |
n1-highmem-8 | USD 0.709818 / 1 hour |
n1-highmem-16 | USD 1.419636 / 1 hour |
n1-highmem-32 | USD 2.839272 / 1 hour |
n1-highmem-64 | USD 5.678544 / 1 hour |
n1-highmem-96 | USD 8.517816 / 1 hour |
n1-highcpu-16 | USD 0.8501832 / 1 hour |
n1-highcpu-32 | USD 1.7003664 / 1 hour |
n1-highcpu-64 | USD 3.4007328 / 1 hour |
n1-highcpu-96 | USD 5.1010992 / 1 hour |
a2-highgpu-1g | USD 5.641070651 / 1 hour |
a2-highgpu-2g | USD 11.282141301 / 1 hour |
a2-highgpu-4g | USD 22.564282603 / 1 hour |
a2-highgpu-8g | USD 45.128565205 / 1 hour |
a2-highgpu-16g | USD 90.257130411 / 1 hour |
e2-standard-4 | USD 0.20103426 / 1 hour |
e2-standard-8 | USD 0.40206852 / 1 hour |
e2-standard-16 | USD 0.80413704 / 1 hour |
e2-standard-32 | USD 1.60827408 / 1 hour |
e2-highmem-2 | USD 0.13559949 / 1 hour |
e2-highmem-4 | USD 0.27119898 / 1 hour |
e2-highmem-8 | USD 0.54239796 / 1 hour |
e2-highmem-16 | USD 1.08479592 / 1 hour |
e2-highcpu-16 | USD 0.59364288 / 1 hour |
e2-highcpu-32 | USD 1.18728576 / 1 hour |
n2-standard-4 | USD 0.291354 / 1 hour |
n2-standard-8 | USD 0.582708 / 1 hour |
n2-standard-16 | USD 1.165416 / 1 hour |
n2-standard-32 | USD 2.330832 / 1 hour |
n2-standard-48 | USD 3.496248 / 1 hour |
n2-standard-64 | USD 4.661664 / 1 hour |
n2-standard-80 | USD 5.82708 / 1 hour |
n2-highmem-2 | USD 0.196521 / 1 hour |
n2-highmem-4 | USD 0.393042 / 1 hour |
n2-highmem-8 | USD 0.786084 / 1 hour |
n2-highmem-16 | USD 1.572168 / 1 hour |
n2-highmem-32 | USD 3.144336 / 1 hour |
n2-highmem-48 | USD 4.716504 / 1 hour |
n2-highmem-64 | USD 6.288672 / 1 hour |
n2-highmem-80 | USD 7.86084 / 1 hour |
n2-highcpu-16 | USD 0.860352 / 1 hour |
n2-highcpu-32 | USD 1.720704 / 1 hour |
n2-highcpu-64 | USD 3.441408 / 1 hour |
n2-highcpu-80 | USD 4.30176 / 1 hour |
c2-standard-4 | USD 0.313212 / 1 hour |
c2-standard-8 | USD 0.626424 / 1 hour |
c2-standard-16 | USD 1.252848 / 1 hour |
c2-standard-30 | USD 2.34909 / 1 hour |
c2-standard-60 | USD 4.69818 / 1 hour |
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
Los precios de instancias de a2-highgpu incluyen los cargos por los aceleradores NVIDIA_TESLA_A100 adjuntos.
Aceleradores
Tipo de GPU | Precio (USD) |
|---|---|
NVIDIA_TESLA_A100 | USD 4.400862 / 1 hour |
NVIDIA_TESLA_P4 | USD 0.90 / 1 hour |
NVIDIA_TESLA_P100 | USD 2.19 / 1 hour |
NVIDIA_TESLA_T4 | USD 0.525 / 1 hour |
NVIDIA_TESLA_V100 | USD 3.72 / 1 hour |
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
Discos
Tipo de disco | Precio (USD) |
|---|---|
pd-standard | USD 0.000082192 / 1 gibibyte hour |
pd-ssd | USD 0.000349315 / 1 gibibyte hour |
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
Notas:
Uso obligatorio de Cloud Storage
Además de los costos que se describen en este documento, debes almacenar los datos y archivos del programa en buckets de Cloud Storage durante el ciclo de vida de Neural Architecture Search. Este almacenamiento está sujeto a la política de precios de Cloud Storage.
El uso obligatorio de Cloud Storage incluye lo siguiente:
Nota: Puedes usar otro servicio de Google Cloud para almacenar los datos de entrada, como BigQuery, que tiene sus propios precios asociados.
Operaciones gratuitas para la administración de los recursos
Las operaciones de administración de recursos de Neural Architecture Search son sin costo adicional. Sin embargo, puede que algunas de estas operaciones se vean limitadas por la política de cuotas de Neural Architecture Search.
Recurso | Operaciones gratuitas |
|---|---|
trabajos | get, list, cancel |
operaciones | get, list, cancel, delete |
Las canalizaciones de Vertex AI cobran una tarifa de ejecución de $0.03 por cada ejecución de canalización. No se te cobrará la tarifa de ejecución durante la versión preliminar. También pagas por los recursos de Google Cloud que usas con las Vertex AI Pipelines, como los recursos de Compute Engine que consumen los componentes de canalización (se cobran con la misma tarifa que la de entrenamiento de Vertex AI). Por último, eres responsable del costo de cualquier servicio (como Dataflow) que llame tu canalización.
Vertex AI Feature Store cuenta con disponibilidad general (DG) desde noviembre de 2023. Para obtener información sobre las versiones previas de los productos, consulta Vertex AI Feature Store (heredada).
Nuevo Vertex AI Feature Store
El nuevo Vertex AI Feature Store asiste la funcionalidad en dos tipos de operaciones:
Precios de las operaciones sin conexión
Ya que BigQuery se usa para las operaciones sin conexión, consulta los precios de BigQuery para funcionalidades como la transferencia al almacén sin conexión, búsquedas en el almacén sin conexión y el almacenamiento sin conexión.
Precios de las operaciones en línea
Para las operaciones en línea, Vertex AI Feature Store cobra por todas las funciones de DG para transferir datos al almacén en línea, entregar datos o almacenar datos. Un nodo-hora representa el tiempo que gasta una máquina virtual en completar una operación, que se cobra por minuto.
Operación | Precio (USD) |
|---|---|
Nodo de procesamiento de datos Procesamiento de datos (p.ej., transferencia a cualquier almacenamiento, supervisión, etcétera) | USD 0.08 / 1 hour |
Nodo de entrega en línea optimizada Entrega de latencia baja y entrega de embeddings Cada nodo incluye 200 GB de almacenamiento | USD 0.30 / 1 hour |
Nodo de entrega en línea de Bigtable Entrega con Cloud Bigtable | USD 0.94 / 1 hour |
Almacenamiento de entrega en línea de Bigtable Almacenamiento para la entrega con Cloud Bigtable | USD 0.000342466 / 1 gibibyte hour |
La entrega en línea optimizada y la entrega en línea de Bigtable usan arquitecturas diferentes, por lo tanto, sus nodos no son comparables.
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
Estimados de la carga de trabajo de las operaciones en línea
Ten en cuenta los siguientes lineamientos cuando estimes tus cargas de trabajo. La cantidad de nodos necesarios para una carga de trabajo pueden variar en cada método de entrega.
Puedes ver la cantidad de nodos (con réplicas) en el Explorador de métricas:

Ejemplo de casos mensuales (suponiendo que la región es us-central1)
Carga de trabajo de transmisión de datos: Entrega en línea de Bigtable con 2.5 TB de datos (1 GB actualizado a diario) y 1,200 QPS
Operaciones | Uso mensual | Costo mensual |
|---|---|---|
Nodo de procesamiento de datos | (1 GB por día) × (30 días por mes) × (1,000 MB por GB) × (1 nodo-hora por 100 MB) = 300 nodo-hora | 300 nodo-hora × ($0.08 por nodo-hora) = $24 |
Nodo de entrega en línea optimizada | N/A | N/A |
Nodo de entrega en línea de Bigtable | (1 nodo) * (24 horas por día) * (30 días por mes) = 720 nodo-hora | 720 nodo-hora * ($0.94 por nodo-hora) = $677 |
Almacenamiento de entrega en línea de Bigtable | (2.5 TB por mes) * (1000 GB por TB) = 2500 GB por mes | 2500 GB por mes * ($0.25 por mes de GB) = $625 |
Total | $1,326 |
Carga de trabajo de QPS alta: Entrega en línea optimizada con 10 GB de datos sin embeddings (5 GB actualizados a diario) y 2,000 QPS
Operaciones | Uso mensual | Costo mensual |
|---|---|---|
Nodo de procesamiento de datos | (5 GB por día) * (30 días por mes) * (1,000 MB por GB) * (1 nodo-hora por 100 MB) = 1,500 nodo-hora | 1,500 nodo-hora * ($0.08 por nodo-hora) = $120 |
Nodo de entrega en línea optimizada | Redondeo(10 GB * (1 nodo / 200 GB)) = 1 * máx.(2 réplicas predeterminadas, 2,000 QPS * (1 réplica / 500 QPS)) = 4 nodos totales * (24 h por día) * (30 días por mes) =2,880 nodo-hora | 2,880 nodo-hora * ($0.30 por nodo-hora) = $864 |
Nodo de entrega en línea de Bigtable | N/A | N/A |
Almacenamiento de entrega en línea de Bigtable | N/A | N/A |
Total | $984 |
Carga de trabajo de entrega de embeddings: Entrega en línea optimizada con 20 GB de datos de embeddings (2 GB actualizados a diario) y 800 QPS
Operaciones | Uso mensual | Costo mensual |
|---|---|---|
Nodo de procesamiento de datos | (2 GB por día) * (30 días por mes) * (1,000 MB por GB) * (1 nodo-hora por 100 MB) = 600 nodo-hora | 600 nodo-hora * ($0.08 por nodo-hora) = $48 |
Nodo de entrega en línea optimizada | Redondeo(20 GB* (1 nodo / 4 GB) = 5 * máx.(2 réplicas predeterminadas, 800 QPS * (1 réplica / 500 QPS)) = 10 nodos totales * (24 h/día) * (30 días/mes) = 7,200 nodo-hora | 7,200 nodo-hora * ($0.30 por nodo-hora) = $2,160 |
Nodo de entrega en línea de Bigtable | N/A | N/A |
Almacenamiento de entrega en línea de Bigtable | N/A | N/A |
Total | USD 2,208 |
Vertex AI Feature Store (heredado)
Los precios de Vertex AI Feature Store (heredado) se basan en la cantidad de datos de atributos en el almacenamiento en línea y sin conexión, así como en la disponibilidad de la entrega en línea. Un nodo por hora representa el tiempo que una máquina virtual dedica a entregar datos de atributos o el que tiempo que espera en un estado listo para manejar las solicitudes de datos de atributos.
Operación | Precio (USD) |
|---|---|
Almacenamiento en línea | $0.25 por GB por mes |
Almacenamiento sin conexión | $0.023 por GB por mes |
Entrega en línea | $0.94 por nodo por hora |
Exportación por lotes | $0.005 por GB |
Transferencia de transmisión | $0.10 por GB de transferencia |
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
Cuando habilitas la supervisión del valor de los atributos, la facturación incluye los cargos correspondientes mencionados anteriormente, además de los cargos correspondientes a continuación:
Ejemplo de análisis de instantáneas
Un científico de datos habilita la supervisión del valor de los atributos para su Vertex AI Feature Store (heredado) y activa la supervisión para el análisis diario de instantáneas. Una canalización se ejecuta a diario para la supervisión de los tipos de entidades. La canalización escanea 2 GB de datos en Vertex AI Feature Store (heredado) y exporta una instantánea que contiene 0.1 GB de datos. El cargo total por un día de análisis es:
(0.1 GB * $3.50) + (2 GB * $0.005) = $0.36
Ejemplo de análisis de transferencia
Un científico de datos habilita la supervisión del valor de los atributos para su Vertex AI Feature Store (heredado) y activa la supervisión para las operaciones de transferencia. Una operación de transferencia importa 1 GB de datos a Vertex AI Feature Store (heredado). El cargo total por la supervisión del valor de los atributos es el siguiente:
(1 GB * $3.50) = $3.50
El almacenamiento de metadatos se mide en gigabytes binarios (GiB), y 1 GiB equivale a 1,073,741,824 bytes. Esta unidad de medida también se conoce como gibibyte.
Vertex ML Metadata cobra $10 por gibibyte (GiB) al mes por almacenamiento de metadatos. Los precios están prorrateados por megabyte (MB). Por ejemplo, si almacenas 10 MB de metadatos, se te cobrará $0.10 por mes por los 10 MB de metadatos.
Los precios son los mismos en todas las regiones donde se admite Vertex ML Metadata.
Para usar el TensorBoard de Vertex AI, solicita que el administrador de IAM del proyecto te asigne el rol de “usuario de la aplicación web de TensorBoard de Vertex AI”. El rol de administrador de Vertex AI también tiene acceso.
A partir de agosto de 2023, los precios de Vertex AI TensorBoard cambiaron de una licencia mensual por usuario de $300 al mes a $10 GiB por mes por el almacenamiento de datos de registros y métricas. Esto significa que ya no hay tarifas de suscripción. Pagarás solo por el almacenamiento que hayas usado. Consulta el instructivo Vertex AI TensorBoard: Borra los experimentos de TensorBoard desactualizados para obtener información sobre cómo administrar el almacenamiento.
Vertex AI Vizier es un servicio de optimización de caja negra de Vertex AI. El modelo de precios Vertex AI Vizier consta de los siguientes elementos:
El precio del servicio de la búsqueda de vectores vecino más cercano aproximado incluye lo siguiente:
Los datos procesados durante la creación y actualización de índices se miden en gigabytes binarios (GiB), en los que 1 GiB equivale a 1,073,741,824 bytes. Esta unidad de medida también se conoce como gibibyte.
La búsqueda de vectores cobra $3.00 por gibibyte (GiB) de datos procesados en todas las regiones. La búsqueda de vectores cobra $0.45 por GiB transferido para inserciones de la actualización de transmisión.
En las siguientes tablas se resumen los precios de entrega de índices en cada región donde la búsqueda de vectores está disponible. El precio corresponde al tipo de máquina, por región, y se cobra por hora de procesamiento de nodo.
Tipo de máquina | Precio (USD) |
|---|---|
e2-standard-2 | USD 0.0938084 / 1 hour |
e2-standard-16 | USD 0.7504672 / 1 hour |
e2-highmem-16 | USD 1.012368 / 1 hour |
n2d-standard-32 | USD 1.8926208 / 1 hour |
n1-standard-16 | USD 1.0639944 / 1 hour |
n1-standard-32 | USD 2.1279888 / 1 hour |
Ejemplos de precios de búsqueda de vectores
Los precios de la búsqueda de vectores se determinan por el tamaño de tus datos, la cantidad de consultas por segundo (QPS) que quieres ejecutar y la cantidad de nodos que usas. Para obtener el costo de entrega estimado, debes calcular tu tamaño total de datos. Tu tamaño de datos es la cantidad de embeddings o vectores* la cantidad de dimensiones que tienes* 4 bytes por dimensión. Cuando tengas el tamaño de tus datos, puedes calcular el costo de entrega y el costo de creación. El costo de entrega más el costo de creación es tu costo mensual total.
Actualización de transmisión: Vector Search usa métricas basadas en heurística para determinar cuándo activar la compactación. Si los datos sin compactar más antiguos tienen cinco días de antigüedad, siempre se activa la compactación. Se te factura por el costo de volver a compilar el índice con la misma tarifa de una actualización por lotes, además de los costos de actualización de transmisión.
Cantidad de incorporaciones o vectores | Cantidad de dimensiones | Consultas por segundo (QPS) | Tipo de máquina | Nodos | Costo de entrega mensual estimado (USD) |
|---|---|---|---|---|---|
2 millones | 128 | 100 | e2-standard-2 | 1 | $68 |
20 millones | 256 | 1,000 | e2-standard-16 | 1 | $547 |
20 millones | 256 | 3,000 | e2-standard-16 | 3 | $1,642 |
100 millones | 256 | 500 | e2-highmem-16 | 2 | $1,477 |
1,000 millones | 100 | 500 | e2-highmem-16 | 8 | $5,910 |
Todos los ejemplos están basados en tipos de máquina en us-central1. El costo que incurras variará con la tarifa de recuperación y requisitos de latencia. El costo de entrega mensual estimado se relaciona directamente con la cantidad de nodos usados en la consola. Para obtener más información sobre los parámetros de configuración que afectan los costos, consulta Parámetros de configuración que afectan la recuperación y latencia.
Si tu cantidad de consultas por segundo (QPS) es alta, agruparlas en lote puede reducir los costos totales hasta un 30% o 40%.
Nivel de búsqueda de vectores optimizado para el almacenamiento
En lugar de administrar y pagar VMs individuales y trabajos de compactación separados, hay dos SKUs:
Unidad | Precio |
|---|---|
Unidad de capacidad optimizada para almacenamiento | USD 2.30 / 1 hour |
Unidad de escritura | USD 0.45 / 1 gibibyte |
Vertex AI Model Registry es un repositorio central que monitorea y enumera tus modelos y versiones de modelos. Puedes importar modelos en Vertex AI y aparecen en el Vertex AI Model Registry. No hay un costo relacionado con tener tus modelos en el Model Registry. Solo se generan costos cuando implementas el modelo en un extremo o realizas una predicción por lotes en el modelo. Este costo está determinado por el tipo de modelo que implementas.
Para obtener más información sobre los precios de implementar modelos personalizados desde Vertex AI Model Registry, consulta Modelos entrenados de forma personalizada. Para obtener más información sobre los precios de implementar modelos de AutoML, consulta Precios de modelos de AutoML.
Vertex AI te permite supervisar la eficacia continua de tu modelo después de implementarlo en producción. Para obtener más información, consulta Introducción a Vertex AI Model Monitoring.
Cuando usas Vertex AI Model Monitoring, se te factura lo siguiente:
Vertex AI Model Monitoring es compatible con las siguientes regiones: us-central1, europe-west4, asia-east1 y asia-southeast1. Los precios son los mismos en todas las regiones.
Los tamaños de los datos se miden después de que se convierten al formato TfRecord.
Los conjuntos de datos de entrenamiento incurren en un cargo único cuando configuras un trabajo de Vertex AI Model Monitoring.
Los conjuntos de datos de predicción consisten en registros recopilados del servicio de predicción en línea. A medida que las solicitudes de predicción llegan durante diferentes períodos, se recopilan los datos para cada período y se usa la suma de los datos analizados para cada período de predicción a fin de calcular el cargo.
Ejemplo: Un científico de datos ejecuta la supervisión de modelos en el tráfico de predicción que pertenece a su modelo.
Selecciona instancias, notebooks administrados o notebooks administrados por el usuario para obtener información sobre los precios.
Instancias
En las siguientes tablas, se indica el precio por hora aproximado de diferentes parámetros de configuración para VMs. Puedes elegir una configuración personalizada de los tipos de máquinas seleccionados. Para calcular los precios, suma los costos de las máquinas virtuales que usas.
Si usas los tipos de máquinas de Compute Engine y les conectas aceleradores, el costo correspondiente se cobra por separado. Para calcularlo, multiplica los precios de la tabla de aceleradores a continuación por la cantidad de cada tipo de acelerador que uses.
CPUs
Tipo de máquina | Precio por vCPU (USD) |
|---|---|
N1 | USD 0.0379332 / 1 hour |
N2 | USD 0.0379332 / 1 hour |
E2 | USD 0.026173908 / 1 hour |
A2 | USD 0.0379332 / 1 hour |
Memoria
Tipo de máquina | Precio (USD) |
|---|---|
N1 | USD 0.0050844 / 1 gibibyte hour |
N2 | USD 0.0050844 / 1 gibibyte hour |
E2 | USD 0.003508236 / 1 gibibyte hour |
A2 | USD 0.0050844 / 1 gibibyte hour |
Aceleradores
Tipo de máquina | Precio (USD) |
|---|---|
Nvidia Tesla A100 | USD 4.400862 / 1 hour |
Nvidia Tesla A100 de 80 GB | USD 4.51729 / 1 hour |
Nvidia Tesla T4 | USD 0.525 / 1 hour |
Nvidia Tesla V100 | USD 3.72 / 1 hour |
Nvidia Tesla P100 | USD 2.19 / 1 hour |
Discos
Tipo de máquina | Precio (USD) |
|---|---|
Espacio aprovisionado de Hyperdisk Extreme | USD 0.000205479 / 1 gibibyte hour |
Espacio aprovisionado balanceado | USD 0.000164384 / 1 gibibyte hour |
Espacio aprovisionado extremo | USD 0.000205479 / 1 gibibyte hour |
Espacio aprovisionado para SSD | USD 0.000279452 / 1 gibibyte hour |
Espacio aprovisionado estándar | USD 0.000065753 / 1 gibibyte hour |
Tu instancia de Vertex AI Workbench incurre en cargos de la siguiente manera:
Notebooks administrados
Los precios están compuestos por los recursos de procesamiento y almacenamiento que uses, las tarifas de administración para tus instancias de Vertex AI Workbench y cualquier recurso adicional de la nube que uses. Consulta las siguientes secciones para obtener más detalles.
Recursos de procesamiento y almacenamiento
Los recursos de procesamiento y almacenamiento se cobran al mismo precio que pagas actualmente por Compute Engine y Cloud Storage.
Tarifas de administración
Hay tarifas de administración de Vertex AI Workbench además de tu uso de la infraestructura, como puedes ver en las tablas a continuación.
SKU | Precio (USD) |
|---|---|
vCPU | $0.05 por CPU virtual |
T4 y P4 (GPU estándar) | $0.35 por GPU |
P100, V100, L4 y A100 GPU (GPU premium) | $2.48 por GPU |
Notebooks administrados por el usuario
Los precios están compuestos por los recursos de procesamiento y almacenamiento que uses, las tarifas de administración para tus instancias de Vertex AI Workbench y cualquier recurso adicional de la nube que uses. Consulta las siguientes secciones para obtener más detalles.
Recursos de procesamiento y almacenamiento
Los recursos de procesamiento y almacenamiento se cobran al mismo precio que pagas actualmente por Compute Engine y Cloud Storage.
Tarifas de administración
Hay tarifas de administración de Vertex AI Workbench además de tu uso de la infraestructura, como puedes ver en las tablas a continuación.
SKU | Precio (USD) |
|---|---|
vCPU | $0.005 por CPU virtual |
T4 y P4 (GPU estándar) | $0.035 por GPU |
P100, V100 y A100 GPU (GPU premium) | $0.25 por GPU |
Recursos adicionales de Google Cloud
Además de los costos mencionados anteriormente, también pagas por los recursos de Google Cloud que uses. Por ejemplo:
Para obtener información sobre los precios de Colab Enterprise, consulta Precios de Colab Enterprise.
En el caso de los contenedores de aprendizaje profundo, las imágenes de VM de aprendizaje profundo y AI Platform Pipelines, los precios se calculan según los recursos de procesamiento y almacenamiento que uses. Estos recursos se cobran a la misma tarifa que pagas actualmente por Compute Engine y Cloud Storage.
Además de los costos de procesamiento y almacenamiento, también pagas por los recursos de Google Cloud que uses. Por ejemplo:
Vertex AI te permite solicitar el etiquetado manual de un conjunto de datos que tengas planeado usar para entrenar un modelo de aprendizaje automático personalizado. Los precios del servicio se calculan en función del tipo de tarea de etiquetado.
En la siguiente tabla, se muestra el precio por 1,000 unidades por etiquetador manual, según la unidad que se indica para cada objetivo. Los precios del nivel 1 se aplican a las primeras 50,000 unidades por mes en cada proyecto de Google Cloud; los precios del nivel 2 se aplican a las siguientes 950,000 unidades por mes en el proyecto, hasta 1,000,000 de unidades. Comunícate con nosotros para conocer los precios para más de 1,000,000 de unidades por mes.
Tipo de datos | Objetivo | Unidad | Precio de nivel 1 (USD) | Precio de nivel 2 (USD) |
|---|---|---|---|---|
Imagen | Clasificación | Imagen | $35 | $25 |
Cuadro delimitador | Cuadro delimitador | $63 | $49 | |
Segmentación | Para segmentación | $870 | $850 | |
Cuadro rotado | Cuadro delimitador | $86 | $60 | |
Polígono/polilínea | Polígono/polilínea | $257 | $180 | |
Video | Clasificación | Video de 5 s | $86 | $60 |
Seguimiento de objetos | Cuadro delimitador | $86 | $60 | |
Reconocimiento de acciones | Evento en video de 30 s | $214 | $150 | |
Texto | Clasificación | 50 palabras | $129 | $90 |
Opinión | 50 palabras | $200 | $140 | |
Extracción de entidades | Entidad | $86 | $60 | |
Aprendizaje activo | Todos | Elemento de datos | $80 | $56 |
Etiquetador personalizado | Todos | Elemento de datos | $80 | $56 |
Además de los costos que se describen en este documento, debes almacenar los datos y los archivos de programa en buckets de Cloud Storage durante el ciclo de vida de Vertex AI. Este almacenamiento está sujeto a la política de precios de Cloud Storage.
El uso obligatorio de Cloud Storage incluye lo siguiente:
Las operaciones de administración de recursos que proporciona AI Platform están disponibles sin costo. La política de cuotas de AI Platform limita algunas de estas operaciones.
Recurso | Operaciones gratuitas |
|---|---|
modelos | create, get, list, delete |
versiones | create, get, list, delete, setDefault |
trabajos | get, list, cancel |
operaciones | get, list, cancel, delete |
Si almacenas imágenes que se analizarán en Cloud Storage o usas otros recursos de Google Cloud en conjunto con Vertex AI, también se te facturará por el uso de esos servicios.
Para ver el estado actual de tu facturación en la consola de Google Cloud, junto con el uso y la factura actual, consulta la página Facturación. Si quieres obtener más información sobre la administración de tu cuenta, consulta la documentación de la Facturación de Cloud o la asistencia para la facturación y pagos.