Precios

AI Platform Prediction ofrece opciones de precios flexibles y escalables que se adaptan a tu proyecto y tu presupuesto. AI Platform Prediction te cobra por obtener predicciones, pero la administración de los recursos de aprendizaje automático en la nube es gratuita.

Descripción general de los precios

En las siguientes tablas se resumen los precios de cada región en la que AI Platform Prediction está disponible.

Consulta los precios de AI Platform Training.

Precios de predicción

En esta tabla, se indican los precios de la predicción por lotes y la predicción en línea por hora por nodo. Una hora de procesamiento de nodo representa el tiempo que una máquina virtual dedica a la ejecución del trabajo de predicción o se mantiene preparada para administrar solicitudes de predicción. Obtén más información sobre cómo calcular los costos de predicción.

América

Predicción
Predicción por lotes $0.0791205 por hora de procesamiento de nodo
Predicción en línea
Tipos de máquinas: precio por hora de procesamiento de nodo
mls1-c1-m2 (predeterminado)

$0.045147

mls1-c4-m2 (Beta)

$0.151962

n1-standard-2 Aproximaciones:
us-east4 $0.107
northamerica-northeast1 $0.1046
Otras regiones de América $0.095
n1-standard-4 Aproximaciones:
us-east4 $0.214
northamerica-northeast1 $0.2092
Otras regiones de América $0.1901
n1-standard-8 Aproximaciones:
us-east4 $0.428
northamerica-northeast1 $0.4183
Otras regiones de América $0.3802
n1-standard-16 Aproximaciones:
us-east4 $0.8559
northamerica-northeast1 $0.8367
Otras regiones de América $0.7603
n1-standard-32 Aproximaciones:
us-east4 $1.7119
northamerica-northeast1 $1.6733
Otras regiones de América $1.5207
n1-highmem-2 Aproximaciones:
us-east4 $0.1332
northamerica-northeast1 $0.1302
Otras regiones de América $0.1184
n1-highmem-4 Aproximaciones:
us-east4 $0.2665
northamerica-northeast1 $0.2605
Otras regiones de América $0.2367
n1-highmem-8 Aproximaciones:
us-east4 $0.5329
northamerica-northeast1 $0.5209
Otras regiones de América $0.4735
n1-highmem-16 Aproximaciones:
us-east4 $1.0659
northamerica-northeast1 $1.0419
Otras regiones de América $0.947
n1-highmem-32 Aproximaciones:
us-east4 $2.1317
northamerica-northeast1 $2.0838
Otras regiones de América $1.894
n1-highcpu-2 Aproximaciones:
us-east4 $0.0798
northamerica-northeast1 $0.078
Otras regiones de América $0.0709
n1-highcpu-4 Aproximaciones:
us-east4 $0.1596
northamerica-northeast1 $0.156
Otras regiones de América $0.1417
n1-highcpu-8 Aproximaciones:
us-east4 $0.3192
northamerica-northeast1 $0.312
Otras regiones de América $0.2834
n1-highcpu-16 Aproximaciones:
us-east4 $0.6384
northamerica-northeast1 $0.624
Otras regiones de América $0.5669
n1-highcpu-32 Aproximaciones:
us-east4 $1.2768
northamerica-northeast1 $1.248
Otras regiones de América $1.1338

Europa

Predicción
Predicción por lotes $0.086118 por hora de procesamiento de nodo
Predicción en línea
Tipos de máquinas: precio por hora de procesamiento de nodo
mls1-c1-m2 (predeterminado)

$0.044095

mls1-c4-m2 (Beta)

$0.148414

n1-standard-2 Aproximaciones:
europe-west2 $0.1224
europe-west3 $0.1224
Otras regiones de Europa $0.11
n1-standard-4 Aproximaciones:
europe-west2 $0.2448
europe-west3 $0.2448
Otras regiones de Europa $0.2201
n1-standard-8 Aproximaciones:
europe-west2 $0.4896
europe-west3 $0.4896
Otras regiones de Europa $0.4401
n1-standard-16 Aproximaciones:
europe-west2 $0.9792
europe-west3 $0.9792
Otras regiones de Europa $0.8802
n1-standard-32 Aproximaciones:
europe-west2 $1.9583
europe-west3 $1.9583
Otras regiones de Europa $1.7605
n1-highmem-2 Aproximaciones:
europe-west2 $0.1524
europe-west3 $0.1524
Otras regiones de Europa $0.137
n1-highmem-4 Aproximaciones:
europe-west2 $0.3048
europe-west3 $0.3048
Otras regiones de Europa $0.274
n1-highmem-8 Aproximaciones:
europe-west2 $0.6097
europe-west3 $0.6097
Otras regiones de Europa $0.548
n1-highmem-16 Aproximaciones:
europe-west2 $1.2193
europe-west3 $1.2193
Otras regiones de Europa $1.0959
n1-highmem-32 Aproximaciones:
europe-west2 $2.4386
europe-west3 $2.4386
Otras regiones de Europa $2.1918
n1-highcpu-2 Aproximaciones:
europe-west2 $0.0913
europe-west3 $0.0913
Otras regiones de Europa $0.0821
n1-highcpu-4 Aproximaciones:
europe-west2 $0.1826
europe-west3 $0.1826
Otras regiones de Europa $0.1642
n1-highcpu-8 Aproximaciones:
europe-west2 $0.3651
europe-west3 $0.3651
Otras regiones de Europa $0.3284
n1-highcpu-16 Aproximaciones:
europe-west2 $0.7303
europe-west3 $0.7303
Otras regiones de Europa $0.6567
n1-highcpu-32 Aproximaciones:
europe-west2 $1.4606
europe-west3 $1.4606
Otras regiones de Europa $1.3134

Asia‑Pacífico

Predicción
Predicción por lotes $0.086118 por hora de procesamiento de nodo
Predicción en línea
Tipos de máquinas: precio por hora de procesamiento de nodo
mls1-c1-m2 (predeterminado)

$0.051456

mls1-c4-m2 (Beta)

$0.17331

n1-standard-2 Aproximaciones:
asia-east1 $0.11
asia-northeast1 $0.1219
asia-southeast1 $0.1172
australia-southeast1 $0.1348
n1-standard-4 Aproximaciones:
asia-east1 $0.2201
asia-northeast1 $0.2438
asia-southeast1 $0.2344
australia-southeast1 $0.2696
n1-standard-8 Aproximaciones:
asia-east1 $0.4401
asia-northeast1 $0.4875
asia-southeast1 $0.4688
australia-southeast1 $0.5392
n1-standard-16 Aproximaciones:
asia-east1 $0.8802
asia-northeast1 $0.975
asia-southeast1 $0.9375
australia-southeast1 $1.0784
n1-standard-32 Aproximaciones:
asia-east1 $1.7605
asia-northeast1 $1.9501
asia-southeast1 $1.8751
australia-southeast1 $2.1567
n1-highmem-2 Aproximaciones:
asia-east1 $0.137
asia-northeast1 $0.1517
asia-southeast1 $0.1459
australia-southeast1 $0.1679
n1-highmem-4 Aproximaciones:
asia-east1 $0.274
asia-northeast1 $0.3034
asia-southeast1 $0.2919
australia-southeast1 $0.3357
n1-highmem-8 Aproximaciones:
asia-east1 $0.548
asia-northeast1 $0.6067
asia-southeast1 $0.5837
australia-southeast1 $0.6714
n1-highmem-16 Aproximaciones:
asia-east1 $1.0959
asia-northeast1 $1.2135
asia-southeast1 $1.1675
australia-southeast1 $1.3428
n1-highmem-32 Aproximaciones:
asia-east1 $2.1918
asia-northeast1 $2.4269
asia-southeast1 $2.335
australia-southeast1 $2.6857
n1-highcpu-2 Aproximaciones:
asia-east1 $0.0821
asia-northeast1 $0.091
asia-southeast1 $0.0874
australia-southeast1 $0.1005
n1-highcpu-4 Aproximaciones:
asia-east1 $0.1642
asia-northeast1 $0.182
asia-southeast1 $0.1748
australia-southeast1 $0.2011
n1-highcpu-8 Aproximaciones:
asia-east1 $0.3284
asia-northeast1 $0.364
asia-southeast1 $0.3496
australia-southeast1 $0.4021
n1-highcpu-16 Aproximaciones:
asia-east1 $0.6567
asia-northeast1 $0.7279
asia-southeast1 $0.6992
australia-southeast1 $0.8043
n1-highcpu-32 Aproximaciones:
asia-east1 $1.3134
asia-northeast1 $1.4558
asia-southeast1 $1.3985
australia-southeast1 $1.6085

Los tipos de máquinas (N1) de Compute Engine para la predicción en línea solo están disponibles en extremos regionales, y sus precios se cobran como dos SKU distintos en tu factura de Google Cloud:

  • Costo de CPU virtual, medido en horas de CPU virtual
  • Costo de RAM, medido en GB-hora

Los precios de los tipos de máquinas (N1) de Compute Engine en la tabla anterior se aproximan al costo total por hora para cada nodo de predicción de una versión del modelo que usa ese tipo de máquina. Por ejemplo, dado que un tipo de máquina n1-highcpu-32 incluye 32 CPU virtuales y 28.8 GB de RAM, el precio por hora de procesamiento de nodo es igual a 32 horas de CPU virtual + 28.8 GB-hora.

Los precios de la tabla anterior se proporcionan para ayudarte a estimar los costos de las predicciones en línea. La siguiente tabla muestra los precios de CPU virtual y RAM para los tipos de máquinas (N1) de Compute Engine, que reflejan con mayor precisión los SKU por los que se te cobrará:

América

SKU de los tipos de máquinas (N1) de Compute Engine
CPU virtual
Virginia del Norte (us-east4) $0.035605 por hora de CPU virtual
Montreal (northamerica-northeast1) $0.034802 por hora de CPU virtual
Otras regiones de América $0.031613 por hora de CPU virtual
RAM
Virginia del Norte (us-east4) $0.004771 por GB-hora
Montreal (northamerica-northeast1) $0.004664 por GB-hora
Otras regiones de América $0.004242 por GB-hora

Europa

SKU de los tipos de máquinas (N1) de Compute Engine
CPU virtual
Londres (europe-west2) $0.04073 por hora de CPU virtual
Fráncfort (europe-west3) $0.04073 por hora de CPU virtual
Otras regiones de Europa $0.036632 por hora de CPU virtual
RAM
Londres (europe-west2) $0.005458 por GB-hora
Fráncfort (europe-west3) $0.005458 por GB-hora
Otras regiones de Europa $0.004902 por GB-hora

Asia‑Pacífico

SKU de los tipos de máquinas (N1) de Compute Engine
CPU virtual
Taiwán (asia-east1) $0.036632 por hora de CPU virtual
Tokio (asia-northeast1) $0.040618 por hora de CPU virtual
Singapur (asia-southeast1) $0.038999 por hora de CPU virtual
Sídney (australia-southeast1) $0.044856 por hora de CPU virtual
RAM
Taiwán (asia-east1) $0.004902 por GB-hora
Tokio (asia-northeast1) $0.005419 por GB-hora
Singapur (asia-southeast1) $0.005226 por GB-hora
Sídney (australia-southeast1) $0.006011 por GB-hora

Como opción puedes usar aceleradores de GPU para predicciones en línea con tipos de máquinas (N1) de Compute Engine. Las GPU incurren en un cargo adicional, separado de los descritos en la tabla anterior. En la siguiente tabla, se describen los precios para cada tipo de GPU:

América

Precio por hora de los aceleradores
NVIDIA_TESLA_K80 $0.4500
NVIDIA_TESLA_P4
Iowa (us-central1) $0.6000
Virginia del Norte (us-east4) $0.6000
Montreal (northamerica-northeast1) $0.6500
NVIDIA_TESLA_P100 $1.4600
NVIDIA_TESLA_T4 $0.3500
NVIDIA_TESLA_V100 $2.4800

Europa

Precio por hora de los aceleradores
NVIDIA_TESLA_K80 $0.4900
NVIDIA_TESLA_P4 $0.6500
NVIDIA_TESLA_P100 $1.6000
NVIDIA_TESLA_T4
Londres (europe-west2) $0.4100
Países Bajos (europe-west4) $0.3800
NVIDIA_TESLA_V100 $2.5500

Asia‑Pacífico

Precio por hora de los aceleradores
NVIDIA_TESLA_K80 $0.4900
NVIDIA_TESLA_P4
Singapur (asia-southeast1) $0.6500
Sídney (australia-southeast1) $0.6500
NVIDIA_TESLA_P100 $1.6000
NVIDIA_TESLA_T4
Tokio (asia-northeast1) $0.3700
Singapur (asia-southeast1) $0.3700
NVIDIA_TESLA_V100 No disponible

Ten en cuenta que el precio es por GPU, por lo que si usas varias GPU por nodo de predicción (o si tu versión se ajusta para usar varios nodos), los costos se ajustan en consecuencia.

Notas:

  1. Todo el uso está sujeto a la política de cuotas de AI Platform Prediction.
  2. Debes almacenar los datos y archivos del programa en depósitos de Google Cloud Storage durante el ciclo de vida de AI Platform Prediction. Obtén más información sobre el uso de Cloud Storage.
  3. Para ver los descuentos por volumen, comunícate con el equipo de ventas.
  4. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en las SKU de Cloud Platform.

La calculadora de precios

Usa la calculadora de precios para estimar los costos de tu entrenamiento y predicción.

Más información acerca de los costos de la predicción

AI Platform Prediction te permite realizar predicciones de tu modelo mediante la ejecución de varias máquinas virtuales (“nodos”). Según la configuración predeterminada, AI Platform Prediction escala automáticamente la cantidad de nodos que se ejecutan a la vez. En el caso de la predicción en línea, se escala la cantidad de nodos para satisfacer la demanda. Cada nodo puede responder a varias solicitudes de predicción. En el caso de la predicción por lotes, se escala la cantidad de nodos a fin de reducir el tiempo total que se necesita para ejecutar un trabajo. Puedes personalizar la escala de los nodos de predicción.

Se cobra el tiempo que se ejecuta cada nodo en tu modelo, incluido lo siguiente:

  • Cuando el nodo procesa un trabajo de predicción por lotes.
  • Cuando el nodo procesa una solicitud de predicción en línea.
  • Cuando el nodo está listo para realizar predicciones en línea

El costo de ejecución de un nodo por una hora es una hora por nodo. En la tabla de precios de predicción, se describe el precio de una hora de procesamiento de nodo, que varía según la región y entre la predicción en línea y por lotes.

Puedes consumir horas de procesamiento de nodo en incrementos fraccionarios. Por ejemplo, la ejecución de un nodo por 30 minutos cuesta 0.5 horas de procesamiento de nodo. Sin embargo, el cálculo de costos se rige por varias reglas:

Cálculos de costos para tipos de máquinas heredadas (MLS1) y predicción por lotes

  • El tiempo de ejecución de un nodo se mide en incrementos de un minuto, redondeado hacia arriba hasta el minuto más cercano. Por ejemplo, si se ejecuta un nodo por 20.1 minutos, debes calcular el costo como si fueran 21 minutos de ejecución.
  • El tiempo de ejecución de los nodos que se ejecutan por menos de 10 minutos se redondea a 10 minutos. Por ejemplo, si se ejecuta un nodo por solo 3 minutos, debes calcular el costo como si fueran 10 minutos de ejecución.

Cálculos de costos para los tipos de máquina de Compute Engine (N1)

  • El tiempo de ejecución de un nodo se factura en incrementos de 30 segundos. Esto significa que, cada 30 segundos, tu proyecto se factura por 30 segundos de los recursos de CPU virtual, RAM y GPU que utilice tu nodo en ese momento.

Más información sobre el ajuste de escala automático de los nodos de predicción

Predicción en línea Predicción por lotes
La prioridad del escalamiento es reducir la latencia de las solicitudes individuales. El servicio mantiene el modelo preparado durante unos minutos de inactividad después de inspeccionar una solicitud. La prioridad del escalamiento es reducir el tiempo transcurrido total del trabajo.
El escalamiento afecta los costos totales cada mes: cuanto más numerosas y frecuentes sean las solicitudes, más nodos se usarán. El escalamiento no debería afectar mucho el precio del trabajo, aunque se pueden generar costos si se agrega un nuevo nodo.

Puedes elegir dejar que el servicio escale como respuesta al tráfico (ajuste de escala automático) o puedes especificar una cantidad de nodos para que se ejecuten todo el tiempo y evitar así la latencia (escalamiento manual).

  • Si eliges el ajuste de escala automático, la cantidad de nodos escala automáticamente y puede reducirse a cero en períodos sin tráfico.
  • Si eliges el escalamiento manual, especificas una cantidad de nodos para que se sigan ejecutando todo el tiempo. Se cobra todo el tiempo en el que los nodos se ejecutan, a partir del momento de la implementación y hasta que borres la versión del modelo.
Puedes modificar el escalamiento mediante la configuración de una cantidad máxima de nodos que se usará en un trabajo de predicción por lotes y la configuración de la cantidad de nodos que deben seguir ejecutándose para un modelo cuando lo implementas.

Cargo mínimo de 10 minutos

Recuerda que, si se ejecuta un nodo por menos de 10 minutos, se cobrará como si fueran 10 minutos de ejecución. Por ejemplo, supón que usas el ajuste de escala automático. Durante un período sin tráfico, no se usa ningún nodo. Si recibes una única solicitud de predicción en línea, un nodo se escala verticalmente para atender la solicitud. Después de ello, se sigue ejecutando el nodo por unos minutos en espera de alguna otra solicitud. Luego, se deja de ejecutar. Incluso si el nodo se ejecutó por menos de 10 minutos, el trabajo del nodo se cobra por 10 minutos (0.17 horas de procesamiento de nodo).

De forma alternativa, también se cobra por 10 minutos si se escala un único nodo para administrar muchas solicitudes de predicción en línea dentro de un período de 10 minutos antes de que se deje de ejecutar.

Puedes usar el escalamiento manual para controlar cuántos nodos se ejecutan en una cantidad de tiempo determinada. Sin embargo, si se ejecuta un nodo por menos de 10 minutos, se cobrará como si fueran 10 minutos de ejecución.

Obtén más información sobre el escalamiento y la asignación de nodos.

Ejemplo de un cálculo de predicción

Una empresa inmobiliaria de una región de América ejecuta una predicción semanal del valor de las viviendas en las áreas en las que trabaja. En un mes, ejecuta predicciones para cuatro semanas en lotes de 3920, 4277, 3849 y 3961. Los trabajos se limitan a un nodo y cada instancia demora un promedio de procesamiento de 0.72 segundos.

Primero, calcula la cantidad de tiempo de ejecución de cada trabajo:

3920 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.04 minutes
4277 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 51.324 minutes
3849 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 46.188 minutes
3961 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.532 minutes

Si se ejecutó cada trabajo por más de diez minutos, se cobra por cada minuto de procesamiento:

($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 52 minutes * 1 node = $0.0685711
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 47 minutes * 1 node = $0.061977725
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964

El cargo total del mes es de $0.26.

En este ejemplo se supuso que se ejecutaron los trabajos en un único nodo y que requirieron una cantidad de tiempo coherente por cada instancia de entrada. En los cálculos de uso real, asegúrate de incluir instancias de varios nodos y usar el tiempo real de ejecución de cada nodo.

Nota sobre los cargos de AI Platform Prediction para Explicaciones de IA

Las Explicaciones de IA no tienen cargo adicional a los precios de AI Platform Prediction. Sin embargo, el procesamiento de las explicaciones demora más que el de las predicciones normales. Por lo tanto, el uso intensivo de las Explicaciones de IA junto con el ajuste de escala automático podrían traer como resultado el inicio de más nodos, lo que podría aumentar los cargos de AI Platform Prediction.

Uso obligatorio de Cloud Storage

Además de los costos que se describen en este documento, debes almacenar los datos y archivos del programa en depósitos de Google Cloud Storage durante el ciclo de vida de AI Platform Prediction. Este almacenamiento está sujeto a la política de precios de Cloud Storage.

El uso obligatorio de Cloud Storage incluye lo siguiente:

  • Realizar la etapa de pruebas de tus archivos de modelo cuando estés listo para implementar una versión del modelo

  • Almacenar los datos de entrada para la predicción por lotes

  • Almacenar los resultados de los trabajos de predicción por lotes. AI Platform Prediction no requiere que estos elementos se almacenen a largo plazo, así que puedes quitar los archivos apenas finalice la operación

Operaciones gratuitas para la administración de los recursos

Las operaciones de administración de recursos de AI Platform Prediction se ofrecen sin cargo. Sin embargo, puede que algunas de estas operaciones se vean limitadas por la política de cuotas de AI Platform Prediction.

Recurso Operaciones gratuitas
models create, get, list, delete
versions create, get, list, delete, setDefault
jobs get, list, cancel
operations get, list, cancel, delete