Precios

AI Platform Prediction ofrece opciones de precios flexibles y escalables que se adaptan a tu proyecto y tu presupuesto. AI Platform Prediction te cobra por obtener predicciones, pero la administración de los recursos de aprendizaje automático en la nube es gratuita.

Descripción general de los precios

En las siguientes tablas se resumen los precios de cada región en la que AI Platform Prediction está disponible.

Consulta los precios de AI Platform Training.

Precios de predicción

En esta tabla, se indican los precios de la predicción por lotes y la predicción en línea por hora de procesamiento de nodo. Una hora de procesamiento de nodo representa el tiempo que una máquina virtual dedica a la ejecución del trabajo de predicción o se mantiene preparada para administrar solicitudes de predicción. Obtén más información sobre cómo calcular los costos de predicción.

América

Predicción
Predicción por lotes $0.0791205 por hora de procesamiento de nodo
Predicción en línea
Tipos de máquinas: precio por hora de procesamiento de nodo
mls1-c1-m2 (predeterminado)

$0.045147

mls1-c4-m2 (Beta)

$0.151962

n1-standard-2 (Beta)

aproximadamente $0.095

n1-standard-4 (Beta)

aproximadamente $0.1901

n1-standard-8 (Beta)

aproximadamente $0.3802

n1-standard-16 (Beta)

aproximadamente $0.7603

n1-standard-32 (Beta)

aproximadamente $1.5207

n1-highmem-2 (Beta)

aproximadamente $0.1184

n1-highmem-4 (Beta)

aproximadamente $0.2367

n1-highmem-8 (Beta)

aproximadamente $0.4735

n1-highmem-16 (Beta)

aproximadamente $0.947

n1-highmem-32 (Beta)

aproximadamente $1.894

n1-highcpu-2 (Beta)

aproximadamente $0.0709

n1-highcpu-4 (Beta)

aproximadamente $0.1417

n1-highcpu-8 (Beta)

aproximadamente $0.2834

n1-highcpu-16 (Beta)

aproximadamente $0.5669

n1-highcpu-32 (Beta)

aproximadamente $1.1338

Europa

Predicción
Predicción por lotes $0.086118 por hora de procesamiento de nodo
Predicción en línea
Tipos de máquinas: precio por hora de procesamiento de nodo
mls1-c1-m2 (predeterminado)

$0.044095

mls1-c4-m2 (Beta)

$0.148414

n1-standard-2 (Beta)

aproximadamente $0.11

n1-standard-4 (Beta)

aproximadamente $0.2201

n1-standard-8 (Beta)

aproximadamente $0.4401

n1-standard-16 (Beta)

aproximadamente $0.8802

n1-standard-32 (Beta)

aproximadamente $1.7605

n1-highmem-2 (Beta)

aproximadamente $0.137

n1-highmem-4 (Beta)

aproximadamente $0.274

n1-highmem-8 (Beta)

aproximadamente $0.548

n1-highmem-16 (Beta)

aproximadamente $1.0959

n1-highmem-32 (Beta)

aproximadamente $2.1918

n1-highcpu-2 (Beta)

aproximadamente $0.0821

n1-highcpu-4 (Beta)

aproximadamente $0.1642

n1-highcpu-8 (Beta)

aproximadamente $0.3284

n1-highcpu-16 (Beta)

aproximadamente $0.6567

n1-highcpu-32 (Beta)

aproximadamente $1.3134

Asia-Pacífico

Predicción
Predicción por lotes $0.086118 por hora de procesamiento de nodo
Predicción en línea
Tipos de máquinas: precio por hora de procesamiento de nodo
mls1-c1-m2 (predeterminado)

$0.051456

mls1-c4-m2 (Beta)

$0.17331

n1-standard-2 (Beta)

aproximadamente $0.11

n1-standard-4 (Beta)

aproximadamente $0.2201

n1-standard-8 (Beta)

aproximadamente $0.4401

n1-standard-16 (Beta)

aproximadamente $0.8802

n1-standard-32 (Beta)

aproximadamente $1.7605

n1-highmem-2 (Beta)

aproximadamente $0.137

n1-highmem-4 (Beta)

aproximadamente $0.274

n1-highmem-8 (Beta)

aproximadamente $0.548

n1-highmem-16 (Beta)

aproximadamente $1.0959

n1-highmem-32 (Beta)

aproximadamente $2.1918

n1-highcpu-2 (Beta)

aproximadamente $0.0821

n1-highcpu-4 (Beta)

aproximadamente $0.1642

n1-highcpu-8 (Beta)

aproximadamente $0.3284

n1-highcpu-16 (Beta)

aproximadamente $0.6567

n1-highcpu-32 (Beta)

aproximadamente $1.3134

Los tipos de máquinas (N1) de Compute Engine para predicciones en línea (Beta) solo están disponibles en las regiones us-central1, europe-west4 y asia-east1, y sus precios se cobran como dos SKU independientes en tu factura de Google Cloud:

  • Costo de CPU virtual, medido en horas de CPU virtual
  • Costo de RAM, medido en GB-hora

Los precios de los tipos de máquinas (N1) de Compute Engine en la tabla anterior se aproximan al costo total por hora para cada nodo de predicción de una versión del modelo que usa ese tipo de máquina. Por ejemplo, dado que un tipo de máquina n1-highcpu-32 incluye 32 CPU virtuales y 28.8 GB de RAM, el precio por hora de procesamiento de nodo es igual a 32 horas de CPU virtual + 28.8 GB-hora.

Los precios de la tabla anterior se proporcionan para ayudarte a estimar los costos de las predicciones en línea. La siguiente tabla muestra los precios de CPU virtual y RAM para los tipos de máquinas (N1) de Compute Engine, que reflejan con mayor precisión los SKU por los que se te cobrará:

América

SKU de los tipos de máquinas (N1) de Compute Engine
CPU virtual $0.031613 por hora de CPU virtual
RAM $0.004242 por GB-hora

Europa

SKU de los tipos de máquinas (N1) de Compute Engine
CPU virtual $0.036632 por hora, por CPU virtual
RAM $0.004902 por GB-hora

Asia-Pacífico

SKU de los tipos de máquinas (N1) de Compute Engine
CPU virtual $0.036632 por hora, por CPU virtual
RAM $0.004902 por GB-hora

Opcionalmente, puedes usar aceleradores de GPU para predicciones en línea con tipos de máquinas (N1) de Compute Engine. Las GPU incurren en un cargo adicional, separado de los descritos en la tabla anterior. En la siguiente tabla, se describen los precios para cada tipo de GPU:

América

Aceleradores: Precio por hora
NVIDIA_TESLA_K80 $0.4500
NVIDIA_TESLA_P4 $0.6000
NVIDIA_TESLA_P100 $1.4600
NVIDIA_TESLA_T4 $0.3500
NVIDIA_TESLA_V100 $2.4800

Europa

Aceleradores: Precio por hora
NVIDIA_TESLA_K80 No disponible
NVIDIA_TESLA_P4 $0.6500
NVIDIA_TESLA_P100 No disponible
NVIDIA_TESLA_T4 $0.3800
NVIDIA_TESLA_V100 $2.5500

Asia-Pacífico

Aceleradores: Precio por hora
NVIDIA_TESLA_K80 $0.4900
NVIDIA_TESLA_P4 No disponible
NVIDIA_TESLA_P100 $1.6000
NVIDIA_TESLA_T4 No disponible
NVIDIA_TESLA_V100 No disponible

Ten en cuenta que el precio es por GPU, por lo que si usas varias GPU por nodo de predicción (o si tu versión se ajusta para usar varios nodos), los costos se ajustan en consecuencia.

Notas:

  1. Todo el uso está sujeto a la política de cuotas de AI Platform Prediction.
  2. Debes almacenar los datos y archivos del programa en depósitos de Google Cloud Storage durante el ciclo de vida de AI Platform Prediction. Obtén más información sobre el uso de Cloud Storage.
  3. Para ver los descuentos por volumen, comunícate con el equipo de ventas.
  4. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.

La calculadora de precios

Usa la calculadora de precios para estimar los costos de tu entrenamiento y predicción.

Más información acerca de los costos de la predicción

AI Platform Prediction te permite realizar predicciones de tu modelo mediante la ejecución de varias máquinas virtuales (“nodos”). Según la configuración predeterminada, AI Platform Prediction escala automáticamente la cantidad de nodos que se ejecutan a la vez. En el caso de la predicción en línea, se escala la cantidad de nodos para satisfacer la demanda. Cada nodo puede responder a varias solicitudes de predicción. En el caso de la predicción por lotes, se escala la cantidad de nodos a fin de reducir el tiempo total que se necesita para ejecutar un trabajo. Puedes personalizar la escala de los nodos de predicción.

Se cobra el tiempo que se ejecuta cada nodo en tu modelo, incluido lo siguiente:

  • Cuando el nodo procesa un trabajo de predicción por lotes
  • Cuando el nodo procesa una solicitud de predicción en línea
  • Cuando el nodo está listo para realizar predicciones en línea

El costo de ejecución de un nodo por una hora es una hora de procesamiento de nodo. En la tabla de precios de predicción, se describe el precio de una hora de procesamiento de nodo, que varía según la región y entre la predicción en línea y por lotes.

Puedes consumir horas de procesamiento de nodo en incrementos fraccionarios. Por ejemplo, la ejecución de un nodo por 30 minutos cuesta 0.5 horas de procesamiento de nodo. Sin embargo, el cálculo de costos se rige por varias reglas:

Cálculos de costos para tipos de máquinas heredadas (MLS1) y predicción por lotes

  • El tiempo de ejecución de un nodo se mide en incrementos de un minuto, redondeado hacia arriba hasta el minuto más cercano. Por ejemplo, si se ejecuta un nodo por 20.1 minutos, debes calcular el costo como si fueran 21 minutos de ejecución.
  • El tiempo de ejecución de los nodos que se ejecutan por menos de 10 minutos se redondea a 10 minutos. Por ejemplo, si se ejecuta un nodo por solo 3 minutos, debes calcular el costo como si fueran 10 minutos de ejecución.

Cálculos de costos para los tipos de máquina de Compute Engine (N1)

  • El tiempo de ejecución de un nodo se factura en incrementos de 30 segundos. Esto significa que, cada 30 segundos, tu proyecto se factura por 30 segundos de los recursos de CPU virtual, RAM y GPU que utilice tu nodo en ese momento.

Más información sobre el ajuste de escala automático de los nodos de predicción

Predicción en línea Predicción por lotes
La prioridad del escalamiento es reducir la latencia de las solicitudes individuales. El servicio mantiene el modelo preparado durante unos minutos de inactividad después de inspeccionar una solicitud. La prioridad del escalamiento es reducir el tiempo transcurrido total del trabajo.
El escalamiento afecta los costos totales cada mes: cuanto más numerosas y frecuentes sean las solicitudes, más nodos se usarán. El escalamiento no debería afectar mucho el precio del trabajo, aunque se pueden generar costos si se agrega un nuevo nodo.

Puedes elegir dejar que el servicio escale como respuesta al tráfico (ajuste de escala automático) o puedes especificar una cantidad de nodos para que se ejecuten constantemente y evitar así la latencia (escalamiento manual).

  • Si eliges el ajuste de escala automático, la cantidad de nodos escala automáticamente y puede reducirse a cero en períodos sin tráfico.
  • Si eliges el escalamiento manual, especificas una cantidad de nodos para que se sigan ejecutando todo el tiempo. Se cobra todo el tiempo en el que los nodos se ejecutan, a partir del momento de la implementación y hasta que borres la versión del modelo.
Puedes modificar el escalamiento mediante la configuración de una cantidad máxima de nodos que se usará en un trabajo de predicción por lotes y la configuración de la cantidad de nodos que deben seguir ejecutándose para un modelo cuando lo implementas.

Cargo mínimo de 10 minutos

Recuerda que, si se ejecuta un nodo por menos de 10 minutos, se cobrará como si fueran 10 minutos de ejecución. Por ejemplo, supón que usas el ajuste de escala automático. Durante un período sin tráfico, no se usa ningún nodo. Si recibes una única solicitud de predicción en línea, un nodo se escala verticalmente para atender la solicitud. Después de ello, se sigue ejecutando el nodo por unos minutos en espera de alguna otra solicitud. Posteriormente, se deja de ejecutar. Incluso si el nodo se ejecutó por menos de 10 minutos, el trabajo del nodo se cobra por 10 minutos (0.17 horas de procesamiento de nodo).

De forma alternativa, también se cobra por 10 minutos si se escala un único nodo para administrar muchas solicitudes de predicción en línea dentro de un período de 10 minutos antes de que se deje de ejecutar.

Puedes usar el escalamiento manual para controlar cuántos nodos se ejecutan en una cantidad de tiempo determinada. Sin embargo, si se ejecuta un nodo por menos de 10 minutos, se cobrará como si fueran 10 minutos de ejecución.

Obtén más información sobre el escalamiento y la asignación de nodos.

Ejemplo de un cálculo de predicción

Una empresa inmobiliaria de una región de América ejecuta una predicción semanal del valor de las viviendas en las áreas en las que trabaja. En un mes, ejecuta predicciones para cuatro semanas en lotes de 3920, 4277, 3849 y 3961. Los trabajos se limitan a un nodo y cada instancia demora un promedio de procesamiento de 0.72 segundos.

Primero, calcula la cantidad de tiempo de ejecución de cada trabajo:

3920 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.04 minutes
4277 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 51.324 minutes
3849 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 46.188 minutes
3961 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.532 minutes

Si se ejecutó cada trabajo por más de diez minutos, se cobra por cada minuto de procesamiento:

($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 52 minutes * 1 node = $0.0685711
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 47 minutes * 1 node = $0.061977725
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964

El cargo total del mes es de $0.26.

En este ejemplo, se supuso que se ejecutaron los trabajos en un único nodo y que requirieron una cantidad de tiempo coherente por cada instancia de entrada. En los cálculos de uso real, asegúrate de incluir instancias de varios nodos y usar el tiempo real de ejecución de cada nodo.

Nota sobre los cargos de AI Platform Prediction para Explicaciones de IA

Las Explicaciones de IA no tienen cargo adicional a los precios de AI Platform Prediction. Sin embargo, el procesamiento de las explicaciones demora más que el de las predicciones normales. Por lo tanto, el uso intensivo de las Explicaciones de IA junto con el ajuste de escala automático podrían traer como resultado el inicio de más nodos, lo que podría aumentar los cargos de AI Platform Prediction.

Uso obligatorio de Cloud Storage

Además de los costos que se describen en este documento, debes almacenar los datos y archivos del programa en depósitos de Google Cloud Storage durante el ciclo de vida de AI Platform Prediction. Este almacenamiento está sujeto a la política de precios de Cloud Storage.

El uso obligatorio de Cloud Storage incluye lo siguiente:

  • Realizar la etapa de pruebas de tus archivos de modelo cuando estés listo para implementar una versión del modelo

  • Almacenar los datos de entrada para la predicción por lotes

  • Almacenar los resultados de los trabajos de predicción por lotes. AI Platform Prediction no requiere que estos elementos se almacenen a largo plazo, así que puedes quitar los archivos apenas finalice la operación

Operaciones gratuitas para la administración de los recursos

Las operaciones de administración de recursos de AI Platform Prediction se ofrecen sin cargo. Sin embargo, puede que algunas de estas operaciones se vean limitadas por la política de cuotas de AI Platform Prediction.

Recurso Operaciones gratuitas
models create, get, list, delete
versions create, get, list, delete, setDefault
jobs get, list, cancel
operations get, list, cancel, delete