AI Platform Prediction ofrece opciones de precios flexibles y escalables que se adaptan a tu proyecto y tu presupuesto. AI Platform Prediction te cobra por obtener predicciones, pero la administración de los recursos de aprendizaje automático en la nube es gratuita.
Descripción general de los precios
En las siguientes tablas se resumen los precios de cada región en la que AI Platform Prediction está disponible.
Consulta los precios de AI Platform Training.
Precios de predicción
En esta tabla, se indican los precios de la predicción por lotes y la predicción en línea por hora por nodo. Una hora de procesamiento de nodo representa el tiempo que una máquina virtual dedica a la ejecución del trabajo de predicción o se mantiene preparada para administrar solicitudes de predicción. Obtén más información sobre cómo calcular los costos de predicción.
América
Predicción | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Predicción por lotes | $0.0791205 por hora de procesamiento de nodo | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Predicción en línea |
|
Europa
Predicción | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Predicción por lotes | $0.086118 por hora de procesamiento de nodo | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Predicción en línea |
|
Asia‑Pacífico
Predicción | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Predicción por lotes | $0.086118 por hora de procesamiento de nodo | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Predicción en línea |
|
Los tipos de máquinas (N1) de Compute Engine para la predicción en línea solo están disponibles en extremos regionales, y sus precios se cobran como dos SKU distintos en tu factura de Google Cloud:
- Costo de CPU virtual, medido en horas de CPU virtual
- Costo de RAM, medido en GB-hora
Los precios de los tipos de máquinas (N1) de Compute Engine en la tabla anterior se aproximan al costo total por hora para cada nodo de predicción de una versión del modelo que usa ese tipo de máquina. Por ejemplo, dado que un tipo de máquina n1-highcpu-32
incluye 32 CPU virtuales y 28.8 GB de RAM, el precio por hora de procesamiento de nodo es igual a 32 horas de CPU virtual + 28.8 GB-hora.
Los precios de la tabla anterior se proporcionan para ayudarte a estimar los costos de las predicciones en línea. La siguiente tabla muestra los precios de CPU virtual y RAM para los tipos de máquinas (N1) de Compute Engine, que reflejan con mayor precisión los SKU por los que se te cobrará:
América
SKU de los tipos de máquinas (N1) de Compute Engine | |||||||
---|---|---|---|---|---|---|---|
CPU virtual |
|
||||||
RAM |
|
Europa
SKU de los tipos de máquinas (N1) de Compute Engine | |||||||
---|---|---|---|---|---|---|---|
CPU virtual |
|
||||||
RAM |
|
Asia‑Pacífico
SKU de los tipos de máquinas (N1) de Compute Engine | |||||||||
---|---|---|---|---|---|---|---|---|---|
CPU virtual |
|
||||||||
RAM |
|
Como opción puedes usar aceleradores de GPU para predicciones en línea con tipos de máquinas (N1) de Compute Engine. Las GPU incurren en un cargo adicional, separado de los descritos en la tabla anterior. En la siguiente tabla, se describen los precios para cada tipo de GPU:
América
Precio por hora de los aceleradores | |||||||
---|---|---|---|---|---|---|---|
NVIDIA_TESLA_K80
|
$0.4500 | ||||||
NVIDIA_TESLA_P4
|
|
||||||
NVIDIA_TESLA_P100
|
$1.4600 | ||||||
NVIDIA_TESLA_T4
|
$0.3500 | ||||||
NVIDIA_TESLA_V100
|
$2.4800 |
Europa
Precio por hora de los aceleradores | |||||
---|---|---|---|---|---|
NVIDIA_TESLA_K80
|
$0.4900 | ||||
NVIDIA_TESLA_P4
|
$0.6500 | ||||
NVIDIA_TESLA_P100
|
$1.6000 | ||||
NVIDIA_TESLA_T4
|
|
||||
NVIDIA_TESLA_V100
|
$2.5500 |
Asia‑Pacífico
Precio por hora de los aceleradores | |||||
---|---|---|---|---|---|
NVIDIA_TESLA_K80
|
$0.4900 | ||||
NVIDIA_TESLA_P4
|
|
||||
NVIDIA_TESLA_P100
|
$1.6000 | ||||
NVIDIA_TESLA_T4
|
|
||||
NVIDIA_TESLA_V100
|
No disponible |
Ten en cuenta que el precio es por GPU, por lo que si usas varias GPU por nodo de predicción (o si tu versión se ajusta para usar varios nodos), los costos se ajustan en consecuencia.
Notas:
- Todo el uso está sujeto a la política de cuotas de AI Platform Prediction.
- Debes almacenar los datos y archivos del programa en depósitos de Google Cloud Storage durante el ciclo de vida de AI Platform Prediction. Obtén más información sobre el uso de Cloud Storage.
- Para ver los descuentos por volumen, comunícate con el equipo de ventas.
- Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en las SKU de Cloud Platform.
La calculadora de precios
Usa la calculadora de precios para estimar los costos de tu entrenamiento y predicción.
Más información acerca de los costos de la predicción
AI Platform Prediction te permite realizar predicciones de tu modelo mediante la ejecución de varias máquinas virtuales (“nodos”). Según la configuración predeterminada, AI Platform Prediction escala automáticamente la cantidad de nodos que se ejecutan a la vez. En el caso de la predicción en línea, se escala la cantidad de nodos para satisfacer la demanda. Cada nodo puede responder a varias solicitudes de predicción. En el caso de la predicción por lotes, se escala la cantidad de nodos a fin de reducir el tiempo total que se necesita para ejecutar un trabajo. Puedes personalizar la escala de los nodos de predicción.
Se cobra el tiempo que se ejecuta cada nodo en tu modelo, incluido lo siguiente:
- Cuando el nodo procesa un trabajo de predicción por lotes.
- Cuando el nodo procesa una solicitud de predicción en línea.
- Cuando el nodo está listo para realizar predicciones en línea
El costo de ejecución de un nodo por una hora es una hora por nodo. En la tabla de precios de predicción, se describe el precio de una hora de procesamiento de nodo, que varía según la región y entre la predicción en línea y por lotes.
Puedes consumir horas de procesamiento de nodo en incrementos fraccionarios. Por ejemplo, la ejecución de un nodo por 30 minutos cuesta 0.5 horas de procesamiento de nodo. Sin embargo, el cálculo de costos se rige por varias reglas:
Cálculos de costos para tipos de máquinas heredadas (MLS1) y predicción por lotes
- El tiempo de ejecución de un nodo se mide en incrementos de un minuto, redondeado hacia arriba hasta el minuto más cercano. Por ejemplo, si se ejecuta un nodo por 20.1 minutos, debes calcular el costo como si fueran 21 minutos de ejecución.
- El tiempo de ejecución de los nodos que se ejecutan por menos de 10 minutos se redondea a 10 minutos. Por ejemplo, si se ejecuta un nodo por solo 3 minutos, debes calcular el costo como si fueran 10 minutos de ejecución.
Cálculos de costos para los tipos de máquina de Compute Engine (N1)
- El tiempo de ejecución de un nodo se factura en incrementos de 30 segundos. Esto significa que, cada 30 segundos, tu proyecto se factura por 30 segundos de los recursos de CPU virtual, RAM y GPU que utilice tu nodo en ese momento.
Más información sobre el ajuste de escala automático de los nodos de predicción
Predicción en línea | Predicción por lotes |
---|---|
La prioridad del escalamiento es reducir la latencia de las solicitudes individuales. El servicio mantiene el modelo preparado durante unos minutos de inactividad después de inspeccionar una solicitud. | La prioridad del escalamiento es reducir el tiempo transcurrido total del trabajo. |
El escalamiento afecta los costos totales cada mes: cuanto más numerosas y frecuentes sean las solicitudes, más nodos se usarán. | El escalamiento no debería afectar mucho el precio del trabajo, aunque se pueden generar costos si se agrega un nuevo nodo. |
Puedes elegir dejar que el servicio escale como respuesta al tráfico (ajuste de escala automático) o puedes especificar una cantidad de nodos para que se ejecuten todo el tiempo y evitar así la latencia (escalamiento manual).
|
Puedes modificar el escalamiento mediante la configuración de una cantidad máxima de nodos que se usará en un trabajo de predicción por lotes y la configuración de la cantidad de nodos que deben seguir ejecutándose para un modelo cuando lo implementas. |
Cargo mínimo de 10 minutos
Recuerda que, si se ejecuta un nodo por menos de 10 minutos, se cobrará como si fueran 10 minutos de ejecución. Por ejemplo, supón que usas el ajuste de escala automático. Durante un período sin tráfico, no se usa ningún nodo. Si recibes una única solicitud de predicción en línea, un nodo se escala verticalmente para atender la solicitud. Después de ello, se sigue ejecutando el nodo por unos minutos en espera de alguna otra solicitud. Luego, se deja de ejecutar. Incluso si el nodo se ejecutó por menos de 10 minutos, el trabajo del nodo se cobra por 10 minutos (0.17 horas de procesamiento de nodo).
De forma alternativa, también se cobra por 10 minutos si se escala un único nodo para administrar muchas solicitudes de predicción en línea dentro de un período de 10 minutos antes de que se deje de ejecutar.
Puedes usar el escalamiento manual para controlar cuántos nodos se ejecutan en una cantidad de tiempo determinada. Sin embargo, si se ejecuta un nodo por menos de 10 minutos, se cobrará como si fueran 10 minutos de ejecución.
Obtén más información sobre el escalamiento y la asignación de nodos.
Ejemplo de un cálculo de predicción
Una empresa inmobiliaria de una región de América ejecuta una predicción semanal del valor de las viviendas en las áreas en las que trabaja. En un mes, ejecuta predicciones para cuatro semanas en lotes de 3920
, 4277
, 3849
y 3961
. Los trabajos se limitan a un nodo y cada instancia demora un promedio de procesamiento de 0.72
segundos.
Primero, calcula la cantidad de tiempo de ejecución de cada trabajo:
3920 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.04 minutes 4277 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 51.324 minutes 3849 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 46.188 minutes 3961 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.532 minutes
Si se ejecutó cada trabajo por más de diez minutos, se cobra por cada minuto de procesamiento:
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964 ($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 52 minutes * 1 node = $0.0685711 ($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 47 minutes * 1 node = $0.061977725 ($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964
El cargo total del mes es de $0.26.
En este ejemplo se supuso que se ejecutaron los trabajos en un único nodo y que requirieron una cantidad de tiempo coherente por cada instancia de entrada. En los cálculos de uso real, asegúrate de incluir instancias de varios nodos y usar el tiempo real de ejecución de cada nodo.
Nota sobre los cargos de AI Platform Prediction para Explicaciones de IA
Las Explicaciones de IA no tienen cargo adicional a los precios de AI Platform Prediction. Sin embargo, el procesamiento de las explicaciones demora más que el de las predicciones normales. Por lo tanto, el uso intensivo de las Explicaciones de IA junto con el ajuste de escala automático podrían traer como resultado el inicio de más nodos, lo que podría aumentar los cargos de AI Platform Prediction.
Uso obligatorio de Cloud Storage
Además de los costos que se describen en este documento, debes almacenar los datos y archivos del programa en depósitos de Google Cloud Storage durante el ciclo de vida de AI Platform Prediction. Este almacenamiento está sujeto a la política de precios de Cloud Storage.
El uso obligatorio de Cloud Storage incluye lo siguiente:
Realizar la etapa de pruebas de tus archivos de modelo cuando estés listo para implementar una versión del modelo
Almacenar los datos de entrada para la predicción por lotes
Almacenar los resultados de los trabajos de predicción por lotes. AI Platform Prediction no requiere que estos elementos se almacenen a largo plazo, así que puedes quitar los archivos apenas finalice la operación
Operaciones gratuitas para la administración de los recursos
Las operaciones de administración de recursos de AI Platform Prediction se ofrecen sin cargo. Sin embargo, puede que algunas de estas operaciones se vean limitadas por la política de cuotas de AI Platform Prediction.
Recurso | Operaciones gratuitas |
---|---|
models | create, get, list, delete |
versions | create, get, list, delete, setDefault |
jobs | get, list, cancel |
operations | get, list, cancel, delete |