AI Platform Prediction ofrece opciones de precios flexibles y escalables que se ajustan a tu proyecto y a tu presupuesto. En AI Platform Prediction se te cobra por recibir predicciones, pero gestionar tus recursos de aprendizaje automático en la nube es gratis.
Resumen de precios
En las tablas siguientes se resumen los precios de cada una de las regiones donde está disponible AI Platform Prediction.
Consulta los precios de AI Platform Training.
Precios de la predicción
En esta tabla figuran los precios de la predicción por lotes y de la predicción online por hora de nodo. Una hora de nodo representa el tiempo que emplea una máquina virtual para ejecutar una tarea de predicción o para mantenerse lista a la espera de nuevas solicitudes de predicción. Más información sobre cómo calcular los costes de predicción
América
Predicción | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Predicción por lotes | 0,0791205 USD por hora de nodo | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Predicción online |
|
Europa
Predicción | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Predicción por lotes | 0,086118 USD por hora de nodo | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Predicción online |
|
Asia-Pacífico
Predicción | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Predicción por lotes | 0,086118 USD por hora de nodo | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Predicción online |
|
Los tipos de máquinas N1 de Compute Engine para la predicción online solo están disponibles en puntos de conexión regionales, y los cargos aparecen como dos SKU independientes en tu factura de Google Cloud:
- Coste de vCPU calculado en vCPU por hora
- Coste de RAM calculado en GB por hora
Los precios de los tipos de máquinas N1 de Compute Engine que figuran en la tabla anterior son un cálculo aproximado del coste total por hora de cada nodo de predicción de la versión del modelo que usa el tipo de máquina en cuestión. Por ejemplo, el tipo de máquina n1-highcpu-32
incluye 32 vCPU y 28,8 GB de RAM; por lo tanto, el precio por hora y nodo equivale a 32 vCPU por hora + 28,8 GB por hora.
Los precios de la tabla anterior te sirven para calcular el coste de la predicción online. En la tabla siguiente se muestran los precios por vCPU y RAM de los tipos de máquinas N1 de Compute Engine, que reflejan de forma más precisa los SKU por los que se te cobra:
América
SKUs de los tipos de máquinas N1 de Compute Engine | |||||||
---|---|---|---|---|---|---|---|
vCPU |
|
||||||
RAM |
|
Europa
SKUs de los tipos de máquinas N1 de Compute Engine | |||||||
---|---|---|---|---|---|---|---|
vCPU |
|
||||||
RAM |
|
Asia-Pacífico
SKUs de los tipos de máquinas N1 de Compute Engine | |||||||||
---|---|---|---|---|---|---|---|---|---|
vCPU |
|
||||||||
RAM |
|
También puedes usar aceleradores de GPU para hacer predicciones online con los tipos de máquinas N1 de Compute Engine. Las GPU se cobran aparte de los precios que figuran en la tabla anterior. En la tabla siguiente se muestran los precios de los distintos tipos de GPU:
América
Aceleradores: precio por hora | |||||||
---|---|---|---|---|---|---|---|
NVIDIA_TESLA_K80
|
0,45 USD | ||||||
NVIDIA_TESLA_P4
|
|
||||||
NVIDIA_TESLA_P100
|
1,46 USD | ||||||
NVIDIA_TESLA_T4
|
0,35 USD | ||||||
NVIDIA_TESLA_V100
|
2,48 USD |
Europa
Aceleradores: precio por hora | |||||
---|---|---|---|---|---|
NVIDIA_TESLA_K80
|
0,49 USD | ||||
NVIDIA_TESLA_P4
|
0,65 USD | ||||
NVIDIA_TESLA_P100
|
1,60 USD | ||||
NVIDIA_TESLA_T4
|
|
||||
NVIDIA_TESLA_V100
|
2,55 USD |
Asia-Pacífico
Aceleradores: precio por hora | |||||
---|---|---|---|---|---|
NVIDIA_TESLA_K80
|
0,49 USD | ||||
NVIDIA_TESLA_P4
|
|
||||
NVIDIA_TESLA_P100
|
1,60 USD | ||||
NVIDIA_TESLA_T4
|
|
||||
NVIDIA_TESLA_V100
|
No disponible |
Recuerda que el precio es por GPU; por lo tanto, si usas varias en cada nodo de predicción o si tu versión se escala para utilizar varios nodos, el coste aumenta proporcionalmente.
Notas:
- Todo uso está sujeto a la política de cuotas de AI Platform Prediction.
- Durante el ciclo de vida de AI Platform Prediction, debes almacenar tus datos y archivos de programa en segmentos de Google Cloud Storage. Más información sobre el uso de Cloud Storage
- Para conseguir descuentos por volumen, ponte en contacto con el equipo de Ventas.
- Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKU de Cloud Platform.
Calculadora de precios
Usa la calculadora de precios para estimar cuánto te costarán el entrenamiento y la predicción.
Más información sobre los costes de predicción
Para servir predicciones de tu modelo, AI Platform Prediction ejecuta varias máquinas virtuales llamadas "nodos". AI Platform Prediction escala de forma predeterminada y automática el número de nodos que se ejecutan en cada momento. En el caso de la predicción online, dicho número se escala según la demanda. Cada nodo puede responder a varias solicitudes de predicción. Al realizar predicciones por lotes, el número de nodos se escala para reducir el tiempo total que se tarda en ejecutar una tarea. Si quieres, puedes personalizar cómo se escalan los nodos de predicción.
Se te cobrará por el tiempo de ejecución de cada nodo dentro de tu modelo, incluidas las siguientes situaciones:
- Cuando el nodo procesa una tarea de predicción por lotes
- Cuando el nodo procesa una solicitud de predicción online
- Cuando el nodo se mantiene listo para servir predicciones online.
Una hora de nodo representa el coste de ejecutar un nodo durante una hora. En la tabla de precios de predicción se detalla cuánto cuesta una hora de nodo, lo cual varía según la región y si la tarea de predicción es online o por lotes.
Las horas de nodo se pueden consumir en incrementos fraccionarios; por ejemplo, si ejecutas un nodo durante 30 minutos, se te cobrará como 0,5 horas de nodo. Sin embargo, a la hora de calcular estos costes, se tienen en cuenta las siguientes reglas:
Cálculo de los costes de los tipos de máquinas antiguos (MLS1) y de la predicción por lotes
- El tiempo de ejecución de un nodo se mide en incrementos de un minuto, que se redondean al alza. Por ejemplo, si un nodo se ejecuta durante 20,1 minutos, el coste se debe calcular como si fueran 21 minutos.
- El tiempo de ejecución de los nodos que se ejecutan durante menos de 10 minutos se redondea a dicha cifra. Por ejemplo, si un nodo solo se ejecuta durante 3 minutos, el coste se calcula como una ejecución de 10 minutos.
Cálculo de los costes de los tipos de máquinas N1 de Compute Engine
- El tiempo de ejecución de un nodo se factura en incrementos de 30 segundos. Esto significa que, cada 30 segundos, te cobraremos lo que cuesten los recursos de vCPU, RAM o GPU que use el nodo de tu proyecto durante ese intervalo.
Más información sobre el escalado automático de los nodos de predicción
Predicción online | Predicción por lotes |
---|---|
La prioridad del escalado es reducir la latencia de cada solicitud. El servicio se encarga de que tu modelo se mantenga listo durante unos minutos de inactividad tras servir una solicitud. | La prioridad del escalado es reducir el tiempo que dura la tarea en total. |
El escalado afecta al total de los cargos mensuales, ya que, cuanto más numerosas y frecuentes son tus solicitudes, más nodos se utilizan. | El escalado apenas debería afectar al precio de la tarea; sin embargo, activar nodos nuevos conlleva algunos gastos indirectos. |
Puedes permitir que el servicio se escale en función del tráfico (escalado automático) o, si quieres evitar la latencia, especificar el número de nodos que se deben ejecutar de forma constante (escalado manual).
|
Puedes influir en el escalado si defines un número máximo de nodos para una tarea de predicción por lotes o si estableces el número de nodos que se seguirán ejecutando para un modelo cuando lo despliegues. |
Cargo mínimo de 10 minutos
Si un nodo se ejecuta durante menos de 10 minutos, el coste se calcula como si la ejecución hubiera durado 10 minutos. Por ejemplo, si utilizas el escalado automático, no se usa ningún nodo en los periodos en los que no hay tráfico; sin embargo, si recibes una única solicitud de predicción online, se escala un nodo para procesarla. Una vez hecho esto, el nodo se mantiene listo y en ejecución durante unos minutos antes de detenerse. Si este nodo se ejecuta durante menos de 10 minutos, se te cobran 10 minutos de nodo (es decir, 0,17 horas de nodo) por esta operación.
Por otra parte, si un solo nodo se escala y procesa muchas solicitudes de predicción online durante un periodo de 10 minutos antes de detenerse, también se te cobran 10 minutos de nodo.
Puedes utilizar el escalado manual para controlar exactamente cuántos nodos se ejecutan durante una cantidad determinada de tiempo. Sin embargo, si uno se ejecuta durante menos de 10 minutos, se te cobra lo mismo que si se hubiera ejecutado durante dicho tiempo.
Más información sobre la asignación y el escalado de nodos
Ejemplo de cálculo de una predicción
Una agencia inmobiliaria de una región de América realiza una predicción semanal del valor de la vivienda en las zonas donde presta servicio. En el transcurso de un mes, ejecuta las predicciones de cuatro semanas en lotes de 3920
, 4277
, 3849
y 3961
. Estas tareas tienen un límite de un nodo y cada instancia tarda en procesarse una media de 0.72
segundos.
Primero, se debe calcular lo que dura la ejecución de cada tarea:
3920 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.04 minutes 4277 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 51.324 minutes 3849 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 46.188 minutes 3961 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.532 minutes
Como cada tarea se ejecuta durante más de 10 minutos, se cobrará cada minuto de procesamiento:
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964 ($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 52 minutes * 1 node = $0.0685711 ($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 47 minutes * 1 node = $0.061977725 ($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964
El coste total del mes es de 0,26 USD.
En este ejemplo, se presupone que las tareas se ejecutan en un solo nodo y que el tiempo que tarda cada instancia de entrada es uniforme. A la hora de calcular los costes de un caso de uso real, se deben contabilizar varios nodos y utilizar el tiempo de ejecución total de cada uno.
Nota sobre los cargos de AI Platform Prediction por AI Explanations
AI Explanations está incluido en los precios de AI Platform Prediction. No obstante, las explicaciones de AI Explanations tardan más tiempo en procesarse que las predicciones normales. Por eso, si se usan de forma intensiva junto con el autoescalado, pueden iniciarse más nodos y, como consecuencia, incrementarse los cargos de AI Platform Prediction.
Uso obligatorio de Cloud Storage
Además de los costes descritos en este documento, debes almacenar los datos y los archivos de programa en segmentos de Cloud Storage durante el ciclo de vida de AI Platform Prediction. Ese espacio de almacenamiento está sujeto a la política de precios de Cloud Storage.
Es obligatorio usar Cloud Storage para lo siguiente:
Almacenar en área de stage los archivos del modelo cuando vayas a desplegar una versión de dicho modelo.
Almacenar tus datos de entrada para la predicción por lotes.
Almacenar la salida de las tareas de predicción por lotes. AI Platform Prediction no exige que estos elementos se almacenen a largo plazo. Puedes quitar los archivos en cuanto se complete la operación.
Operaciones gratuitas para gestionar recursos
Puedes realizar operaciones de gestión de recursos con AI Platform Prediction de forma gratuita. No obstante, la política de cuotas de AI Platform Prediction limita algunas de ellas.
Recurso | Operaciones gratuitas |
---|---|
modelos | create, get, list, delete |
versiones | create, get, list, delete, setDefault |
tareas | get, list, cancel |
operaciones | get, list, cancel, delete |