Precios de Cloud Dataflow

IMPORTANTE: El modelo de precios de Cloud Dataflow Shuffle se modificará el 16 de abril de 2018. Los trabajos de Cloud Dataflow ejecutados antes de esta fecha, se facturarán con el modelo de precios anterior de Shuffle.

Esta página describe los precios de Cloud Dataflow. Para ver los precios de otros productos, consulta la documentación sobre precios.

Descripción general de los precios

Si bien la tarifa se establece por hora, el uso del servicio de Cloud Dataflow se factura en incrementos de segundos por trabajo. El uso se expresa en horas (30 minutos corresponden a 0.5 horas, por ejemplo) para aplicar los precios por hora al uso por segundos. Los trabajadores y los trabajos pueden consumir recursos, según se describe en las siguientes secciones.

Recursos del trabajador y de los trabajadores

Cada trabajo de Cloud Dataflow usa, al menos, un trabajador de Cloud Dataflow. El servicio de Cloud Dataflow proporciona dos tipos de trabajadores: en lotes y de transmisión. Existen cobros por servicios independientes para los trabajadores de transmisión y en lotes.

Los trabajadores de Cloud Dataflow consumirán los siguientes recursos, cada uno facturado por segundo.

Los trabajadores de transmisión y en lotes son recursos especializados que usan Compute Engine. Sin embargo, un trabajo de Cloud Dataflow no emitirá facturación de Compute Engine para los recursos de Compute Engine que administra el servicio de Cloud Dataflow. En cambio, los cargos por el servicio de Cloud Dataflow abarcarán el uso de estos recursos de Compute Engine.

Puedes anular el conteo de trabajadores predeterminado para un trabajo. Si usas el ajuste de escala automático, puedes especificar la cantidad máxima de trabajadores que se asignan a un trabajo. Los trabajadores y los recursos respectivos se agregarán y se quitarán automáticamente según la activación del ajuste de escala automático.

Además, puedes usar las opciones de canalización para anular la configuración de recursos predeterminada (tipo de máquina, tipo de disco y tamaño del disco) asignada a cada trabajador.

Servicios de Cloud Dataflow

La operación de Cloud Dataflow Shuffle particiona y agrupa los datos por clave de forma escalable, eficiente y tolerante a errores. Con su configuración predeterminada, Cloud Dataflow usa una implementación de Shuffle que se ejecuta completamente en máquinas virtuales de trabajadores y consume su CPU, su memoria y su almacenamiento del disco persistente. Cloud Dataflow también proporciona un servicio opcional altamente escalable llamado Cloud Dataflow Shuffle, que permite redistribuir los datos sin usar trabajadores y que se cobra según el volumen de datos procesado. Para hacer que Cloud Dataflow use el servicio Shuffle, puedes especificar el parámetro de canalización con Shuffle.

Recursos de trabajo adicionales

Además del uso de recursos de trabajadores, un trabajo podría consumir los siguientes recursos, cada uno facturado según sus propios precios, incluidos los siguientes, entre otros:

Detalles de precios

Las versiones futuras de Cloud Dataflow podrían tener cargos por servicio diferentes o agrupar servicios relacionados en paquetes.

Consulta la página Regiones y zonas de Compute Engine para obtener más información sobre las regiones disponibles y sus zonas.

Iowa Oregón Virginia del Norte Carolina del Sur Montreal São Paulo Bélgica Londres Países Bajos Fráncfort Bombay Singapur Sídney Taiwán Tokio
Tipo de trabajador de Cloud Dataflow CPU virtual
(por hora)
Memoria
(por GB, por hora)
Almacenamiento - Disco persistente estándar
(por GB, por hora)
Almacenamiento - Disco SSD persistente
(por GB, por hora)
Datos procesados con Shuffle3
(por GB)4
En lotes1
Transmisión2

Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en las SKU de Cloud Platform.

1 Propiedades predeterminadas de los trabajadores en lotes: 1 CPU virtual, 3.75 GB de memoria, 250 GB de disco persistente.

2 Propiedades predeterminadas de los trabajadores de transmisión: 4 CPU virtuales, 15 GB de memoria, 420 GB de disco persistente.

3 Actualmente, la modalidad de Cloud Dataflow Shuffle basada en servicios está disponible en versión Beta para las canalizaciones de lotes solo en las regiones us-central1 (Iowa) y europe-west1 (Bélgica). Estará disponible en otras regiones en el futuro.

4 Antes del 16 de abril de 2018, Shuffle se facturaba según la cantidad de datos redistribuidos multiplicada por el tiempo que tomaba redistribuirlos y mantenerlos en la memoria de Shuffle; el precio era de $0.0216 por gigabyte por hora. A partir del 16 de abril de 2018, Cloud Dataflow Shuffle comenzó a cobrarse solo por la cantidad de datos que la infraestructura de nuestro servicio lee y escribe durante el proceso de redistribución del conjunto de datos; la unidad del precio es gigabytes. El tiempo ya no se considera como un factor para realizar la facturación. Los usuarios con conjuntos de datos grandes o muy grandes, deberían observar reducciones significativas en sus gastos en Shuffle.
Para fomentar aún más el uso de Shuffle basado en servicios, los primeros cinco terabytes de datos procesados en Shuffle tendrán un 50% de descuento. Por ejemplo, si tu canalización con Cloud Dataflow consta de 1 TB de datos procesados con Shuffle, tendrás que pagar solo el 50% de ese volumen de datos (0.5 TB). Si tu canalización consta de 10 TB de datos procesados con Shuffle, solo tendrás que pagar por 7.5 TB, ya que los primeros 5 TB de ese volumen tienen un 50% de descuento.

Cómo ver la información de uso

Puedes ver el total de CPU virtuales, memoria y recursos de discos persistentes asociados con un trabajo en Google Cloud Platform Console o a través de la herramienta de línea de comandos gcloud. Si deseas realizar un seguimiento de los datos procesados reales y cobrables en Shuffle, puedes hacerlo en la interfaz de Cloud Dataflow Monitoring. Puedes usar los datos reales procesados con Shuffle para evaluar el rendimiento de tu canalización y los datos procesados cobrables, a fin de determinar los costos del trabajo de Cloud Dataflow.

Calculadora de precios

Usa la calculadora de precios de Google Cloud Platform para comprender cómo se calcula tu factura.

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…

Cloud Dataflow Documentation