Usar reservas de Compute Engine con Dataflow

Para asegurarte de que los recursos de VM estén disponibles cuando los necesiten tus trabajos de Dataflow, puedes usar reservas de Compute Engine. Las reservas ofrecen un alto nivel de garantía para obtener capacidad para los recursos de zona de Compute Engine.

Para usar reservas de Compute Engine con Dataflow, sigue estos pasos:

  1. Crea una reserva de Compute Engine. Puede ser una reserva de un solo proyecto o una reserva compartida. Para obtener más información, consulta los siguientes documentos:

    La reserva puede incluir aceleradores de GPU o TPU.

  2. Cuando envíes tu tarea de Dataflow, pasa una de las siguientes opciones de servicio, en función de la versión del SDK de Beam que estés usando:

    • Versión de Beam anterior a la 2.29: --experiments=skip_gce_quota_verification
    • Versión de Beam >= 2.29: --dataflow_service_options=automatically_use_created_reservation

Para evitar que las cargas de trabajo de baja prioridad del mismo proyecto compitan por las reservas con Dataflow, asigna la afinidad de reserva a none cuando crees las VMs de esas cargas de trabajo. Para obtener más información, consulta Consumir instancias reservadas.

Para usar la reserva, los trabajadores de Dataflow deben coincidir con la configuración de la reserva. Es posible que tengas que definir el tipo de máquina de los trabajadores de la tarea. Para obtener más información, consulta Trabajadores.

Limitaciones

  • Se aplican todas las limitaciones de las reservas de Compute Engine cuando los trabajadores de Dataflow consumen reservas. Consulta cómo funcionan las reservas.

  • Dataflow se basa en el orden de consumo predeterminado de Compute Engine. Por lo tanto, se aplican las siguientes limitaciones:

    • Otras cargas de trabajo del mismo proyecto u organización que no especifiquen la marca --reservation pueden competir con las cargas de trabajo de Dataflow por las reservas específicas del proyecto o compartidas.
  • Las tareas de Dataflow Prime no consumen reservas de Compute Engine.

Reservas y aceleradores

Dataflow admite reservas específicas para las canalizaciones que usan aceleradores (GPUs o TPUs) . Esta función está disponible de forma general con una lista de permitidos. Para obtener instrucciones sobre cómo usar los aceleradores de Dataflow con reservas específicas, ponte en contacto con el equipo de tu cuenta.

Precios

Dataflow te factura las VMs de las reservas consumidas automáticamente mientras se ejecuta tu tarea de Dataflow. Cuando Dataflow no usa las VMs, Compute Engine te factura.

Modelo de precios de Compute Engine

Si tu uso de Dataflow incluye máquinas virtuales de reservas específicas que tienen GPUs o TPUs, los recursos de computación de esas máquinas virtuales reservadas se facturan según los precios de Compute Engine. Si tus reservas específicas están asociadas a un compromiso basado en recursos de Compute Engine, también recibirás los descuentos por compromiso de uso (CUDs) basados en recursos que correspondan por tu uso. También se te cobra una prima de gestión por los recursos de computación que se consumen en Dataflow. Para obtener más información sobre los precios, consulta la página Precios de Dataflow.

Modelo de precios de Dataflow

En el caso de cualquier otro tipo de reserva de Compute Engine que uses con Dataflow, el uso se factura según el modelo de precios de Dataflow. El uso de Dataflow de esas reservas no cumple los requisitos de los CUDs basados en recursos, aunque esas reservas estén asociadas a un compromiso basado en recursos. Esto se aplica a las siguientes reservas de Compute Engine:

  • Reservas específicas que no tienen GPUs ni TPUs
  • Todas las reservas consumidas automáticamente

Siguientes pasos

Para obtener más información sobre las reservas de Compute Engine, consulta el artículo sobre la reserva de recursos de zona de Compute Engine.