Utiliser des VM basées sur l'architecture ARM sur Dataflow

Cette page explique comment utiliser des VM basées sur l'architecture ARM en tant que nœuds de calcul dans des jobs Dataflow par lot et par flux.

Vous pouvez utiliser la série de machines Tau T2A et la série de machines C4A (bêta) de processeurs Arm pour exécuter des jobs Dataflow. Comme l'architecture ARM est optimisée pour accroître l'efficacité énergétique, l'utilisation de ces VM offre un meilleur rapport prix-performances pour certaines charges de travail. Pour en savoir plus sur les VM Arm, consultez la section VM Arm sur Compute.

Conditions requises

  • Les SDK Apache Beam suivants sont compatibles avec les VM basées sur l'architecture ARM :
    • SDK Apache Beam pour Java version 2.50.0 ou ultérieure
    • SDK Apache Beam pour Python version 2.50.0 ou ultérieure
    • SDK Apache Beam pour Go version 2.50.0 ou ultérieure
  • Sélectionnez une région dans laquelle les machines Tau T2A ou C4A sont disponibles. Pour en savoir plus, consultez la section Régions et zones disponibles.
  • Utilisez Runner v2 pour exécuter le job.
  • Les jobs par flux doivent utiliser Streaming Engine.

Limites

Exécuter un job à l'aide de VM basées sur l'architecture ARM

Pour utiliser des VM basées sur l'architecture ARM, définissez l'option de pipeline suivante.

Java

Définissez l'option de pipeline workerMachineType et spécifiez un type de machine ARM.

Pour en savoir plus sur la définition des options de pipeline, consultez Définir les options de pipeline Dataflow.

Python

Définissez l'option de pipeline machine_type et spécifiez un type de machine ARM.

Pour en savoir plus sur la définition des options de pipeline, consultez Définir les options de pipeline Dataflow.

Go

Définissez l'option de pipeline worker_machine_type et spécifiez un type de machine ARM.

Pour en savoir plus sur la définition des options de pipeline, consultez Définir les options de pipeline Dataflow.

Utiliser des images de conteneurs multi-architectures

Si vous utilisez un conteneur personnalisé dans Dataflow, celui-ci doit correspondre à l'architecture des VM de nœud de calcul. Si vous prévoyez d'utiliser un conteneur personnalisé sur des VM ARM, nous vous recommandons de créer une image multi-architecture. Pour en savoir plus, consultez Créer une image de conteneur multi-architecture.

Tarification

Les ressources de calcul Dataflow vous sont facturées. Les tarifs de Dataflow ne dépendent pas de la famille de types de machines. Pour en savoir plus, consultez la page Tarifs de Dataflow.

Étapes suivantes