Après avoir créé un cluster, vous pouvez l'arrêter, puis le redémarrer lorsque vous en avez besoin. L'arrêt d'un cluster inactif évite des frais et la nécessité de supprimer un cluster inactif, puis de créer un cluster avec la même configuration par la suite.
Remarques :
- La fonctionnalité de démarrage et d'arrêt des clusters est disponible sur les clusters créés avec des images publiées à partir des versions d'image suivantes :
- 1.4.35-debian10/ubuntu18
- 1.5.10-debian10/ubuntu18
- 2.0.0-RC6-debian10/ubuntu18
- L'arrêt de nœuds de cluster individuels n'est pas recommandé, car l'état d'une VM arrêtée peut ne pas être synchronisé avec l'état du cluster, ce qui peut entraîner des erreurs.
Arrêter un cluster
L'arrêt d'un cluster arrête toutes les VM Compute Engine du cluster. Les VM ne vous sont pas facturées tant qu'elles sont arrêtées. Toutefois, les ressources du cluster associées, telles que les disques persistants, continuent de vous être facturées.
Remarques :
- Opérations en cours d'exécution : si un cluster dispose d'opérations en cours d'exécution (telles que des opérations de mise à jour ou de diagnostic), la requête d'arrêt échoue.
- Tâches en cours d'exécution : si un cluster comporte des tâches en cours d'exécution, la requête d'arrêt aboutit, les VM s'arrêtent et les tâches en cours d'exécution échouent.
- Réponse à l'arrêt : lorsque la requête d'arrêt renvoie une opération d'arrêt, le cluster se trouve à l'état
STOPPING
et aucune autre tâche ne peut être envoyée (les requêtesSubmitJob
échoueront). - Autoscaling : si vous arrêtez un cluster sur lequel l'autoscaling est activé, l'autoscaler Dataproc arrête le scaling du cluster. Le scaling reprend une fois le cluster redémarré. Si vous activez l'autoscaling sur un cluster arrêté, la règle d'autoscaling prendra effet une fois le cluster redémarré.
Surveiller l'opération d'arrêt
Vous pouvez exécuter gcloud dataproc operations describe operation-id
pour surveiller l'opération d'arrêt du cluster de longue durée. Vous pouvez utiliser la commande gcloud dataproc clusters describe cluster-name
pour surveiller la transition de l'état du cluster de RUNNING
vers STOPPING
vers STOPPED
.
Limites
Vous ne pouvez pas arrêter :
- les clusters avec nœuds de calcul secondaires ;
- les clusters avec des SSD locaux ;
Une fois le cluster arrêté, vous ne pouvez plus :
- mettre à jour le cluster ;
- envoyer des tâches au cluster ;
- accéder aux notebooks exécutés sur le cluster à l'aide de la passerelle des composants Dataproc.
Démarrer un cluster
Lorsque vous redémarrez un cluster arrêté, les actions d'initialisation ne sont pas réexécutées. Les actions d'initialisation ne sont exécutées sur les nœuds de cluster que lors de la création de celui-ci ou lorsque des nœuds sont ajoutés lors du scaling à la hausse du cluster.
Une fois l'opération de démarrage terminée, vous pouvez envoyer immédiatement des tâches au cluster. Cependant, l'exécution des tâches peut être retardée (d'environ 30 secondes) pour permettre à HDFS et à YARN de devenir opérationnels.
Arrêter et démarrer un cluster
Vous pouvez arrêter et démarrer un cluster à l'aide de la console Google Cloud , de gcloud CLI ou de l'API Dataproc.
ConsoleGoogle Cloud
Cliquez sur le nom du cluster sur la page Clusters de Dataproc dans la console Google Cloud , puis cliquez sur ARRÊTER pour arrêter le cluster et sur DÉMARRER pour démarrer le cluster.
gcloud CLI
Arrêter un cluster
gcloud dataproc clusters stop CLUSTER_NAME \ --region=REGION
Démarrer un cluster
gcloud dataproc clusters start CLUSTER_NAME \ --region=REGION
API REST
Arrêter un cluster
Envoyez une requête clusters.stop.
Démarrer un cluster
Envoyez une requête clusters.start.