Cloud Composer 3 | Cloud Composer 2 | Cloud Composer 1
Cette page fournit des informations de dépannage pour les problèmes que vous pouvez rencontrer lors de la mise à jour ou de la mise à niveau des environnements Cloud Composer.
Pour en savoir plus sur la création d'environnements, consultez la page Dépannage pour la création d'environnements.
Lorsque les environnements Cloud Composer sont mis à jour, la majorité des problèmes se produisent pour les raisons suivantes :
- Problèmes d'autorisation de compte de service.
- Problèmes de dépendance PyPI
- Taille de la base de données Airflow
Autorisations insuffisantes pour mettre à jour ou mettre à niveau un environnement
Si Cloud Composer ne peut pas mettre à jour ni à niveau un environnement en raison d'autorisations insuffisantes, le message d'erreur suivant s'affiche :
ERROR: (gcloud.composer.environments.update) PERMISSION_DENIED: The caller does not have permission
Solution : Attribuez des rôles à votre compte et au compte de service de votre environnement, comme décrit dans la section Contrôle des accès.
Le compte de service de l'environnement ne dispose pas des autorisations nécessaires
Lorsque vous créez un environnement Cloud Composer, vous spécifiez un compte de service qui effectue la plupart des opérations de l'environnement. Si ce compte de service ne dispose pas des autorisations nécessaires pour l'opération demandée, Cloud Composer génère une erreur :
UPDATE operation on this environment failed 3 minutes ago with the
following error message:
Composer Backend timed out. Currently running tasks are [stage:
CP_COMPOSER_AGENT_RUNNING
description: "No agent response published."
response_timestamp {
seconds: 1618203503
nanos: 291000000
}
].
Solution : Attribuez des rôles à votre compte Google et au compte de service de votre environnement, comme décrit dans la section Contrôle des accès.
La taille de la base de données Airflow est trop importante pour effectuer l'opération
Une opération de mise à niveau peut échouer, car la taille de la base de données Airflow est trop importante.
Si la taille de la base de données Airflow est supérieure à 16 Go, Cloud Composer génère l'erreur suivante :
Airflow database uses more than 16 GB. Please clean the database before upgrading.
Solution : effectuez le nettoyage de la base de données Airflow, comme décrit dans la section Nettoyer la base de données Airflow.
Échec de la mise à niveau vers une nouvelle version de Cloud Composer en raison de conflits de packages PyPI
Lorsque vous mettez à niveau un environnement sur lequel des packages PyPI personnalisés sont installés, vous pouvez rencontrer des erreurs liées aux conflits de packages PyPI. Cela peut se produire, car la nouvelle image Cloud Composer contient des versions plus récentes des packages préinstallés. Cela peut entraîner des conflits de dépendance avec les packages PyPI que vous avez installés dans votre environnement.
Solution :
- Pour obtenir des informations détaillées sur les conflits de packages, exécutez une vérification de mise à niveau.
- Assouplissez les contraintes de version pour les packages PyPI personnalisés installés. Par exemple, au lieu de spécifier une version en tant que
==1.0.1
, spécifiez-la en tant que>=1.0.1
. - Pour en savoir plus sur la modification des exigences de version pour résoudre les conflits de dépendances, consultez la documentation de pip.
Il n'est pas possible de mettre à niveau un environnement vers une version qui est toujours prise en charge.
Les environnements Cloud Composer ne peuvent être mis à niveau que vers plusieurs versions récentes et précédentes.
Les limites de version pour la création d'environnements et la mise à niveau d'environnements existants sont différentes. Il est possible que la version de Cloud Composer que vous choisissez lorsque vous créez un environnement ne soit pas disponible lorsque vous mettez à niveau des environnements existants.
Vous pouvez effectuer l'opération de mise à niveau à l'aide de Google Cloud CLI, de l'API ou de Terraform. Dans la console Google Cloud , seules les dernières versions sont disponibles pour la mise à niveau.
L'environnement n'est pas sain (échec de la vérification de l'activité)
Vous ne pouvez mettre à niveau un environnement que si son état est indiqué comme opérationnel.
L'une des causes les plus courantes d'un état non sain est lorsque les composants de l'environnement approchent des limites de ressources configurées et fonctionnent constamment à charge maximale. Étant donné que certains composants de l'environnement ne peuvent pas signaler leur état, le DAG de vérification de l'activité indique que l'état de l'environnement n'est pas sain.
Pour résoudre ce problème, nous vous recommandons d'augmenter les limites de ressources. Bien que nous vous recommandions de toujours maintenir votre environnement en dessous des limites, vous pouvez également le faire uniquement pendant la période de mise à niveau de votre environnement.
Un manque de connectivité au DNS peut entraîner des problèmes lors des mises à niveau ou des mises à jour.
Ces problèmes de connectivité peuvent entraîner des entrées de journal comme celle-ci :
WARNING - Compute Engine Metadata server unavailable attempt 1 of 5. Reason: [Errno -3] Temporary failure in name resolution Error
Cela signifie généralement qu'il n'existe pas de route vers le DNS. Assurez-vous donc que le nom DNS metadata.google.internal peut être résolu en adresse IP à partir des réseaux de cluster, de pods et de services. Vérifiez si l'accès privé à Google est activé dans le VPC (dans le projet hôte ou de service) où votre environnement est créé.
Le processeur du déclencheur dépasse la limite de 1 vCPU
Les versions 2.4.4 et ultérieures de Cloud Composer introduisent une stratégie d'allocation des ressources de déclencheur différente pour améliorer l'évolutivité des performances. Si vous rencontrez une erreur liée au processeur du déclencheur lors de la mise à jour d'un environnement, cela signifie que vos déclencheurs actuels sont configurés pour utiliser plus d'un processeur virtuel par déclencheur.
Solution :
- Ajustez l'allocation de ressources du déclencheur pour respecter la limite d'une vCPU.
- Si vous prévoyez des problèmes avec les DAG qui utilisent des opérateurs différables, nous vous recommandons également d'augmenter le nombre de déclencheurs.
Inspecter les avertissements d'échec de migration
Lorsque vous mettez à niveau Airflow vers une version ultérieure, de nouvelles contraintes sont parfois appliquées à la base de données Airflow. Si ces contraintes ne peuvent pas être appliquées, Airflow crée des tables pour stocker les lignes pour lesquelles les contraintes n'ont pas pu être appliquées. L'interface utilisateur d'Airflow affiche un message d'avertissement jusqu'à ce que les tables de données déplacées soient renommées ou supprimées.
Solution :
Vous pouvez utiliser les deux DAG suivants pour inspecter les données déplacées et renommer les tables.
Le DAG list_moved_tables_after_upgrade_dag
liste les lignes qui ont été déplacées de chaque table où des contraintes n'ont pas pu être appliquées. Examinez les données et décidez si vous souhaitez les conserver. Pour la conserver, vous devez corriger manuellement les données dans la base de données Airflow. Par exemple, en ajoutant à nouveau les lignes avec les données correctes.
Si vous n'avez pas besoin des données ou si vous les avez déjà corrigées, vous pouvez exécuter le DAG rename_moved_tables_after_upgrade_dag
. Ce DAG renomme les tables déplacées.
Les tables et leurs données ne sont pas supprimées. Vous pourrez donc les examiner ultérieurement.
L'opération d'environnement reste indéfiniment à l'état "Échec"
Les environnements Cloud Composer 2 s'appuient sur des sujets et des abonnements Pub/Sub pour communiquer avec les ressources situées dans le projet locataire de votre environnement lors des opérations sur l'environnement.
Si l'API Pub/Sub est désactivée dans votre projet, ou si les thèmes ou les abonnements de l'environnement sont supprimés, une opération d'environnement peut échouer et rester indéfiniment à l'état "Échec". Un tel environnement devient irrémédiablement inutilisable.
Étapes suivantes
- Mettre à jour des environnements
- Mise à niveau des environnements
- Résoudre les problèmes de création d'environnement