Cloud Composer 1 | Cloud Composer 2 | Cloud Composer 3
Suivez les instructions de cette page pour activer ou désactiver la sérialisation des DAG.
Dans un environnement Cloud Composer, le programmeur Airflow et le serveur Web Airflow traitent les DAG en continu. Vous pouvez améliorer la fiabilité et les performances du serveur Web Airflow en activant la sérialisation des DAG.
L'activation de la sérialisation des DAG oblige le programmeur à traiter les fichiers DAG avant leur envoi au serveur Web. Le serveur Web ne traite pas les DAG. Au lieu de cela, il lit les DAG sérialisés à partir de la base de données Airflow. La sérialisation réduit l'utilisation du processeur et de la mémoire par le serveur Web, en particulier lors du traitement d'un grand nombre de DAG.
Avant de commencer
La sérialisation des DAG affecte les fonctionnalités Cloud Composer suivantes :
- La sérialisation des DAG ne peut pas être activée en même temps que le chargement asynchrone des DAG.
- L'activation de la sérialisation des DAG désactive tous les plug-ins du serveur Web Airflow pour Cloud Composer. Cela n'affecte pas les plug-ins du programmeur ou du nœud de calcul, y compris les opérateurs Airflow, les capteurs, etc.
Activer la sérialisation des DAG
Vous pouvez activer la sérialisation des DAG pour un environnement existant ou lors de la création d'un environnement.
Pour activer la sérialisation des DAG, remplacez les options de configuration Airflow suivantes :
Section | Clé | Valeur |
---|---|---|
core |
store_serialized_dags |
True |
core |
store_dag_code |
True |
core |
min_serialized_dag_update_interval |
30 |
scheduler |
dag_dir_list_interval |
30 |
L'option de configuration Airflow min_serialized_dag_update_interval
contrôle la fréquence de mise à jour des DAG sérialisés dans la base de données.
L'option dag_dir_list_interval
contrôle la fréquence à laquelle les DAG supprimés sont supprimés de la base de données Airflow. Une fréquence de mise à jour élevée peut avoir un impact négatif sur les performances. Nous vous recommandons de définir min_serialized_dag_update_interval
et dag_dir_list_interval
sur 30 secondes.
Désactiver la sérialisation des DAG
Vous pouvez activer la sérialisation des DAG pour un environnement existant ou lors de la création d'un environnement.
Pour désactiver la sérialisation des DAG, remplacez les options de configuration Airflow suivantes :
Section | Clé | Valeur |
---|---|---|
core |
store_serialized_dags |
False |
core |
store_dag_code |
False |