Cloud Composer 1 | Cloud Composer 2 | Cloud Composer 3
Cette page explique comment transférer des DAG, des données et des configurations de vos environnements Cloud Composer 1, Airflow 2 existants vers Cloud Composer 2, Airflow 2.
Ce guide de migration utilise la fonctionnalité Snapshots (Instantanés).
Autres guides de migration
De | À | Méthode | Guide |
---|---|---|---|
Cloud Composer 1, Airflow 2 | Cloud Composer 2, Airflow 2 | Côte à côte, à l'aide d'instantanés | Ce guide (instantanés) |
Cloud Composer 1, Airflow 1 | Cloud Composer 2, Airflow 2 | Côte à côte, à l'aide d'instantanés | Guide de migration (instantanés) |
Cloud Composer 1, Airflow 2 | Cloud Composer 2, Airflow 2 | Transfert manuel côte à côte | Guide de migration manuelle |
Cloud Composer 1, Airflow 1 | Cloud Composer 2, Airflow 2 | Transfert manuel côte à côte | Guide de migration manuelle |
Airflow 1 | Airflow 2 | Transfert manuel côte à côte | Guide de migration manuelle |
Avant de commencer
Les instantanés sont compatibles avec Cloud Composer 2 version 2.0.9 et versions ultérieures. Cloud Composer 1 est compatible avec l'enregistrement des instantanés d'environnement dans la version 1.18.5.
Cloud Composer prend en charge la migration côte à côte de Cloud Composer 1 vers Cloud Composer 2. Il n'est pas possible de passer de Cloud Composer 1 à Cloud Composer 2 en place.
Consultez la liste des différences entre Cloud Composer 1 et Cloud Composer. Cloud Composer 2.
La taille maximale de la base de données Airflow compatible avec les instantanés est de 20 Go. Si la base de données de votre environnement prend supérieure à 20 Go, réduire la taille de la base de données Airflow.
Le nombre total d'objets dans les dossiers
/dags
,/plugins
et/data
dans le bucket de l'environnement doit être inférieur à 100 000 créer des instantanés.Si vous utilisez le mécanisme XCom pour transférer des fichiers, assurez-vous de l'utiliser conformément aux consignes d'Airflow. Le transfert de fichiers volumineux ou d'un grand nombre de fichiers à l'aide de XCom a un impact sur les performances de la base de données Airflow et peut entraîner des échecs lors du chargement d'instantanés ou de la mise à niveau de votre environnement. Pensez à utiliser des solutions alternatives telles que Cloud Storage pour transférer de grands volumes de données.
Étape 1 : Suspendre les DAG dans votre environnement Cloud Composer 1
Pour éviter les exécutions de DAG en double, suspendez tous les DAG de votre environnement Cloud Composer 1 avant d'enregistrer son instantané.
Vous pouvez utiliser l'une des options suivantes :
Dans l'interface Web Airflow, procédez comme suit : accédez aux DAG et suspendez manuellement tous les DAG.
Utilisez le script composer_dags pour suspendre tous les DAG:
python3 composer_dags.py --environment COMPOSER_1_ENV \ --project PROJECT_ID \ --location COMPOSER_1_LOCATION \ --operation pause
Remplacez :
COMPOSER_1_ENV
par le nom de votre environnement Cloud Composer 1.PROJECT_ID
par l'ID du projet.COMPOSER_1_LOCATION
par la région où se trouve l'environnement.
Étape 2 : Enregistrer l'instantané de votre environnement Cloud Composer 1
Console
Créez un instantané de votre environnement :
Dans la console Google Cloud, accédez à la page Environnements.
Dans la liste des environnements, cliquez sur le nom de votre Cloud Composer 1. La page Détails de l'environnement s'ouvre.
Cliquez sur Create snapshot (Créer un instantané).
Dans la boîte de dialogue Créer un instantané, cliquez sur Envoyer. Dans dans ce guide, vous enregistrez l'instantané dans Cloud Composer bucket, mais vous pouvez sélectionner un autre emplacement si vous le souhaitez.
Attendez que Cloud Composer crée l'instantané.
gcloud
Obtenez l'URI du bucket de votre environnement Cloud Composer 1:
Exécutez la commande suivante :
gcloud composer environments describe COMPOSER_1_ENV \ --location COMPOSER_1_LOCATION \ --format="value(config.dagGcsPrefix)"
Remplacez :
COMPOSER_1_ENV
par le nom de votre environnement Cloud Composer 1.COMPOSER_1_LOCATION
par la région dans laquelle se trouve l'environnement.
Dans le résultat, supprimez le dossier
/dags
. Le résultat est l'URI de le bucket de votre environnement Cloud Composer 1.Par exemple, remplacez
gs://us-central1-example-916807e1-bucket/dags
pargs://us-central1-example-916807e1-bucket
.
Créez un instantané de votre environnement Cloud Composer 1:
gcloud composer environments snapshots save \ COMPOSER_1_ENV \ --location COMPOSER_1_LOCATION \ --snapshot-location "COMPOSER_1_SNAPSHOTS_FOLDER"
Remplacez :
COMPOSER_1_ENV
par le nom de votre environnement Cloud Composer 1.COMPOSER_1_LOCATION
par la région où se trouve l'environnement Cloud Composer 1.COMPOSER_1_SNAPSHOTS_FOLDER
par l'URI du bucket de votre environnement Cloud Composer 1. Dans ce guide, vous enregistrez l'instantané bucket de l'environnement Cloud Composer 1, mais vous pouvez sélectionner un autre endroit, si vous le souhaitez. Si vous spécifiez un emplacement personnalisé, les comptes de service des deux environnements doivent disposer d'autorisations de lecture et d'écriture pour l'emplacement spécifié.
Étape 3: Créez un environnement Cloud Composer 2
Créez un environnement Cloud Composer 2. Vous pouvez commencez par un environnement prédéfini qui correspond à votre les besoins attendus en ressources, puis le scaling et l'optimisation de votre environnement plus loin.
Vous n'avez pas besoin de spécifier des remplacements de configuration et des variables d'environnement, puisque vous remplacez lorsque vous chargerez l'instantané de votre environnement Cloud Composer 1.
Étape 4: Chargez l'instantané dans votre environnement Cloud Composer 2
Console
Pour charger l'instantané dans votre environnement Cloud Composer 2, procédez comme suit:
Dans la console Google Cloud, accédez à la page Environnements.
Dans la liste des environnements, cliquez sur le nom de votre Cloud Composer 2. La page Détails de l'environnement s'ouvre.
Cliquez sur Charger l'instantané.
Dans la boîte de dialogue Charger un instantané, cliquez sur Parcourir.
Sélectionnez le dossier contenant l'instantané. Si vous utilisez l'emplacement par défaut pour ce guide, ce dossier se trouve dans votre environnement Cloud Composer 1 dans le dossier
/snapshots
, et son nom correspond au code temporel du l'opération d'enregistrement d'instantané. Exemple :us-central1-example-916807e1-bucket/snapshots_example-project_us-central1_example-environment/2022-01-05T18-59-00
.Cliquez sur Charger, puis attendez que Cloud Composer charge l'instantané.
gcloud
Charger l'instantané de votre environnement Cloud Composer 1 dans votre Environnement Cloud Composer 2:
gcloud composer environments snapshots load \
COMPOSER_2_ENV \
--location COMPOSER_2_LOCATION \
--snapshot-path "SNAPSHOT_PATH"
Remplacez :
COMPOSER_2_ENV
par le nom de votre environnement Cloud Composer 2.COMPOSER_2_LOCATION
par la région où se trouve l'environnement Cloud Composer 2.SNAPSHOT_PATH
par l'URI du bucket de votre environnement Cloud Composer 1, suivi du chemin d'accès à l'instantané. Par exemple,gs://us-central1-example-916807e1-bucket/snapshots/example-project_us-central1_example-environment_2022-01-05T18-59-00
.
Étape 5 : Réactiver les DAG dans l'environnement Cloud Composer 2
Vous pouvez utiliser l'une des options suivantes:
Dans l'interface Web d'Airflow, accédez à DAG et réactivez manuellement tous les DAG un par un.
Utilisez le script composer_dags pour réactiver tous les DAG :
python3 composer_dags.py --environment COMPOSER_2_ENV \ --project PROJECT_ID \ --location COMPOSER_2_LOCATION \ --operation unpause
Remplacez :
COMPOSER_2_ENV
par le nom de votre environnement Cloud Composer 2.PROJECT_ID
par l'ID du projet.COMPOSER_2_LOCATION
par la région dans laquelle se trouve l'environnement.
Étape 6: Recherchez les erreurs liées au DAG
Dans l'interface Web Airflow, accédez aux DAG et recherchez les erreurs de syntaxe des DAG signalés.
Vérifiez que les exécutions du DAG sont planifiées au bon moment.
Attendez que les exécutions du DAG se produisent dans l'environnement Cloud Composer 2 et vérifiez si elles ont réussi. Si l'exécution du DAG a réussi, ne la réactivez pas dans l'environnement Cloud Composer 1. Si vous le faites, un DAG s'exécutera à la même heure et à la même date dans votre environnement Cloud Composer 1.
Si une exécution de DAG spécifique échoue, essayez de résoudre les problèmes liés au DAG jusqu'à ce que le DAG s'exécute avec succès dans Cloud Composer 2.
Étape 7: Surveillez votre environnement Cloud Composer 2
Une fois que vous avez transféré tous les DAG et la configuration vers l'environnement Cloud Composer 2, surveillez-les pour détecter les problèmes potentiels, les exécutions de DAG ayant échoué et l'état général de l'environnement.
Si l'environnement Cloud Composer 2 s'exécute sans problème pendant une période suffisante, envisagez de supprimer l'environnement Cloud Composer 1.
Étape suivante
- Découvrez comment résoudre les problèmes liés aux DAG.
- Résoudre les problèmes de création d'environnement
- Résoudre les problèmes liés aux mises à jour de l'environnement
- Utiliser des packages de rétroportage