Cette page a été traduite par l'API Cloud Translation.

Utiliser l'autoscaling pour des applications hautement évolutives

Ce tutoriel explique comment utiliser l'autoscaling afin d'ajuster automatiquement le nombre d'instances de VM qui hébergent votre application, permettant ainsi à cette dernière d'être adaptée à différentes quantités de trafic.

Pour utiliser l'autoscaling, hébergez votre application sur un groupe d'instances géré. Un groupe d'instances géré est composé d'une collection d'instances qui exécutent toutes la même application et peuvent être gérées en tant qu'entité unique. Lorsque l'autoscaling est activé pour un groupe d'instances géré, le nombre de VM de ce groupe augmente (scaling horizontal) ou diminue automatiquement (scaling vertical) en fonction de la valeur cible que vous spécifiez pour votre règle d'autoscaling.

Ce tutoriel inclut les étapes détaillées permettant de lancer une application Web sur un groupe d'instances géré, configurer l'autoscaling, configurer l'accès au réseau et observer l'autoscaling en simulant des pics et des baisses de trafic. En fonction de vos connaissances sur ces fonctionnalités, il vous faudra environ 20 minutes pour terminer ce tutoriel.

Objectifs

Lancer une application Web de démonstration sur un groupe d'instances géré.
Observer les effets de l'autoscaling en simulant des pics et des baisses de trafic.

Coûts

Dans ce document, vous utilisez les composants facturables suivants de Google Cloud :

Compute Engine

Obtenez une estimation des coûts en fonction de votre utilisation prévue à l'aide du simulateur de coût. Les nouveaux utilisateurs de Google Cloud peuvent bénéficier d'un essai gratuit.

Avant de commencer

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

Make sure that billing is enabled for your Google Cloud project.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

Make sure that billing is enabled for your Google Cloud project.

Architecture de l'application

L'application inclut les composants Compute Engine ci-dessous.

Règle de pare-feu : pare-feu Google Cloud qui vous permet d'autoriser ou de refuser le trafic vers vos instances.
Modèle d'instance : modèle utilisé pour créer chaque instance de VM dans le groupe d'instances géré.
Groupe d'instances géré régional : groupe d'instances de VM exécutant la même application sur plusieurs zones.

Lancer l'application Web

Ce tutoriel utilise une application Web stockée sur GitHub. Si vous souhaitez en savoir plus sur la mise en œuvre de l'application, consultez le dépôt GoogleCloudPlatform/python-docs-samples sur GitHub.

Lancez l'application Web sur chaque VM d'un groupe d'instances géré en incluant un script de démarrage dans un modèle d'instance. Pour autoriser le trafic HTTP vers l'application Web, créez une règle de pare-feu.

Créer une règle de pare-feu

Créez une règle de pare-feu pour autoriser le trafic HTTP vers l'application Web. Procédez comme suit :

Dans Google Cloud Console, accédez à la page Pare-feu.

Accéder à la page Pare-feu
Cliquez sur Créer une règle de pare-feu.
Dans le champ Nom, saisissez default-allow-http.
Définissez le paramètre Réseau sur default.
Pour le paramètre Cibles, sélectionnez Specified target tags.
Dans le champ Tags cibles, saisissez http-server.
Définissez Filtre source sur IPv4 ranges.
Sous Plages IPv4 sources, saisissez 0.0.0.0/0.

pour autoriser l'accès pour toutes les adresses IP.
Dans Protocoles et ports, sélectionnez Protocoles et ports spécifiés. Puis, sélectionnez TCP et saisissez 80 pour autoriser l'accès du trafic HTTP.
Cliquez sur Créer.

Créer un modèle d'instance

Créez un modèle d'instance pour lancer l'application Web de démonstration au démarrage. Procédez comme suit :

Dans Google Cloud Console, accédez à la page Modèles d'instances.

Accéder à la page Modèles d'instances
Cliquez sur Create instance template (Créer un modèle d'instance).
Dans le champ Nom, saisissez autoscaling-web-app-template.
Sous Configuration de la machine, définissez le type de machine sur e2-standard-2.
Sous Pare-feu, cochez la case Autoriser le trafic HTTP. Cette action attribue le tag de mise en réseau http-server à chaque instance créée à partir de ce modèle.
Développez la section Options avancées pour afficher les paramètres avancés.
Développez la section Gestion.

Dans le champ Automatisation, saisissez le script de démarrage suivant :

sudo apt update && sudo apt -y install git gunicorn3 python3-pip
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git
cd python-docs-samples/compute/managed-instances/demo
sudo pip3 install -r requirements.txt
sudo gunicorn3 --bind 0.0.0.0:80 app:app --daemon

Avec ce script, chaque VM va exécuter l'application Web au démarrage.

Cliquez sur Créer.

Créer un groupe d'instances géré

Pour exécuter l'application Web, créez un groupe d'instances régional. Procédez comme suit :

Dans Google Cloud Console, accédez à la page Groupes d'instances.

Accéder à la page "Groupes d'instances"
Cliquez sur Créer un groupe d'instances pour définir un nouveau groupe d'instances.
Sélectionnez Nouveau groupe d'instances géré (sans état).
Dans le champ Nom, saisissez autoscaling-web-app-group.
Pour Modèle d'instance, sélectionnez autoscaling-web-app-template.
Pour Emplacement, sélectionnez Plusieurs zones.

Conseil de pro : Pour vous assurer que votre application est disponible lors d'événements extrêmes, tels qu'une panne de zone, Compute Engine vous recommande de distribuer votre application sur plusieurs zones.
Dans le champ Region (Région), sélectionnez us-central1.
Pour Zones, sélectionnez les zones suivantes dans la liste déroulante :
- us-central1-b
- us-central1-c
- us-central1-f
Configurez l'autoscaling pour le groupe d'instances :
1. Dans le champ Mode autoscaling, sélectionnez Activé : ajouter et supprimer des instances dans le groupe.
2. Définissez le nombre minimal d'instances sur 3.
  
  Conseil de pro : Lors de la création d’un groupe d’instances géré régional, Compute Engine vous recommande de provisionner suffisamment d’instances afin que, si toutes les instances d’une zone sont indisponibles, le nombre d'instances restantes soit toujours conforme au nombre minimal d’instances requis. Toutefois, le provisionnement d'un nombre d'instances supérieur à vos besoins peut entraîner des coûts supplémentaires. Pour plus d'informations, consultez la section sur la sélection de la taille du groupe d'instances pour assurer la disponibilité.
3. Définissez le nombre maximal d'instances sur 6.
4. Définissez la Période d'initialisation sur 120 secondes.
  
  Conseil de pro : La période d'initialisation correspond au nombre de secondes attendues par l'autoscaler après la création d'une instance avant d'utiliser les informations de l'instance pour prendre des décisions de dimensionnement. Lorsqu'une VM est en cours d'initialisation, l'utilisation du processeur n'est pas fiable pour l'autoscaling. Pour éviter que l'autoscaler utilise des données inexactes, assurez-vous que la période d'initialisation est supérieure au temps nécessaire à la stabilisation initiale de l'utilisation du processeur de votre VM. Pour en savoir plus, consultez les sections Période d'initialisation et Journaux et graphiques d'autoscaling Monitoring.
5. Sous Métriques d'autoscaling, sélectionnez Utilisation du processeur comme type de métrique. Pour en savoir plus sur les métriques d'autoscaling, consultez la page Règle d'autoscaling.
6. Définissez le paramètre Objectif d'utilisation du processeur sur 60.
7. Cliquez sur OK.
Sous Autoréparation, sélectionnez Aucune vérification d'état dans la liste déroulante Vérification de l'état.
Cliquez sur Créer. Cette action vous redirige vers la page Groupes d'instances.
Remarque : Il va s'écouler quelques minutes avant que toutes les instances du groupe ne soient en cours d'exécution et prêtes à afficher l'application Web.
Pour vérifier que les instances sont en cours d'exécution, procédez comme suit :
1. Sur la page Groupes d'instances de la console Google Cloud, cliquez sur autoscaling-web-app-group pour afficher les instances de ce groupe.
2. Sous Adresse IP externe, cliquez sur une adresse IP pour connecter cette instance. Un nouvel onglet de navigation s'ouvre, affichant l'application Web de démonstration :
  Remarque : Si après plusieurs minutes vous n'arrivez pas à vous connecter à l'application Web, vérifiez l'état de l'instance et les paramètres réseau :
  - Vérifiez que le groupe d'instances est prêt. Si le chargement de l'application échoue et affiche un état "ERR_CONNECTION_REFUSED", attendez quelques minutes que le script de démarrage finisse de s'exécuter.
  - Vérifiez que le paramètre Autoriser le trafic HTTP est activé pour le modèle du groupe d'instances. Ensuite, vérifiez que la règle de pare-feu allow-web-app-http a été correctement créée.
  Lorsque vous avez terminé, fermez l'onglet de l'application Web de démonstration.

Observer l'autoscaling

Pour en savoir plus sur les comportements de l'autoscaling, consultez la documentation sur la présentation des décisions d'autoscaling.

Surveiller l'autoscaling

Le groupe d'instances que vous avez créé utilise des règles d'autoscaling basées sur l'utilisation du processeur. Cela signifie que l'autoscaler augmente ou réduit la taille du groupe au besoin, afin de maintenir le pourcentage d'utilisation du processeur cible à 60 %.

Pour contrôler la taille et l'utilisation moyenne du processeur de votre groupe d'instances, utilisez les graphiques d'évolution automatique dans la console Google Cloud :

Sur la page Groupes d'instances du groupe autoscaling-web-app-group, cliquez sur l'onglet Surveillance.
Vous pouvez surveiller l'autoscaling à partir du graphique Taille du groupe. Le graphique affiche Instances, ce qui correspond au nombre d'instances de VM dans le groupe au fil du temps.
Facultatif : Pour surveiller la capacité avec évolutivité automatique par rapport à l'utilisation, consultez le graphique Utilisation de l'autoscaler (processeur). Le graphique affiche Utilisation, ce qui correspond à l'utilisation totale du processeur par les instances de VM du groupe, et Capacité, ce qui correspond à l'utilisation cumulée du processeur du groupe (utilisation du processeur cible multipliée par le nombre d'instances de VM).

L'autoscaling s'efforce de faire correspondre la capacité et l'utilisation en modifiant le nombre d'instances, lorsque cela est possible.

Laissez cette fenêtre ouverte.

Simuler un scaling horizontal

On parle de "scaling horizontal" lorsque l'utilisation moyenne du processeur du groupe d'instances est considérablement plus grande que la valeur cible. Pendant cette opération, l'autoscaler augmente progressivement la taille du groupe d'instances de sorte que l'utilisation du processeur diminue jusqu'à atteindre la valeur cible d'utilisation du processeur ou jusqu'à ce que la taille du groupe d'instances soit égale au nombre maximal d'instances, qui a été défini sur 6.

Pour déclencher un scaling horizontal, augmentez l'utilisation du processeur pour vos instances :

Dans la console Google Cloud, ouvrez Cloud Shell.

Ouvrir Cloud Shell

Cloud Shell s'ouvre au bas de la console Google Cloud. L'initialisation de la session peut prendre quelques secondes.

Conseil de pro :
Vous pouvez ouvrir Cloud Shell à partir de n'importe quelle page de la console Google Cloud à l'aide du bouton Activer Cloud Shell qui se situe dans le coin supérieur droit de chaque page de la console Google Cloud.
Créez une variable bash locale pour l'ID de projet :
```
export PROJECT_ID=[PROJECT_ID]
```
où PROJECT_ID correspond à l'ID du projet en cours, et est affiché sur chaque ligne dans Cloud Shell :
```
user@cloudshell:~ ([PROJECT_ID])$
```

Exécutez le script bash ci-dessous. Ce script entraîne une augmentation de charge de l'application Web de démonstration, ce qui entraîne l'augmentation de l'utilisation du processeur. Après quelques minutes, l'utilisation du processeur dépasse la valeur cible ce qui déclenche l'augmentation de la taille du groupe d'instances par l'autoscaling.

export MACHINES=$(gcloud --project=$PROJECT_ID compute instances list --format="csv(name,networkInterfaces[0].accessConfigs[0].natIP)" | grep "autoscaling-web-app-group")
for i in $MACHINES;
do
  NAME=$(echo "$i" | cut -f1 -d,)
  IP=$(echo "$i" | cut -f2 -d,)
  echo "Simulating high load for instance $NAME"
  curl -q -s "http://$IP/startLoad" >/dev/null --retry 2
done

Ouvrez l'onglet Surveillance dans la console Google Cloud.

Après quelques minutes, l'onglet Surveillance indique que l' Utilisation du processeur a augmenté. L'autoscaling augmente alors la Capacité en augmentant le nombre d'Instances.
Remarque : Il vous faudra peut-être actualiser la page pour afficher le graphique le plus récent.
Notez également que six instances sont désormais répertoriées sous l'onglet Aperçu.

Gardez les deux fenêtres ouvertes.

Simuler un scaling vertical

On parle de "scaling vertical" lorsque l'utilisation moyenne du processeur du groupe d'instances est considérablement plus faible que la valeur cible. Pendant cette opération, l'autoscaler diminue progressivement la taille du groupe d'instances de sorte que l'utilisation du processeur augmente jusqu'à atteindre l'utilisation cible du processeur ou jusqu'à ce que la taille du groupe d'instances soit égale au nombre minimal d'instances, qui a été défini sur 3.

Pour déclencher un scaling vertical, réduisez l'utilisation du processeur pour vos instances :

Exécutez le script bash ci-dessous. Ce script entraîne une diminution de charge de l'application Web de démonstration, ce qui entraîne une diminution de l'utilisation du processeur. Après quelques minutes, l'utilisation du processeur devient inférieure à la valeur cible, entraînant la diminution de la taille du groupe d'instances par l'autoscaler.

export MACHINES=$(gcloud --project=$PROJECT_ID compute instances list --format="csv(name,networkInterfaces[0].accessConfigs[0].natIP)" | grep "autoscaling-web-app-group")
for i in $MACHINES;
do
  NAME=$(echo "$i" | cut -f1 -d,)
  IP=$(echo "$i" | cut -f2 -d,)
  echo "Simulating low load for instance $NAME"
  curl -q -s "http://$IP/stopLoad" >/dev/null --retry 2
done

Ouvrez l'onglet Surveillance dans la console Google Cloud.

Après quelques minutes, l'onglet Surveillance affiche la diminution de l'utilisation du processeur. Après la période de stabilisation, qui permet de vérifier que la charge est considérablement moins importante, l'autoscaling diminue la capacité en réduisant le nombre d'Instances :
Remarque : Il vous faudra peut-être actualiser la page pour afficher le graphique le plus récent.
Notez également que seulement trois instances sont répertoriées sous l'onglet Aperçu.

Fermez les deux fenêtres lorsque vous avez terminé.

Nettoyer

Une fois le tutoriel terminé, vous pouvez procéder au nettoyage des ressources que vous avez créées afin qu'elles ne soient plus comptabilisées dans votre quota et qu'elles ne vous soient plus facturées. Dans les sections suivantes, nous allons voir comment supprimer ou désactiver ces ressources.

Si vous avez créé un projet distinct pour ce tutoriel, supprimez-le entièrement. Ou bien, si le projet contient des ressources que vous souhaitez conserver, ne supprimez que les ressources créées spécifiquement pour ce tutoriel.

Supprimer le projet

Attention : La suppression d'un projet entraîne les effets décrits ci-dessous :

Tout le contenu du projet est supprimé. Si vous avez utilisé un projet existant pour les tâches décrites dans ce document et que vous le supprimez, vous supprimerez également tout autre travail effectué dans le projet.
Les ID de projets personnalisés sont perdus. Lorsque vous avez créé ce projet, vous avez peut-être créé un ID de projet personnalisé que vous souhaitez utiliser à l'avenir. Pour conserver les URL qui utilisent l'ID de projet, telle qu'une URL appspot.com, supprimez les ressources sélectionnées dans le projet au lieu de supprimer l'ensemble du projet.

Si vous envisagez d'explorer plusieurs architectures, tutoriels et guides de démarrage rapide, réutiliser des projets peut vous aider à ne pas dépasser les limites de quotas des projets.

In the Google Cloud console, go to the Manage resources page.
Go to Manage resources
In the project list, select the project that you want to delete, and then click Delete.
In the dialog, type the project ID, and then click Shut down to delete the project.

Supprimer des ressources spécifiques

Supprimer le groupe d'instances

In the Google Cloud console, go to the Instance groups page.
Go to Instance groups
Select the checkbox for your autoscaling-web-app-group instance group.
To delete the instance group, click Delete.

Supprimer le modèle d'instance

Dans Google Cloud Console, accédez à la page Modèles d'instances.

Accéder à la page Modèles d'instances
Cochez la case en regard de autoscaling-web-app-template.
Cliquez sur Supprimer en haut de la page. Dans la nouvelle fenêtre, cliquez sur Supprimer pour confirmer la suppression.

Supprimer la règle de pare-feu

Dans Google Cloud Console, accédez à la page Règles de pare-feu.

Accéder aux règles de pare-feu
Cochez la case située en regard de la règle de pare-feu intitulée default-allow-http.
Cliquez sur Supprimer. Dans la nouvelle fenêtre, cliquez sur Supprimer pour confirmer la suppression.

Étape suivante

Essayez un autre tutoriel
- Utilisez l'autoréparation pour les applications à disponibilité élevée
- Utiliser l'équilibrage de charge pour les applications à disponibilité élevée
Apprenez-en plus sur les groupes d'instances gérés.
Apprenez-en plus sur l'autoscaling.
Apprenez-en plus sur la conception de systèmes robustes.
Apprenez-en plus sur la création d'applications Web évolutives et résilientes sur Google Cloud.