L'utilisation temporaire du cloud est une configuration de cloud computing dans laquelle une application s'exécute dans un cloud privé ou un centre de données sur site, et "s'étend" dans un cloud public lorsque la demande en capacité de calcul augmente. Elle agit essentiellement comme une soupape de décharge. Ainsi, lorsque l'infrastructure privée atteint sa limite, le trafic est automatiquement dirigé vers les services du cloud public pour éviter toute interruption de service. C'est un peu comme un magasin qui ouvre des caisses supplémentaires uniquement lorsque les files d'attente deviennent trop longues. La configuration de l'utilisation temporaire du cloud est un type spécifique de déploiement de cloud hybride.
Dans un modèle de scaling cloud standard, une entreprise peut essayer de tout gérer dans un seul environnement. Cependant, posséder suffisamment de serveurs physiques pour gérer le jour le plus chargé de l'année signifie que ces serveurs restent vides et inutilisés pendant les 364 autres jours. L'utilisation temporaire du cloud peut aider à résoudre ce problème, car elle permet à une entreprise de payer pour une capacité de base dans son propre centre de données et de ne payer des ressources cloud publiques supplémentaires que lorsqu'elle en a réellement besoin. Cette approche peut aider les entreprises à gérer les pics de trafic soudains, sans avoir à acheter du matériel coûteux dont elles n'ont pas besoin en permanence.
Pour comprendre le mécanisme de l'utilisation temporaire du cloud, imaginez que votre cloud privé est un réservoir d'eau. Dans des conditions normales, l'eau (le trafic de données) reste dans les limites de la capacité du réservoir. Cependant, en cas de tempête soudaine (un pic de trafic), le réservoir risque de déborder.
Dans une configuration d'utilisation temporaire du cloud, les équipes informatiques configurent un "déclencheur" ou un seuil, généralement lorsque l'utilisation des ressources atteint environ 70 à 80 %. Une fois ce seuil dépassé, le système ouvre automatiquement une vanne vers un réservoir secondaire : le cloud public. L'application continue de s'exécuter de manière fluide, et le trafic excédentaire est acheminé vers les ressources du cloud public. Une fois la tempête passée et le trafic revenu à la normale, le système ferme la vanne et met hors service les ressources du cloud public, ramenant les opérations au seul cloud privé.
Il existe différentes façons de configurer l'utilisation temporaire du cloud, selon le niveau de contrôle ou d'automatisation dont une équipe a besoin.
L'utilisation temporaire du cloud n'est pas toujours adaptée à toutes les applications, en particulier celles qui reposent sur des données complexes et sensibles qui ne peuvent pas quitter un réseau privé. Elle est généralement plus adaptée aux charges de travail dont les schémas de demande sont fluctuants, saisonniers ou imprévisibles, et pour lesquelles la vitesse et la disponibilité sont essentielles, comme dans les situations suivantes :
Les marchands sont souvent confrontés à des pics de trafic massifs lors d'événements commerciaux populaires comme le Black Friday ou le Cyber Monday. L'utilisation temporaire du cloud permet à ces entreprises de gérer des millions d'acheteurs pendant quelques jours en utilisant le cloud public, puis de revenir à leur infrastructure privée une fois la période de pointe terminée.
Les data scientists et les ingénieurs exécutent souvent des tâches de calcul hautes performances (HPC), telles que des simulations complexes, l'entraînement de modèles d'IA ou d'autres calculs intensifs comme le rendu 3D. Ces jobs peuvent nécessiter des milliers de serveurs pendant quelques heures seulement. L'utilisation temporaire du cloud permet aux équipes de louer cette puissance considérable de manière temporaire au lieu d'attendre dans une longue file d'attente de supercalculateur ou de développer un superordinateur qui sera sous-utilisé.
Les développeurs de logiciels ont souvent besoin de créer des environnements temporaires pour tester du nouveau code ou des mises à jour. Plutôt que d'occuper de l'espace sur les serveurs privés principaux, ils peuvent transférer ces environnements de test vers le cloud public. Cela permet de préserver la sécurité et la stabilité de l'environnement de production.
Si un centre de données local n'est pas disponible en raison d'une coupure de courant ou d'une catastrophe naturelle, l'utilisation temporaire du cloud peut servir de mécanisme de basculement pour la reprise après sinistre. Le système peut rediriger le trafic vers le cloud public pour que l'application continue de s'exécuter jusqu'à ce que le site principal soit réparé.
Pour implémenter l'utilisation temporaire du cloud, il ne suffit pas de disposer de deux environnements de calcul. Vous devez aussi établir une stratégie pour gérer la complexité du déplacement des données et des applications entre ces environnements. Pour ce faire, les organisations doivent disposer de fonctionnalités qui garantissent une connectivité fluide et une gestion cohérente.
L'une des méthodes les plus efficaces pour implémenter un déclencheur d'utilisation temporaire du cloud consiste à utiliser Google Kubernetes Engine (GKE) et l'autoscaler horizontal des pods (HPA) avec des métriques externes. Dans ce scénario, votre application sur site envoie un signal (une métrique) à Google Cloud Monitoring. Lorsque ce signal dépasse un seuil, GKE lance automatiquement de nouveaux pods dans le cloud pour gérer la charge.
Voici comment configurer un déclencheur basé sur la profondeur d'une file d'attente Pub/Sub (un indicateur courant de surcharge des nœuds de calcul sur site) :
1. Activer l'API des métriques personnalisées : vous devez d'abord autoriser votre cluster GKE à lire les métriques Cloud Monitoring. Pour ce faire, vous devez déployer l'adaptateur de métriques personnalisées Stackdriver sur votre cluster. Cet adaptateur sert de pont, en traduisant les métriques Google Cloud dans un format compréhensible par Kubernetes.
2. Définir la configuration HPA : créez un fichier YAML HorizontalPodAutoscaler. Contrairement à un autoscaler standard qui examine l'utilisation du processeur, celui-ci examine une métrique externe, à savoir le nombre de messages non distribués dans un abonnement Pub/Sub (num_undelivered_messages).
3. Appliquer et surveiller : appliquez cette configuration à l'aide de la commande kubectl apply -f hpa.yaml . GKE "surveille" alors votre file d'attente. Si votre système sur site ralentit et que la file d'attente dépasse la cible (50 messages), l'autoscaler horizontal des pods déclenche automatiquement la création de nouveaux pods dans le cloud pour traiter les messages en attente. Une fois la file d'attente vide, GKE réduit le nombre de pods à zéro.
Il n'est pas possible de gérer ce que l'on ne voit pas. Pour que l'utilisation temporaire du cloud fonctionne, les équipes informatiques doivent avoir une vision claire de leurs ressources, à la fois dans leur centre de données privé et dans le cloud public. Google Cloud propose des outils offrant une visibilité précise sur la façon dont les applications utilisent le processeur et la mémoire.
En comprenant exactement la quantité de "carburant" qu'une application consomme, les équipes peuvent définir des seuils précis à partir desquels l'utilisation temporaire du cloud doit être activée. Si le seuil est trop bas, vous risquez de dépenser de l'argent dans le cloud public alors que ce n'est pas nécessaire. S'il est trop élevé, l'application risque de planter avant l'arrivée des nouvelles ressources. La surveillance unifiée aide les organisations à affiner ces paramètres pour équilibrer les performances et les coûts.
L'équilibrage manuel convient aux petits projets peu fréquents, mais il n'est pas adapté aux applications d'entreprise. Pour gagner en efficacité, les entreprises peuvent implémenter des logiciels et des outils qui orchestrent automatiquement les ressources de cloud computing. Les outils d'automatisation, tels que Terraform ou Deployment Manager de Google Cloud, peuvent vous aider à définir l'infrastructure en tant que code (IaC).
Cela signifie que le système peut provisionner, configurer et gérer les serveurs automatiquement en fonction de la demande en temps réel. Lorsque le pic de trafic retombe, les outils d'automatisation gèrent également le déprovisionnement ou l'arrêt de ces ressources. Cela permet à l'entreprise d'arrêter de payer pour le cloud public dès qu'il n'est plus nécessaire.
Il est essentiel de garder le contrôle pendant un pic d'activité pour gérer la sécurité et le budget. Les organisations ont besoin d'une fonctionnalité de surveillance robuste pour suivre les ressources et s'assurer qu'elles sont correctement provisionnées sans interruption de service.
Les outils de reporting permettent de suivre le coût de l'utilisation temporaire du cloud dans le temps. Ces données sont essentielles pour prédire les budgets futurs. De plus, des règles de sécurité cohérentes doivent s'appliquer aux ressources utilisées lors des pics d'activité. Les outils de surveillance et de reporting peuvent aider à réduire les coûts et à accroître l'efficacité dans le temps en identifiant les tendances et les anomalies dans l'utilisation.
L'adoption d'une stratégie d'utilisation temporaire du cloud peut offrir plusieurs avantages aux organisations qui cherchent à trouver un équilibre entre performances et budget.
Économies
Les entreprises ne paient les ressources de cloud public supplémentaires que lorsqu'elles les utilisent, ce qui permet d'éviter les dépenses d'investissement liées à l'achat de matériel qui reste inutilisé pendant les périodes creuses.
Flexibilité et évolutivité
Les équipes peuvent ainsi tester de nouveaux projets ou gérer des pics de trafic importants, sans être limitées par l'espace physique ou la puissance disponible dans leur propre centre de données.
Continuité de l'activité et résilience
Si le centre de données privé rencontre un problème ou est surchargé, l'application reste en ligne en transférant la charge vers le cloud public, ce qui permet d'éviter les plantages et les temps d'arrêt.
Optimisation des ressources
Les équipes informatiques peuvent maintenir leur cloud privé à un niveau stable et efficace pour les tâches critiques, tout en déchargeant le trafic variable et imprévisible dans le cloud public flexible.
Si le concept d'utilisation temporaire du cloud est universel, l'infrastructure qui le prend en charge varie considérablement d'un fournisseur à l'autre. Google Cloud offre des avantages spécifiques qui rendent l'utilisation temporaire hybride plus rapide, plus fiable et plus facile à gérer.
Commencez à créer des applications sur Google Cloud avec 300 $ de crédits et plus de 20 produits toujours sans frais.