Une infrastructure fiable est une exigence critique pour les charges de travail dans le cloud. En tant qu'architecte cloud, vous devez bien comprendre les capacités de fiabilité du fournisseur cloud de votre choix pour concevoir une infrastructure fiable pour vos charges de travail. Ce document décrit les composants fondamentaux de la fiabilité dans Google Cloud (zones, régions et ressources à l'échelle de l'emplacement) et les niveaux de disponibilité qu'ils fournissent. Ce document fournit également des instructions pour évaluer les exigences de fiabilité de vos charges de travail, et présente des recommandations architecturales pour la création et la gestion d'une infrastructure fiable dans Google Cloud.
Ce document se compose des parties suivantes :
- Présentation de la fiabilité (cette partie)
- Composants fondamentaux de la fiabilité dans Google Cloud
- Évaluez les exigences de fiabilité de vos charges de travail cloud
- Concevoir une infrastructure fiable pour vos charges de travail dans Google Cloud
- Gérer le trafic et la charge pour vos charges de travail dans Google Cloud
- Gérez et surveillez votre infrastructure Google Cloud
Si vous avez déjà lu ce guide et que vous avez besoin d'un résumé des modifications, consultez la section Journal des modifications.
Présentation de la fiabilité
Une application ou une charge de travail est fiable lorsqu'elle répond à vos objectifs de disponibilité et de résilience aux pannes.
La disponibilité (ou temps d'activité) correspond au pourcentage de durée d'utilisation d'une application. Par exemple, pour une application dont la cible de disponibilité est de 99,99 %, le temps d'arrêt total ne doit pas dépasser 8,64 secondes sur une période de 24 heures. Parfois, la disponibilité est mesurée en tant que proportion de requêtes que l'application réussit à diffuser pendant une période donnée. Par exemple, pour une application ayant une cible de disponibilité de 99,99 %, un nombre maximal de 10 requêtes en échec toutes les 100 000 requêtes reçues ne doit pas être dépassé. La disponibilité est souvent exprimée en nombres de chiffres neuf dans le pourcentage. Par exemple, une disponibilité de 99,99 % est exprimée par "'4 chiffres neuf".
En fonction de l'objectif de l'application, vous pouvez avoir différents ensembles d'indicateurs de fiabilité. Voici quelques exemples de ces indicateurs de fiabilité :
- Pour les applications qui diffusent du contenu, la disponibilité, la latence et le débit sont des indicateurs de fiabilité importants. Ils indiquent si l'application peut répondre aux requêtes, le temps nécessaire pour y répondre et le nombre de requêtes que l'application peut traiter au cours d'une période donnée.
- Pour les bases de données et les systèmes de stockage, la latence, le débit, la disponibilité et la durabilité (niveau de protection des données contre les pertes ou la corruption) sont des indicateurs de fiabilité. Elles indiquent le temps nécessaire au système pour lire ou écrire des données, et si les données sont accessibles à la demande.
- Pour les charges de travail de big data et d'analyse telles que les pipelines de traitement de données, les performances constantes du pipeline (débit et latence) sont essentielles pour garantir l'actualisation des produits de données et constituent un indicateur de fiabilité important. Il indique la quantité de données pouvant être traitées et le temps nécessaire au pipeline pour passer de l'ingestion de données au traitement de données.
- La plupart des applications présentent l'exactitude des données comme un indicateur de fiabilité essentiel.
Pour en savoir plus sur la définition des objectifs de fiabilité de vos applications, consultez la page Évaluer les exigences de fiabilité pour vos charges de travail cloud.
Facteurs ayant une incidence sur la fiabilité des applications
La fiabilité d'une application déployée dans Google Cloud dépend des facteurs suivants :
- Conception interne de l'application
- Les applications ou les composants secondaires dont dépend l'application
- Ressources d'infrastructure Google Cloud sur le calcul de l'application, telles que le calcul, la mise en réseau, le stockage, les bases de données et la sécurité, et la manière dont l'application utilise l'infrastructure
- La capacité de l'infrastructure que vous provisionnez et son évolutivité
- Les processus et outils DevOps que vous utilisez pour créer, déployer et gérer l'application, ses dépendances et l'infrastructure Google Cloud
Ces facteurs sont résumés dans le schéma suivant :
Comme le montre le schéma précédent, la fiabilité d'une application déployée dans Google Cloud dépend de plusieurs facteurs. Ce guide traite de la fiabilité de l'infrastructure Google Cloud.
Étapes suivantes
- Composants fondamentaux de la fiabilité dans Google Cloud
- Évaluez les exigences de fiabilité de vos charges de travail cloud
- Concevoir une infrastructure fiable pour vos charges de travail dans Google Cloud
- Gérer le trafic et la charge pour vos charges de travail dans Google Cloud
- Gérez et surveillez votre infrastructure Google Cloud
Contributeurs
Auteurs :
- Nir Tarcic | UTL pour l'ingénierie SRE de Cloud Lifecycle
- Kumar Dhanagopal Développeur de solutions multiproduits
Autres contributeurs :
- Alok Kumar | Ingénieur primé
- Andrew Fikes | Engineering Fellow, Fiabilité
- Chris Heiser | SRE TLN
- David Ferguson | Directeur, ingénierie en fiabilité des sites (SRE)
- Joe Tan | Conseiller senior en produits
- Krzysztof Duleba | Ingénieur principal
- Narayan Desai | Ingénierie SRE principale
- Sailesh Krishnamurthy | Vice-président de l'ingénierie
- Steve McGhee | Reliability Advocate
- Sudhanshu Jain | Responsable produit
- Yaniv Aknin | Ingénieur logiciel