Le pilier "Excellence opérationnelle" du framework d'architecture Google Cloud fournit des recommandations pour exploiter efficacement les charges de travail sur Google Cloud. L'excellence opérationnelle dans le cloud implique de concevoir, d'implémenter et de gérer des solutions cloud qui offrent de la valeur, des performances, de la sécurité et de la fiabilité. Les recommandations de ce pilier vous aident à améliorer et à adapter en permanence vos charges de travail pour répondre aux besoins dynamiques et en constante évolution du cloud.
Le pilier "Excellence opérationnelle" est pertinent pour les audiences suivantes:
- Gestionnaires et responsables: cadre permettant d'établir et de maintenir l'excellence opérationnelle dans le cloud, et de s'assurer que les investissements dans le cloud apportent de la valeur et soutiennent les objectifs commerciaux.
- Équipes Cloud Operations: conseils pour gérer les incidents et les problèmes, planifier la capacité, optimiser les performances et gérer le changement.
- Ingénieurs en fiabilité des sites (SRE): bonnes pratiques qui vous aident à atteindre des niveaux élevés de fiabilité de service, y compris la surveillance, la gestion des incidents et l'automatisation.
- Architectes et ingénieurs cloud: exigences opérationnelles et bonnes pratiques pour les phases de conception et d'implémentation, afin de s'assurer que les solutions sont conçues pour l'efficacité et l'évolutivité opérationnelles.
- Équipes DevOps: conseils sur l'automatisation, les pipelines CI/CD et la gestion des changements pour accélérer et fiabiliser la livraison de logiciels.
Pour atteindre l'excellence opérationnelle, vous devez adopter l'automatisation, l'orchestration et les insights basés sur les données. L'automatisation permet d'éliminer les tâches laborieuses. Il simplifie également les tâches répétitives et crée des garde-fous. L'orchestration permet de coordonner des processus complexes. Les insights basés sur les données permettent une prise de décision basée sur des preuves. En suivant ces pratiques, vous pouvez optimiser les opérations cloud, réduire les coûts, améliorer la disponibilité des services et renforcer la sécurité.
L'excellence opérationnelle dans le cloud va au-delà de la maîtrise technique des opérations cloud. Elle implique un changement culturel qui encourage l'apprentissage et l'expérimentation continus. Les équipes doivent être habilitées à innover, à itérer et à adopter un état d'esprit axé sur la croissance. Une culture d'excellence opérationnelle favorise un environnement collaboratif dans lequel les individus sont encouragés à partager leurs idées, à remettre en question les hypothèses et à améliorer les choses.
Pour connaître les principes et recommandations d'excellence opérationnelle spécifiques aux charges de travail d'IA et de ML, consultez la section Perspective IA et ML: excellence opérationnelle du framework d'architecture.
Les recommandations du pilier "Excellence opérationnelle" du framework d'architecture sont mappées sur les principes de base suivants pour l'automatisation, l'orchestration et les insights basés sur les données:
- Assurer la préparation opérationnelle et les performances à l'aide de CloudOps : assurez-vous que les solutions cloud répondent aux exigences opérationnelles et de performances en définissant des objectifs de niveau de service (SLO), et en effectuant une surveillance, des tests de performances et une planification de la capacité complètes.
- Gérer les incidents et les problèmes : minimisez l'impact des incidents cloud et évitez leur récurrence grâce à une observabilité complète, à des procédures de réponse aux incidents claires, à des rétrospectives approfondies et à des mesures préventives.
- Gérer et optimiser les ressources cloud : optimisez et gérez les ressources cloud à l'aide de stratégies telles que l'ajustement de la taille, l'ajustement automatique et l'utilisation d'outils de surveillance des coûts efficaces.
- Automatisez et gérez le changement : automatisez les processus, simplifiez la gestion du changement et allégez la charge de travail manuel.
- Améliorez et innovez en continu : concentrez-vous sur les améliorations continues et l'introduction de nouvelles solutions pour rester compétitif.
Contributeurs
Auteurs :
- Ryan Cox | Architecte principal
- Hadrian Knoz | Architecte d'entreprise
Autres contributeurs :
- Daniel Lees | Architecte en sécurité cloud
- Dr Felipe Gracio | Ingénieur client
- Gary Harmson | Ingénieur client
- Jose Andrade | Ingénieur client Enterprise Infrastructure
- Kumar Dhanagopal Développeur de solutions multiproduits
- Nicolas Pinteaux | Ingénieur client, spécialiste de la modernisation des applications
- Radhika Kanakam | Senior Program Manager, Cloud GTM
- Zach Seils | Spécialiste en gestion des réseaux
- Wade Holmes | Directeur des solutions mondiales