Cette page a été traduite par l'API Cloud Translation.

Framework d'architecture Google Cloud : excellence opérationnelle

Last reviewed 2024-10-31 UTC

Le pilier de l'excellence opérationnelle du framework d'architectureGoogle Cloud fournit des recommandations pour exploiter efficacement les charges de travail sur Google Cloud. L'excellence opérationnelle dans le cloud implique de concevoir, d'implémenter et de gérer des solutions cloud qui offrent de la valeur, des performances, de la sécurité et de la fiabilité. Les recommandations de ce pilier vous aident à améliorer et à adapter en permanence vos charges de travail pour répondre aux besoins dynamiques et en constante évolution du cloud.

Le pilier "Excellence opérationnelle" est pertinent pour les audiences suivantes:

Gestionnaires et responsables: cadre permettant d'établir et de maintenir l'excellence opérationnelle dans le cloud, et de s'assurer que les investissements cloud apportent de la valeur et soutiennent les objectifs commerciaux.
Équipes d'exploitation cloud: conseils pour gérer les incidents et les problèmes, planifier la capacité, optimiser les performances et gérer le changement.
Ingénieurs en fiabilité des sites (SRE): bonnes pratiques qui vous aident à atteindre des niveaux élevés de fiabilité de service, y compris la surveillance, la gestion des incidents et l'automatisation.
Architectes et ingénieurs cloud: exigences opérationnelles et bonnes pratiques pour les phases de conception et d'implémentation, afin de s'assurer que les solutions sont conçues pour l'efficacité et l'évolutivité opérationnelles.
Équipes DevOps: conseils sur l'automatisation, les pipelines CI/CD et la gestion du changement pour vous aider à assurer une livraison de logiciels plus rapide et plus fiable.

Pour atteindre l'excellence opérationnelle, vous devez adopter l'automatisation, l'orchestration et les insights basés sur les données. L'automatisation permet d'éliminer les tâches laborieuses. Il simplifie également les tâches répétitives et crée des garde-fous. L'orchestration permet de coordonner des processus complexes. Les insights basés sur les données permettent une prise de décision basée sur des preuves. En suivant ces pratiques, vous pouvez optimiser les opérations cloud, réduire les coûts, améliorer la disponibilité des services et renforcer la sécurité.

L'excellence opérationnelle dans le cloud va au-delà de la maîtrise technique des opérations cloud. Elle implique un changement culturel qui encourage l'apprentissage et l'expérimentation continus. Les équipes doivent être habilitées à innover, à itérer et à adopter un état d'esprit axé sur la croissance. Une culture d'excellence opérationnelle favorise un environnement collaboratif dans lequel les individus sont encouragés à partager leurs idées, à remettre en question les hypothèses et à améliorer les processus.

Pour connaître les principes et recommandations d'excellence opérationnelle spécifiques aux charges de travail d'IA et de ML, consultez la section Perspective IA et ML: excellence opérationnelle du framework d'architecture.

Principes de base

Les recommandations du pilier "Excellence opérationnelle" du framework d'architecture sont mappées sur les principes de base suivants:

Assurer la préparation opérationnelle et les performances à l'aide de CloudOps : assurez-vous que les solutions cloud répondent aux exigences opérationnelles et de performances en définissant des objectifs de niveau de service (SLO), et en effectuant une surveillance, des tests de performances et une planification de la capacité complètes.
Gérer les incidents et les problèmes : minimisez l'impact des incidents cloud et évitez leur récurrence grâce à une observabilité complète, à des procédures de réponse aux incidents claires, à des rétrospectives approfondies et à des mesures préventives.
Gérer et optimiser les ressources cloud : optimisez et gérez les ressources cloud à l'aide de stratégies telles que l'ajustement de la taille, l'ajustement automatique et l'utilisation d'outils de surveillance des coûts efficaces.
Automatiser et gérer le changement : automatisez les processus, simplifiez la gestion du changement et allégez la charge de travail manuel.
Améliorez et innovez en continu : concentrez-vous sur les améliorations continues et l'introduction de nouvelles solutions pour rester compétitif.

Contributeurs

Auteurs :

Ryan Cox | Architecte principal
Hadrian Knoz | Architecte d'entreprise

Autres contributeurs :

Daniel Lees | Architecte en sécurité cloud
Dr Felipe Gracio | Ingénieur client
Gary Harmson | Ingénieur client
Jose Andrade | Ingénieur client Enterprise Infrastructure
Kumar Dhanagopal Développeur de solutions multiproduits
Nicolas Pinteaux | Ingénieur client, spécialiste de la modernisation des applications
Radhika Kanakam | Senior Program Manager, Cloud GTM
Zach Seils | Spécialiste en gestion des réseaux
Wade Holmes | Directeur des solutions mondiales

Assurer la préparation opérationnelle et les performances à l'aide de CloudOps