Accéder au contenu
DevOps et ingénierie SRE

2022 State of DevOps Report : fiabilité et SRE

4 mai 2023
https://storage.googleapis.com/gweb-cloudblog-publish/images/state_of_devops_2022.max-2600x2600.jpg
Dave Stanke

Developer Relations Engineer

Contactez-nous

Si vous êtes une entreprise et que vous souhaitez vous développer, découvrez comment gagner en productivité avec Google Cloud ou contactez notre équipe commerciale.

Commencer ici

Accélérer l’adoption de DevOps

Lorsqu’une modification logicielle est déployée – après avoir été conçue, codée, testée, packagée et testée à nouveau -, un cycle s’achève. Mais le projet n’est pas terminé pour autant : c’est à ce moment précis que commence un nouveau cycle, celui de la relation entre le client et le service déployé. Et c’est à ce stade de l’exploitation que des risques jusqu’alors abstraits se transforment en risques tangibles tels que la perte de revenus, la dégradation de la confiance ou encore l'atteinte à la réputation. Ce n'est que lorsqu'il est mis à la disposition des utilisateurs que le logiciel peut contribuer (ou menacer !) au succès de votre organisation. C'est pourquoi le projet DORA (DevOps Research and Assessment) a cherché à approfondir ses recherches au cours de ces dernières années sur la fiabilité des services, à travers et au-delà du déploiement, jusqu'au fonctionnement continu.

Au sens large, la « fiabilité » fait référence à la capacité d'une équipe à répondre aux attentes de ses utilisateurs. Dans le domaine logiciel, elle englobe aussi bien des notions de disponibilité, de latence, de corrections et autres caractéristiques qui influencent la cohérence et la qualité de l'expérience utilisateur. La pratique de l'ingénierie de la fiabilité des sites (ou SRE) de Google, adoptée et enrichie par une communauté mondiale d’ingénieurs SRE, propose une approche des opérations IT centrée sur les retours des  utilisateurs, le partage des responsabilités et une collaboration basée sur l’amélioration continue plutôt que sur les reproches. 

Dès la réalisation du rapport 2021 Accelerate State of DevOps, nous avons commencé à poser des questions précises sur l'ingénierie de la fiabilité dans leur organisation aux personnes impliquées. Nous avons poursuivi et élargi le spectre de notre enquête en 2022. Les résultats montrent que l'ingénierie de la fiabilité moderne est désormais très répandue : une majorité de répondants déclarent utiliser des pratiques de type SRE. Forts d’une impressionnante quantité d’informations collectées, nous avons cherché à affiner nos recherches portant sur l’impact de la fiabilité et son interaction avec d’autres dynamiques présentes dans notre modèle d’analyse de l’influence des technologies sur le succès des entreprises. 

La fiabilité est fondamentale

« Lorsque la fiabilité est faible, les améliorations apportées à la livraison logicielle n’ont aucun effet sur les résultats de l’organisation. Elles peuvent même avoir un effet négatif ». 

La fiabilité n’est pas seulement nécessaire : elle est essentielle. Comme dans les études précédentes, nous constatons que la performance des logiciels livrés impacte la performance des entreprises. Cette performance de la livraison logicielle est mesurée selon les « quatre indicateurs clés » : le délai de mise en œuvre des changements, la fréquence des déploiements, le taux d'échecs des déploiements et le délai de reprise après échec.
Nous avons toutefois découvert un nouveau facteur cette année : l’impact des livraisons logicielles sur les performances de l’entreprise repose sur la fiabilité. Lorsque la fiabilité est élevée, une livraison logicielle performante permet d’anticiper de meilleurs résultats pour l'organisation. Mais lorsque la fiabilité est faible, les améliorations apportées à la livraison des logiciels n'ont aucun effet, voire un effet négatif, sur les résultats de l'organisation ! Ce qui ne fait que confirmer ce que beaucoup d’ingénieurs SRE pensaient déjà : « la fiabilité est la caractéristique la plus importante de tout système ». Si un service ou un produit ne répond pas aux attentes de ses utilisateurs en matière de fiabilité, livrer rapidement de nouvelles fonctionnalités tape-à-l'œil est contre-productif car les utilisateurs ne peuvent pas les expérimenter correctement. Pour créer de la valeur, la livraison logicielle doit s’appuyer sur des fondations solides de fiabilité.

La fiabilité est un cheminement

Tout dirigeant expérimenté vous dira que le progrès est rarement linéaire : même avec une discipline comme le SRE, largement pratiquée et dont les avantages sont démontrables, le chemin du succès a peu de chances de suivre une ligne droite. DORA décrit ce parcours avec la "courbe en J" de la transformation organisationnelle, graphique expliquant le phénomène selon lequel le succès durable ne vient qu'après des revers et des leçons apprises.

Cette année, nous avons comparé le niveau des pratiques d'ingénierie de la fiabilité des équipes SRE avec leur impact sur les services fournis : une plus grande expertise SRE produit-elle une plus grande fiabilité ? La réponse est clairement « Oui » ! Mais attention : l’amélioration n’intervient pas dès le début. 

Si l'on compare les résultats en matière de fiabilité en fonction de différents niveaux d'adoption de l'ingénierie de la fiabilité, la courbe en J apparaît clairement. Une équipe qui pratique la SRE de manière uniquement légère - au début de son parcours SRE, par exemple - risque non seulement de ne pas gagner, voire de régresser, en termes de fiabilité ressentie par ses utilisateurs. Toutefois, une fois que ces pratiques sont plus profondément ancrées, un point d'inflexion peut être atteint et nous constatons une incidence positive sur la fiabilité au fur et à mesure que l’équipe développe et approfondit ses pratiques SRE. 

Partant du principe qu'il faudra probablement du temps pour réaliser les avantages de l'adoption du SRE, vous pourriez être tenté de lancer le processus le plus tôt possible en le généralisant à toutes les équipes. Mais attention ! Les initiatives impliquant une transformation culturelle à l'échelle de l'entreprise échouent généralement lorsqu'elles sont trop ambitieuses. Nous avons étudié cette question et fait part de nos conclusions dans un précédent rapport. Et même si vous parvenez à déjouer les pronostics et à adopter pleinement le SRE dans plusieurs équipes simultanément, le coût peut être inacceptable : les baisses de fiabilité que vous risquez de subir au début, amplifiées par le fait qu’elles se produiront au même moment dans toute l’organisation, pourraient entraîner des conséquences catastrophiques. C'est pourquoi le principe de changement progressif de la SRE doit également être appliqué à l'adoption de la SRE elle-même !

La fiabilité repose sur l’humain

Après plus d'une décennie de pratique et de théorie de l'ingénierie de la fiabilité des sites, l’ouvrage Enterprise Roadmap to SRE souligne l'importance de l’acculturation, suggérant que l'ingénierie de la fiabilité des sites s’impose en fait par la culture. Les outils et les frameworks sont importants ; le langage est essentiel. Mais seule une culture instaurant un climat de grande confiance avec un management positif de l’erreur permet de développer le processus d’amélioration continue, indispensable au SRE pour gérer les environnements technologiques complexes et dynamiques d'aujourd'hui. Les recherches menées par DORA en 2022 démontrent l'interaction entre culture et fiabilité : nous avons constaté que la culture "générative", telle que définie par le modèle de Westrum, permet de prédire des résultats de fiabilité plus élevés. Et la fiabilité présente des avantages non seulement pour les utilisateurs d'un système, mais aussi pour ses concepteurs : les équipes dont les services sont très fiables ont 1,6 fois moins de chance de souffrir d'épuisement professionnel. 

Publié dans