Framework d'architecture Google Cloud : optimisation des performances

Last reviewed 2024-10-11 UTC

Ce pilier du framework d'architecture Google Cloud décrit le processus d'optimisation des performances et les bonnes pratiques à suivre pour optimiser les performances des charges de travail dans Google Cloud.

Les informations de ce document sont destinées aux architectes, aux développeurs et aux administrateurs qui planifient, conçoivent, déploient et gèrent des charges de travail dans Google Cloud.

L'optimisation des performances des charges de travail dans le cloud peut aider votre organisation à fonctionner efficacement, à améliorer la satisfaction des clients, à augmenter les revenus et à réduire les coûts. Par exemple, lorsque le temps de traitement backend d'une application diminue, les utilisateurs bénéficient de temps de réponse plus rapides, ce qui peut augmenter la rétention des utilisateurs et améliorer les revenus.

Il peut y avoir des compromis entre performance et coût. Parfois, l'optimisation des performances peut vous aider à réduire les coûts. Par exemple, l'autoscaling offre des performances prévisibles lorsque la charge augmente en garantissant que les ressources ne sont pas surchargées. L'autoscaling vous permet également de réduire les coûts pendant les périodes de faible charge en supprimant les ressources inutilisées.

Pour connaître les principes et les recommandations d'optimisation des performances spécifiques aux charges de travail d'IA et de ML, consultez la section Perspective de l'IA et du ML: optimisation des performances.

Dans ce pilier du framework d'architecture, vous apprendrez à effectuer les opérations suivantes: