Dieser Pfeiler im Google Cloud -Architektur-Framework enthält Empfehlungen zur Optimierung der Leistung von Arbeitslasten inGoogle Cloud.
Dieses Dokument richtet sich an Architekten, Entwickler und Administratoren, die Arbeitslasten in Google Cloudplanen, entwerfen, bereitstellen und verwalten.
Die Empfehlungen in diesem Bereich können Ihrem Unternehmen helfen, effizient zu arbeiten, die Kundenzufriedenheit zu verbessern, den Umsatz zu steigern und die Kosten zu senken. Beispiel: Wenn die Backend-Verarbeitungszeit einer Anwendung abnimmt, genießen Nutzer schnellere Antwortzeiten, was zu einer höheren Nutzerbindung und mehr Umsatz führen kann.
Bei der Leistungsoptimierung kann es zu einem Kompromiss zwischen Leistung und Kosten kommen. Manchmal kann die Leistungsoptimierung jedoch helfen, die Kosten zu senken. Beispiel: Autoscaling kann dazu beitragen, eine vorhersagbare Leistung zu erzielen, wenn die Last zunimmt, da die Systemressourcen nicht überlastet werden. Außerdem können Sie in Zeiten geringer Last mit Autoscaling nicht verwendete Ressourcen entfernen und so die Kosten senken.
Die Leistungsoptimierung ist ein kontinuierlicher Prozess, keine einmalige Aktivität. Das folgende Diagramm zeigt die Phasen des Leistungsoptimierungsprozesses:
Die Leistungsoptimierung ist ein kontinuierlicher Prozess, der die folgenden Phasen umfasst:
- Anforderungen definieren: Definieren Sie detaillierte Leistungsanforderungen für jede Schicht des Anwendungsstacks, bevor Sie Ihre Anwendungen entwerfen und entwickeln. Berücksichtigen Sie bei der Planung der Ressourcenzuweisung die wichtigsten Arbeitslastmerkmale und Leistungserwartungen.
- Entwerfen und bereitstellen: Verwenden Sie elastische und skalierbare Designmuster, mit denen Sie Ihre Leistungsanforderungen erfüllen können.
- Überwachen und analysieren: Überwachen Sie die Leistung kontinuierlich mithilfe von Protokollen, Tracing, Messwerten und Benachrichtigungen.
Optimieren: Berücksichtigen Sie mögliche Neugestaltungen, wenn sich Ihre Anwendungen weiterentwickeln. Cloud-Ressourcen richtig dimensionieren und neue Funktionen nutzen, um sich an veränderte Leistungsanforderungen anzupassen.
Wie im vorherigen Diagramm dargestellt, fahren Sie mit dem Monitoring fort, bewerten Sie die Anforderungen neu und passen Sie die Cloud-Ressourcen an.
Prinzipien und Empfehlungen zur Leistungsoptimierung, die speziell auf KI- und ML-Arbeitslasten ausgerichtet sind, finden Sie im Architektur-Framework unter KI und ML: Leistungsoptimierung.
Die Empfehlungen im Bereich „Leistungsoptimierung“ des Architektur-Frameworks sind den folgenden Grundprinzipien zugeordnet:
- Ressourcenzuweisung planen
- Elastizität nutzen
- Modulares Design fördern
- Leistung kontinuierlich überwachen und verbessern
Beitragende
Autoren:
- Daniel Lees | Cloudsicherheitsarchitekt
- Gary Harmson | Customer Engineer
- Luis Urena | Developer Relations Engineer
- Zach Seils | Networking Specialist
Weitere Beitragende:
- Filipe Gracio, PhD | Customer Engineer
- Jose Andrade | Enterprise Infrastructure Customer Engineer
- Kumar Dhanagopal | Cross-Product Solution Developer
- Marwan Al Shawi | Partner Customer Engineer
- Nicolas Pintaux | Customer Engineer, Application Modernization Specialist
- Ryan Cox | Principal Architect
- Radhika Kanakam | Senior Program Manager, Cloud GTM
- Wade Holmes | Global Solutions Director