Der Bereich „Operative Exzellenz“ im Google Cloud -Architektur-Framework enthält Empfehlungen für die effiziente Ausführung von Arbeitslasten auf Google Cloud. Betriebsoptimierung in der Cloud umfasst das Entwerfen, Implementieren und Verwalten von Cloud-Lösungen, die einen Mehrwert, Leistung, Sicherheit und Zuverlässigkeit bieten. Die Empfehlungen in diesem Bereich helfen Ihnen, Arbeitslasten kontinuierlich zu verbessern und an die dynamischen und sich ständig weiterentwickelnden Anforderungen in der Cloud anzupassen.
Der Bereich „Operationelle Exzellenz“ ist für die folgenden Zielgruppen relevant:
- Manager und Führungskräfte: Ein Framework zur Schaffung und Aufrechterhaltung von operationaler Exzellenz in der Cloud und zur Gewährleistung, dass Cloud-Investitionen einen Mehrwert bieten und die Geschäftsziele unterstützen.
- Cloud-Betriebsteams: Anleitungen zum Verwalten von Vorfällen und Problemen, zum Planen der Kapazität, zum Optimieren der Leistung und zum Verwalten von Änderungen.
- Site Reliability Engineers (SREs): Best Practices, mit denen Sie eine hohe Dienstzuverlässigkeit erreichen, einschließlich Monitoring, Reaktion auf Vorfälle und Automatisierung.
- Cloud-Architekten und ‑Entwickler: Betriebsanforderungen und Best Practices für die Design- und Implementierungsphase, damit Lösungen für betriebliche Effizienz und Skalierbarkeit entwickelt werden.
- DevOps-Teams: Informationen zu Automatisierung, CI/CD-Pipelines und Änderungsmanagement, um eine schnellere und zuverlässigere Softwarebereitstellung zu ermöglichen.
Um eine hervorragende Betriebsleistung zu erzielen, sollten Sie Automatisierung, Orchestration und datengetriebene Erkenntnisse nutzen. Mit Automatisierung lässt sich mühsamer Aufwand vermeiden. Außerdem werden wiederkehrende Aufgaben optimiert und abgesichert. Die Orchestrierung hilft, komplexe Prozesse zu koordinieren. Datenbasierte Erkenntnisse ermöglichen fundierte Entscheidungen. Mit diesen Praktiken können Sie die Cloud-Nutzung optimieren, Kosten senken, die Dienstverfügbarkeit verbessern und die Sicherheit erhöhen.
Operative Exzellenz in der Cloud geht über die technische Kompetenz in Cloud-Operationen hinaus. Dazu gehört eine kulturelle Veränderung, die kontinuierliches Lernen und Experimentieren fördert. Teams müssen befähigt werden, innovativ zu sein, Iterationen vorzunehmen und eine Wachstumsmentalität zu entwickeln. Eine Kultur der operativen Exzellenz fördert eine kollaborative Umgebung, in der Einzelpersonen dazu ermutigt werden, Ideen auszutauschen, Annahmen in Frage zu stellen und Verbesserungen voranzutreiben.
Prinzipien und Empfehlungen für die operative Exzellenz, die speziell auf KI- und ML-Arbeitslasten ausgerichtet sind, finden Sie im Architektur-Framework unter KI- und ML-Perspektive: Operative Exzellenz.
Grundprinzipien
Die Empfehlungen in der Säule „Operative Exzellenz“ des Architektur-Frameworks sind den folgenden Grundprinzipien zugeordnet:
- Mit CloudOps für Betriebsbereitschaft und Leistung sorgen: Sorgen Sie dafür, dass Cloud-Lösungen die Betriebs- und Leistungsanforderungen erfüllen, indem Sie Service Level Objectives (SLO) definieren und umfassendes Monitoring, Leistungstests und Kapazitätsplanung durchführen.
- Vorfälle und Probleme verwalten: Mithilfe umfassender Sichtbarkeit, klarer Verfahren zur Reaktion auf Vorfälle, gründlicher Rückblicke und vorbeugender Maßnahmen können Sie die Auswirkungen von Cloud-Vorfällen minimieren und Wiederholungen verhindern.
- Cloud-Ressourcen verwalten und optimieren: Optimieren und verwalten Sie Cloud-Ressourcen mithilfe von Strategien wie der richtigen Dimensionierung, der automatischen Skalierung und effektiven Tools zur Kostenüberwachung.
- Änderungen automatisieren und verwalten: Prozesse automatisieren, das Änderungsmanagement optimieren und den Aufwand für manuelle Arbeit reduzieren.
- Kontinuierliche Verbesserung und Innovation: Konzentrieren Sie sich auf kontinuierliche Verbesserungen und die Einführung neuer Lösungen, um wettbewerbsfähig zu bleiben.
Beitragende
Autoren:
- Ryan Cox | Principal Architect
- Hadrian Knotz | Enterprise Architect
Weitere Beitragende:
- Daniel Lees | Cloudsicherheitsarchitekt
- Filipe Gracio, PhD | Customer Engineer
- Gary Harmson | Customer Engineer
- Jose Andrade | Enterprise Infrastructure Customer Engineer
- Kumar Dhanagopal | Cross-Product Solution Developer
- Nicolas Pintaux | Customer Engineer, Application Modernization Specialist
- Radhika Kanakam | Senior Program Manager, Cloud GTM
- Zach Seils | Networking Specialist
- Wade Holmes | Global Solutions Director