Der Bereich „Operative Exzellenz“ im Google Cloud-Architektur-Framework enthält Empfehlungen für den effizienten Betrieb von Arbeitslasten in Google Cloud. Betriebsoptimierung in der Cloud umfasst das Entwerfen, Implementieren und Verwalten von Cloud-Lösungen, die einen Mehrwert, Leistung, Sicherheit und Zuverlässigkeit bieten. Die Empfehlungen in diesem Bereich helfen Ihnen, Arbeitslasten kontinuierlich zu verbessern und an die dynamischen und sich ständig weiterentwickelnden Anforderungen in der Cloud anzupassen.
Der Bereich „Operationelle Exzellenz“ ist für die folgenden Zielgruppen relevant:
- Manager und Führungskräfte: Ein Framework, mit dem sich operative Exzellenz in der Cloud etablieren und aufrechterhalten lässt und mit dem sichergestellt werden kann, dass Cloud-Investitionen einen Mehrwert bieten und die Geschäftsziele unterstützen.
- Cloud-Operationsteams: Anleitungen zum Verwalten von Vorfällen und Problemen, zum Planen der Kapazität, zur Leistungsoptimierung und zum Verwalten von Änderungen.
- Site Reliability Engineers (SREs): Best Practices, mit denen Sie eine hohe Dienstzuverlässigkeit erreichen, einschließlich Monitoring, Reaktion auf Vorfälle und Automatisierung.
- Cloud-Architekten und ‑Entwickler: Betriebsanforderungen und Best Practices für die Design- und Implementierungsphase, damit Lösungen für betriebliche Effizienz und Skalierbarkeit entwickelt werden.
- DevOps-Teams: Informationen zu Automatisierung, CI/CD-Pipelines und Änderungsmanagement, um eine schnellere und zuverlässigere Softwarebereitstellung zu ermöglichen.
Um eine hervorragende Betriebsleistung zu erzielen, sollten Sie Automatisierung, Orchestration und datengetriebene Erkenntnisse nutzen. Mit Automatisierung lässt sich mühsamer Arbeitsaufwand vermeiden. Außerdem werden wiederkehrende Aufgaben optimiert und abgesichert. Die Orchestrierung hilft, komplexe Prozesse zu koordinieren. Datenbasierte Erkenntnisse ermöglichen fundierte Entscheidungen. Mit diesen Praktiken können Sie die Cloud-Nutzung optimieren, Kosten senken, die Dienstverfügbarkeit verbessern und die Sicherheit erhöhen.
Operative Exzellenz in der Cloud geht über die technische Kompetenz in Cloud-Operationen hinaus. Dazu gehört eine kulturelle Veränderung, die kontinuierliches Lernen und Experimentieren fördert. Teams müssen befähigt werden, innovativ zu sein, Iterationen vorzunehmen und eine Wachstumsmentalität zu entwickeln. Eine Kultur der operativen Exzellenz fördert eine kollaborative Umgebung, in der Einzelpersonen dazu ermutigt werden, Ideen auszutauschen, Annahmen in Frage zu stellen und Verbesserungen voranzutreiben.
Prinzipien und Empfehlungen für die operative Exzellenz, die speziell auf KI- und ML-Arbeitslasten ausgerichtet sind, finden Sie im Architektur-Framework unter KI- und ML-Perspektive: Operative Exzellenz.
Die Empfehlungen im Bereich „Operative Exzellenz“ des Architektur-Frameworks sind den folgenden Grundprinzipien für Automatisierung, Orchestration und datengetriebene Erkenntnisse zugeordnet:
- Mit CloudOps für Betriebsbereitschaft und Leistung sorgen: Sorgen Sie dafür, dass Cloud-Lösungen die Betriebs- und Leistungsanforderungen erfüllen, indem Sie Service Level Objectives (SLO) definieren und umfassendes Monitoring, Leistungstests und Kapazitätsplanung durchführen.
- Vorfälle und Probleme verwalten: Minimieren Sie die Auswirkungen von Cloud-Vorfällen und verhindern Sie Wiederholungen durch umfassende Beobachtbarkeit, klare Verfahren zur Reaktion auf Vorfälle, gründliche Rückblicke und vorbeugende Maßnahmen.
- Cloud-Ressourcen verwalten und optimieren: Optimieren und verwalten Sie Cloud-Ressourcen mithilfe von Strategien wie der richtigen Dimensionierung, der automatischen Skalierung und effektiven Tools zur Kostenüberwachung.
- Änderungen automatisieren und verwalten: Prozesse automatisieren, das Änderungsmanagement optimieren und den Aufwand für manuelle Arbeit reduzieren.
- Kontinuierliche Verbesserung und Innovation: Konzentrieren Sie sich auf kontinuierliche Verbesserungen und die Einführung neuer Lösungen, um wettbewerbsfähig zu bleiben.
Beitragende
Autoren:
- Ryan Cox | Principal Architect
- Hadrian Knotz | Enterprise Architect
Weitere Beitragende:
- Daniel Lees | Cloudsicherheitsarchitekt
- Filipe Gracio, PhD | Customer Engineer
- Gary Harmson | Customer Engineer
- Jose Andrade | Customer Engineer, Enterprise Infrastructure
- Kumar Dhanagopal | Cross-Product Solution Developer
- Nicolas Pintaux | Customer Engineer, Application Modernization Specialist
- Radhika Kanakam | Senior Program Manager, Cloud GTM
- Zach Seils | Networking Specialist
- Wade Holmes | Global Solutions Director