Laden Sie das neue Whitepaper zu SRE herunter und erfahren Sie mehr über Schlüsselkonzepte und dazu, wie Google Cloud Sie auf Ihrem SRE-Weg unterstützen kann.

Site Reliability Engineering (SRE)

SRE ist eine Jobfunktion, eine Denkweise und eine Reihe von technischen Praktiken zum Betrieb zuverlässiger Produktionssysteme. Google Cloud unterstützt Sie bei der Implementierung der SRE-Prinzipien mit Tools, Dienstleistungen und weiteren Ressourcen.

VIDEO

Site Reliability Engineering (SRE) in Google Cloud anwenden

1:59

Vorteile

Ausgewogenheit zwischen Geschwindigkeit und Zuverlässigkeit finden

Vorteile der Geschwindigkeit nutzen

Automatisieren Sie durchgängig, vom Schreiben des Codes bis zum Ausführen der Dienste in der Produktion. Stimmen Sie Entwicklung und Betrieb auf Ziele ab, um schneller voranzukommen. Nutzen Sie Ihre gewohnten Tools wie das Vorfallmanagement, um den Aufwand zu minimieren.

Zuverlässigkeit mit bewährten SRE-Prinzipien verbessern

Nutzen Sie die SRE-Prinzipien, die bei Google entwickelt wurden und nachweislich im großen Maßstab funktionieren. Implementieren Sie ganz einfach Best Practices für SRE mit der Beobachtbarkeit von Google Cloud, um die Problemlösung zu beschleunigen und die Zuverlässigkeit zu verbessern.

Wir unterstützen Sie auf Ihrem SRE-Weg

Fördern Sie eine bessere Softwarebereitstellung – unabhängig von der Unternehmensgröße, der Branche und der Verwendung von VMs, Kubernetes oder serverlosen Lösungen. Wählen Sie zwischen kostenlosen Tools und kostenpflichtigen Angeboten, um den Einstieg in SRE zu vollbringen.

Wichtige Features

SRE-Tools und -Ressourcen zur Optimierung Ihrer Geschäftsabläufe und SRE-Teams

Dienststatus mit SRE-Prinzipien überwachen

Überwachen Sie den Status Ihrer Dienste. Arbeiten Sie mit Entwicklern zusammen, um die Geschwindigkeit von Änderungen zu erhöhen. Verwenden Sie dazu den integrierten Support für das Dienstmonitoring. Wählen Sie Messwerte für SLIs aus, legen Sie die SLOs fest und verfolgen Sie Fehlerbudgets, um Risiken für Ihren Dienst zu reduzieren. Nutzen Sie leistungsstarke Dashboards, um Messwerte und Logs zu aggregieren, einschließlich goldener Signale, um die MTTR zu reduzieren und Fragen zum Servicezustand schnell zu beantworten.

Sofort einsatzbereite Integrationen für mehr Automatisierung und geringeren Arbeitsaufwand

Nutzen Sie die direkt verfügbaren Integrationen in Ihre gewohnten Tools, um Vorfälle schnell zu beheben. Implementieren Sie schrittweise Rollouts und führen Sie ein sicheres Rollback der Änderungen durch. Mit vordefinierten Integrationen in Cloud Build können Sie Artefakte auf Google Kubernetes Engine, App Engine, Cloud Functions, Firebase und Cloud Run als Teil Ihrer CI/CD erstellen, testen und bereitstellen.

Eine integrierte Ansicht für schnellere Auflösung

Genießen Sie eine einheitliche Ansicht von Logs, Ereignissen, Messwerten und SLOs. Kontextbezogene Beobachtbarkeitsdaten direkt in den Dienstkonsolen von Google Kubernetes Engine, Cloud Run Compute Engine und Anthos sowie anderen Laufzeiten abrufen. Erfassen Sie Messwerte, Traces und Logs ohne Einrichtung. Die Aufnahmelatenz von unter einer Sekunde und die Aufnahmerate von einem Terabyte pro Sekunde sorgen dafür, dass Sie Logs in Echtzeit verwalten und analysieren können.

Weitere Unterstützung von Google Cloud SRE-Fachleuten

Wenn Sie praktische Unterstützung bei der Migration benötigen, können Sie zusätzliche Google-Beratungsdienste nutzen. Wenden Sie sich an den Vertrieb, um zu ermitteln, welche Option für Ihre Organisation geeignet ist. Unser CRE-Team zeigt Ihnen, wie Kunden mit Google Cloud-Tools und -Praktiken anderen Unternehmen bei der Implementierung von SRE helfen.

Zusammenarbeit im SRE/Entwicklungsteam fördern, um die Beobachtbarkeit „nach links“ zu verschieben

Mit OpenTelemetry-Paketen und Google Exporter können Entwickelnde Trace-Daten in Google Cloud Trace instrumentieren und exportieren. Unser neuer einheitlicher Ops-Agent (in der Vorschau) erfasst Messwerte und Logs und unterstützt OpenTelemetry, um Messwerte zu erfassen und zu übertragen. Wir arbeiten daran, OT-Bibliotheken als vorkonfigurierte Features in vielen unserer Cloud-Produkte zu implementieren. Cloud SQL Insights ist ein Beispiel dafür.

Kunden

Kundennachfrage mit SRE-Methoden erfüllen

Blog post

Wie Hakuhodo Technologies SRE nutzt und welche Auswirkungen das hat

Lesezeit: 4 Minuten

Blog post

JCB nutzt SRE für eine erfolgreiche digitale Transformation

Lesezeit: 4 Minuten

Blog post

So setzt Sabre SRE zum Vorantreiben einer erfolgreiche digitale Transformation ein

Lesezeit: 3 Minuten

Blog post

Lowe's steigerte die monatliche Release-Geschwindigkeit um das 300-Fache

Lesezeit: 4 Minuten

Blog post

So hat das SRE von Lowe die durchschnittliche Wiederherstellungszeit (Mean Time To Recovery, MTTR) um über 80 % verkürzt

Lesezeit: 4 Minuten

Dokumentation

Informationen zum Implementieren von SRE in Ihrer Organisation mit diesen Ressourcen

Best Practice

Google Site Reliability Engineering

Auf SRE-Books zugreifen, von SREs hören und erfahren, wie wir bei Google SRE nutzen

Google Cloud Basics

SLO erstellen

Zum Monitoring eines Dienstes benötigen Sie mindestens ein Service Level Objective (SLO). Schritt-für-Schritt-Anleitung zum Erstellen Ihres ersten SLO in Cloud Monitoring.

Tutorial

Zuverlässiges Engineering

Hier erfahren Sie, wie Sie Ihre SLOs in der Beobachtbarkeit von Google Cloud definieren und schützen und die Beobachtbarkeit Ihrer in Google Cloud ausgeführten Anwendungen verbessern.

Tutorial

SRE: Messung und Verwaltung von Zuverlässigkeit

Dieser Kurs vermittelt die Theorie von Service Level Objectives (SLOs), einer grundsatzorientierten Methode, um die gewünschte Zuverlässigkeit eines Dienstes zu beschreiben und zu messen.

Tutorial

Developing a Google SRE Culture

Dieser Kurs stellt die wichtigsten Verfahren des SRE von Google vor und zeigt auf, welche zentrale Rolle IT- und Unternehmensverantwortliche bei der Umsetzung spielen.

Suchen Sie nach etwas anderem?

Das ist neu

Das ist neu bei Google Cloud SRE

Melden Sie sich für die Google Cloud-Newsletter an – so erhalten Sie regelmäßig Produktupdates, Veranstaltungsinformationen, Sonderangebote und mehr.

Blog post

Sind wir bald da? Überlegungen zur Bewertung der Reife eines SRE-TeamsBlog lesen

Video

Erste Schritte mit SLOsVideo ansehen

Podcast

SRE III mit Steve McGhee und Yuri GrinshteynJetzt anhören

Gleich loslegen

Welche Herausforderung wollen Sie meistern? Ein Google Cloud-Experte unterstützt Sie gern dabei, die beste Lösung zu finden.

Mit einem zertifizierten Partner arbeiten
Partner finden
Google Cloud verwenden
Kostenlos testen
Sofort einsatzbereite Lösungen erstellen
Im Marketplace umsehen

Site Reliability Engineering (SRE)

Ausgewogenheit zwischen Geschwindigkeit und Zuverlässigkeit finden

Vorteile der Geschwindigkeit nutzen

Zuverlässigkeit mit bewährten SRE-Prinzipien verbessern

Wir unterstützen Sie auf Ihrem SRE-Weg

SRE-Tools und -Ressourcen zur Optimierung Ihrer Geschäftsabläufe und SRE-Teams

Dienststatus mit SRE-Prinzipien überwachen

Sofort einsatzbereite Integrationen für mehr Automatisierung und geringeren Arbeitsaufwand

Eine integrierte Ansicht für schnellere Auflösung

Weitere Unterstützung von Google Cloud SRE-Fachleuten

Zusammenarbeit im SRE/Entwicklungsteam fördern, um die Beobachtbarkeit „nach links“ zu verschieben

Kundennachfrage mit SRE-Methoden erfüllen

SRE-Integrationen und -Produkte

Informationen zum Implementieren von SRE in Ihrer Organisation mit diesen Ressourcen

Google Site Reliability Engineering

SLO erstellen

Zuverlässiges Engineering

SRE: Messung und Verwaltung von Zuverlässigkeit

Developing a Google SRE Culture

Suchen Sie nach etwas anderem?

Das ist neu bei Google Cloud SRE

Gleich loslegen

Mit einem zertifizierten Partner arbeiten

Google Cloud verwenden

Sofort einsatzbereite Lösungen erstellen