Stackdriver transparante serviceniveau-indicatoren (SLI's)

Monitor Google Cloud-services en de effecten daarvan op uw productietaken.

stackdriver-sre-hero-banner

Moderne IT draait om cijfers

Een uitgebreide, op statistische gegevens gebaseerde aanpak is tegenwoordig een basisdoel van de meeste IT-beheerders. Veel bedrijven kijken naar servicebeschikbaarheid en -prestaties om IT te meten. Maar voor IT-beheerders die afhankelijk zijn van cloudservices kan het lastig zijn om nauwkeurige en betrouwbare gegevens te krijgen over services die door een externe cloudprovider worden geleverd. Als er een probleem is, waar bevindt het zich dan? In uw stack of bij uw serviceprovider? Met transparante SLI's kunt u Google Cloud-services en de effecten op uw productietaken monitoren, zodat u een volledig beeld heeft.

measure-all-the-things

Alles meten

Google biedt gedetailleerde, statistische gegevens op API-niveau voor meer dan 130 Google Cloud-services, zodat u meer inzicht kunt krijgen in de prestaties van uw servicecomponenten. Deze statistische gegevens laten u het aantal fouten en de wachttijd zien van de verzoeken van uw apps aan elke Google-service. Zo kunt u correlaties en neveneffecten zien tussen uw apps en de services waarvan ze afhankelijk zijn, waardoor u de analyse van achterliggende problemen kunt versnellen en de tijd tot de oplossing kunt verkorten.

real-transparency

Echte transparantie

SLI's gaan veel verder dan wat we normaal gesproken onder 'servicestatus' verstaan. U kunt de specifieke interacties tussen services zien en deze koppelen aan omgevingsgegevens. Zo kunt u de statistische gegevens van services met elkaar vergelijken aan de hand van verschillende kenmerken, zoals servicelocatie, de gegevens van de app die de service aanroept, de versie en de reactiecode, om relaties te onderzoeken en oorzaken en gevolgen vast te stellen.

Het gebruik van transparante SLI's in de praktijk

  • Als alle aanroepen naar een service voor één bepaalde gebruiker mislukken maar niet voor anderen, is er waarschijnlijk iets mis met het account en kunt u het zelf oplossen.
  • Als u tijdens het oplossen van een probleem met uw app merkt dat er een verband bestaat tussen de verminderde prestaties van uw app en de langere wachttijd voor een kritieke GCP-service, is dit een teken om onze hulp in te roepen.
  • Als de wachttijd voor een GCP-service er goed uitziet en niet is veranderd, maar de wachttijd bij aanroepen naar de service volgens de statistische gegevens in uw app abnormaal hoog is, kan er sprake zijn van een netwerkprobleem. Bel uw netwerkprovider (in sommige gevallen Google) om de foutopsporing te starten.

Ons streven naar transparantie

Bij Google Cloud doen we er alles aan om gedetailleerde prestatiegegevens over onze services te delen. Deze zijn vergelijkbaar met de gegevens die de SRE-teams van Google gebruiken om onze services werkend te houden. Met deze gedeelde gegevens kunt u op eenvoudige wijze in de gaten houden hoe we ervoor staan, zodat we op één lijn zitten als we samen aan een serviceticket werken. Wij denken dat transparante SLI's technische support verbeteren en uw vertrouwen in cloudcomputing vergroten.

Google Cloud

Aan de slag

Om aan de slag te gaan met het verzamelen en analyseren van transparante servicestatistieken, gaat u naar Stackdriver Metrics Explorer en selecteert u 'Consumed API' als resourcetype. U krijgt een lijst met statistische gegevens te zien die u kunt gebruiken, afhankelijk van de producten en services die u in uw app gebruikt. Vervolgens kunt u de gegevens kiezen die relevant zijn voor uw omgeving. Verfijn de gegevens door aan te geven welke service, methode, locatie, gegevens of foutcode u wilt monitoren.

Nadat u heeft besloten welke gegevens het belangrijkste zijn voor uw app, kunt u aangepaste dashboards maken die uw sleutelindicatoren samen met die van ons in kaart brengen, zodat u in één oogopslag kunt zien wat de algemene oorzaak van het probleem is. Als u eenmaal weet hoe Google-services zich op de lange termijn gedragen voor uw verkeer en wat de tolerantie van uw app is, kunt u meldingen instellen voor afwijkingen van het langetermijngedrag.

Aan de slag