Scarica il nuovo white paper su SRE per apprendere i concetti fondamentali e scoprire come Google Cloud può aiutarti nel tuo percorso di SRE
Vai a

Site Reliability Engineering (SRE)

SRE è una funzione lavorativa, una mentalità e un insieme di prassi tecniche per eseguire sistemi di produzione affidabili. Google Cloud ti aiuta a implementare i principi SRE attraverso strumenti, servizi professionali e altre risorse.
  • Sabre
  • Lowe’s
  • adeo
  • Zebra
  • Optiva
  • Proctor & Gamble
  • TELUS
  • Ulta
  • Logo JCB

Vantaggi

Trova il giusto equilibrio tra velocità e affidabilità

Approfitta dei vantaggi della velocità

Automate end to end, from writing code to running services in production. Allinea lo sviluppo e le operazioni agli obiettivi condivisi per accelerare il processo. Connettiti agli strumenti che ami, inclusa la gestione degli incidenti, per ridurre al minimo la fatica.

Migliora l'affidabilità con principi di SRE comprovati

Sfrutta i principi di SRE sviluppati da Google e collaudati anche su larga scala. Implementa facilmente le best practice di SRE con la suite operativa di Google Cloud per accelerare la risoluzione dei problemi e migliorare l'affidabilità.

Ti veniamo incontro lungo il tuo percorso di SRE

Aumenta la distribuzione del software, indipendentemente dalle dimensioni dell'azienda, dal settore o dal fatto che utilizzi VM, Kubernetes o Serverless. Scegli tra strumenti gratuiti o offerte a pagamento per iniziare il tuo percorso di SRE.

Funzionalità principali

Strumenti e risorse di SRE per migliorare la produttività delle operazioni e dei team di SRE

Monitorare l'integrità del servizio utilizzando i principi di SRE

Monitora lo stato dei tuoi servizi e collabora con gli sviluppatori per aumentare la velocità dei cambiamenti utilizzando il supporto integrato per il monitoraggio dei servizi. Seleziona le metriche per SLI , imposta gli SLO e monitora i budget di errore al fine di ridurre il rischio per il tuo servizio. Utilizza dashboard avanzate per aggregare metriche e log, compresi gli indicatori dorati per ridurre MTTR e rispondere rapidamente a domande sullo stato dei servizi.

Integrazioni pronte all'uso per aumentare l'automazione e ridurre il lavoro

Utilizza le nostre integrazioni incorporate nei tuoi strumenti preferiti per risolvere rapidamente gli incidenti. Distribuisci implementazioni incrementali e annulla le modifiche in sicurezza. Sono disponibili integrazioni preconfigurate con Cloud Build per consentirti di creare, testare ed eseguire il deployment degli artefatti per Google Kubernetes Engine, App Engine, Cloud Functions, Firebase e Cloud Run nell'ambito di CI/CD.

Una visualizzazione integrata per una risoluzione più rapida

Ottieni una visualizzazione unificata per log, eventi, metriche e SLO. Ottieni dati di osservabilità contestualizzati direttamente nelle console di servizio di Google Kubernetes Engine, Cloud Run, Compute Engine, Anthos e altri tempi di esecuzione. Raccogli metriche, tracce e log senza necessità di configurazione. La latenza di importazione inferiore al secondo e la velocità di importazione al secondo (terabyte) assicurano l'esecuzione di gestione e analisi dei log in tempo reale su larga scala. 

Ricevi ulteriore assistenza dagli esperti SRE di Google Cloud

Se hai bisogno di ulteriore assistenza pratica durante il percorso, puoi usufruire di altri servizi, tra cui i servizi di consulenza Google. Contatta il team di vendita per scoprire quale opzione è più adatta alla tua organizzazione. Impara dal nostro team CRE e dai casi di successo dei clienti come gli strumenti e le pratiche di Google Cloud hanno aiutato altre aziende a implementare SRE nella loro organizzazione.

Promuovi la collaborazione tra SRE e sviluppatori per l'osservabilità shift left

Con i pacchetti OpenTelemetry (OT) e Google Exporter, gli sviluppatori possono strumentare ed esportare i dati di traccia in Cloud Trace. Il nostro nuovo agente operativo unificato (in anteprima), raccoglie metriche e log e supporta anche OpenTelemetry per l'acquisizione e il trasporto delle metriche. Stiamo lavorando per implementare le librerie OT come funzionalità pronte all'uso in molti dei nostri prodotti cloud. Cloud SQL Insights è un esempio di questa iniziativa.


Documentazione

Scopri come implementare SRE nella tua organizzazione grazie a queste risorse

Best practice
Google Site Reliability Engineering

Accedi ai libri su SRE, ascolta gli esperti di SRE e scopri come utilizziamo SRE in Google.

Nozioni di base su Google Cloud
Creazione di uno SLO

Per monitorare un servizio, devi avere almeno un obiettivo del livello di servizio (SLO). Scopri passo passo come creare il tuo primo SLO in Cloud Monitoring.

Tutorial
Progettazione per l'affidabilità

Scopri come definire e difendere i tuoi SLO nella suite operativa di Google Cloud e migliorare l'osservabilità delle tue applicazioni in esecuzione su Google Cloud.

Tutorial
SRE: misurazione e gestione dell'affidabilità

Questo corso illustra la teoria degli obiettivi del livello di servizio (SLO), un modo efficace per descrivere e misurare l'affidabilità desiderata per un servizio.

Tutorial
Sviluppo di una cultura SRE di Google

Questo corso presenta le pratiche chiave di Google SRE e il ruolo importante dei responsabili IT e aziendali per il successo dell'adozione di SRE da parte dell'organizzazione.

Novità

Novità di Google Cloud SRE

Iscriviti alle newsletter di Google Cloud per ricevere aggiornamenti sui prodotti, informazioni sugli eventi, offerte speciali e molto altro.