Faça o download do novo artigo (em inglês) sobre SRE para saber mais sobre os principais conceitos e como o Google Cloud pode ajudar na sua jornada de SRE

Ir para

Engenharia de confiabilidade do site (SRE)

SRE é uma função de trabalho, uma mentalidade e um conjunto de práticas de engenharia para executar sistemas de produção confiáveis. O Google Cloud ajuda a implementar os princípios de SRE por meio de ferramentas, serviços profissionais e outros recursos.
Sabre
Lowe’s
adeo
Zebra
Optiva
Proctor & Gamble
TELUS
Ulta

Vantagens

Encontre o equilíbrio entre velocidade e confiabilidade

Aproveite os benefícios da velocidade

Automatize todo o processo, desde a escrita de um código até a execução de serviços na produção. Alinhe o desenvolvimento e as operações em torno das metas compartilhadas para agilizar o processo. Conecte-se às ferramentas que você adora, incluindo o gerenciamento de incidentes, enquanto minimiza o trabalho.

Melhore a confiabilidade com os princípios de SRE comprovados

Aproveite os princípios de SRE desenvolvidos no Google e comprovados trabalhar em escala. Implemente facilmente práticas recomendadas de SRE com o pacote de operações do Google Cloud (em inglês) para acelerar a resolução de problemas e melhorar a confiabilidade.

Encontramos você onde está na sua jornada de SRE

Aumente a entrega de software, independentemente do tamanho da empresa, do setor ou se você usa VMs, Kubernetes ou Serverless. Escolha uma das ferramentas gratuitas ou das ofertas pagas para impulsionar sua jornada de SRE.

Principais recursos

Ferramentas e recursos de SRE para tornar suas operações e as equipes de SRE mais eficientes

Monitorar a integridade do serviço usando os princípios da SRE

Monitore a integridade dos serviços e trabalhe com desenvolvedores para aumentar a velocidade das mudanças usando o suporte integrado para o monitoramento de serviços. Selecionar métricas paraSLIs , defina SLOs e rastrearerro de orçamento para reduzir o risco do seu serviço. Use painéis eficientes para agregar métricas e registros, incluindo sinais dourados e reduzir o MTTR } e responda a perguntas rapidamente sobre a integridade do serviço.

Integrações prontas para uso para aumentar a automação e reduzir o trabalho

Use nossas integrações com as ferramentas que você adora para resolver incidentes rapidamente. Implemente lançamentos progressivos e reverta alterações com segurança. Integrações pré-criadas com o Cloud Build estão disponíveis para que você possa criar, testar e implantar artefatos no Google Kubernetes Engine, Google App Engine, Cloud Functions, Firebase e Cloud Run como parte da CI/CD.

Uma visualização integrada para resolução mais rápida

Tenha uma visualização unificada de todos os registros, eventos, métricas e SLOs. Receba dados de observabilidade no contexto, diretamente nos consoles de serviços do Google Kubernetes Engine, Cloud Run, Compute Engine, Anthos e outros ambientes de execução. Colete métricas, traces e registros sem nenhuma configuração. Com a latência de ingestão de menos de um segundo e a taxa de ingestão de terabytes por segundo, é possível realizar o gerenciamento de registros e análises em tempo real em escala. 

Receba mais ajuda dos especialistas em SRE do Google Cloud

Se você precisar de mais ajuda prática durante a jornada, use outros serviços, como os serviços de consultoria do Google. Entre em contato com a equipe de vendas para ver qual opção seria melhor para sua organização. Veja com nossa equipe CRE e histórias de sucesso de clientes como as ferramentas e práticas do Google Cloud ajudaram outras empresas a implementar a SRE na organização.

Impulsione a colaboração SRE/desenvolvedor para a observabilidade do “deslocar para a esquerda”

Com os pacotes da OpenTelemetry (OT) e o Google Exporter, os desenvolvedores podem instrumentar e exportar dados de rastreamento para o Cloud Trace. Nosso novo agente de operações unificado(na visualização), coleta métricas e registros, também é compatível com a OpenTelemetry para capturar e transportar métricas. Estamos trabalhando para implementar bibliotecas de OT como recursos prontos para uso em muitos dos nossos produtos de nuvem. O Cloud SQL Insights é um exemplo desse esforço.


Clientes

Como atender à demanda dos clientes com práticas de SRE

Serviços relacionados

Documentação

Saiba como implementar a SRE na sua organização com estes recursos

Prática recomendada
Engenharia de confiabilidade de sites do Google

Acesse os livros sobre SRE, ouça os SREs e saiba como fazemos isso no Google.

Princípios básicos do Google Cloud
Como criar um SLO

Para monitorar um serviço, você precisa de pelo menos um objetivo de nível de serviço (SLO). Aprenda como criar seu primeiro SLO no Cloud Monitoring.

Tutorial
Solução de problemas de cargas de trabalho no GKE para SREs

Aprenda a navegar nas páginas de recursos do GKE, usar o painel do GKE, criar métricas com base em registros, criar um SLO e definir um alerta para notificar a equipe de SRE sobre incidentes. .

Tutorial
Engenharia de confiabilidade

Saiba como definir e defender seus SLOs no pacote de operações do Google Cloud e melhorar a observabilidade dos aplicativos em execução no Google Cloud.

Tutorial
SRE: medição e gerenciamento de confiabilidade

Neste curso, você aprenderá a teoria dos objetivos de nível de serviço (SLOs), uma maneira de descrever e avaliar a confiabilidade pretendida de um serviço com base em princípios.

Tutorial
Como desenvolver uma cultura de SRE do Google

Neste curso, apresentamos as principais práticas de SRE do Google e o papel importante que os líderes de TI e de negócios desempenham em uma adoção organizacional de SRE bem-sucedida.

O que há de novo

O que há de novo na SRE do Google Cloud

Inscreva-se para receber newsletters do Google Cloud com atualizações de produtos, informações sobre eventos, ofertas especiais e muito mais.