Faça o download do novo artigo (em inglês) sobre SRE para saber mais sobre os principais conceitos e como o Google Cloud pode ajudar na sua jornada de SRE
Ir para

Engenharia de confiabilidade do site (SRE)

SRE é uma função de trabalho, uma mentalidade e um conjunto de práticas de engenharia para executar sistemas de produção confiáveis. O Google Cloud ajuda a implementar os princípios de SRE por meio de ferramentas, serviços profissionais e outros recursos.
  • Sabre
  • Lowe’s
  • adeo
  • Zebra
  • Optiva
  • Proctor & Gamble
  • TELUS
  • Ulta
  • Logotipo da JCB

Benefícios

Encontre o equilíbrio entre velocidade e confiabilidade

Aproveite os benefícios da velocidade

Automatize todo o processo, desde a escrita de um código até a execução de serviços na produção. Alinhe o desenvolvimento e as operações em torno das metas compartilhadas para agilizar o processo. Conecte-se às ferramentas que você adora, incluindo o gerenciamento de incidentes, enquanto minimiza o trabalho.

Melhore a confiabilidade com os princípios de SRE comprovados

Aproveite os princípios de SRE desenvolvidos no Google e comprovados trabalhar em escala. Implemente facilmente práticas recomendadas de SRE com o pacote de operações do Google Cloud  (em inglês) para acelerar a resolução de problemas e melhorar a confiabilidade.

Encontramos você onde está na sua jornada de SRE

Aumente a entrega de software, independentemente do tamanho da empresa, do setor ou se você usa VMs, Kubernetes ou Serverless. Escolha uma das ferramentas gratuitas ou das ofertas pagas para impulsionar sua jornada de SRE.

Principais recursos

Ferramentas e recursos de SRE para tornar suas operações e as equipes de SRE mais eficientes

Monitorar a integridade do serviço usando os princípios da SRE

Monitore a integridade dos serviços e trabalhe com desenvolvedores para aumentar a velocidade das mudanças usando o suporte integrado para o monitoramento de serviços. Selecionar métricas para SLIs, defina SLOs e rastrear erro de orçamento para reduzir o risco do seu serviço. Use painéis eficientes para agregar métricas e registros, incluindo sinais dourados e reduzir o MTTR } e responda a perguntas rapidamente sobre a integridade do serviço.

Integrações prontas para uso para aumentar a automação e reduzir o trabalho

Use nossas integrações com as ferramentas que você adora para resolver incidentes rapidamente. Implemente lançamentos progressivos e reverta alterações com segurança. Integrações pré-criadas com o Cloud Build estão disponíveis para que você possa criar, testar e implantar artefatos no Google Kubernetes Engine, App Engine, Cloud Functions, Firebase e Cloud Run como parte da CI/CD.

Uma visualização integrada para resolução mais rápida

Tenha uma visualização unificada de todos os registros, eventos, métricas e SLOs. Receba dados de observabilidade no contexto, diretamente nos consoles de serviços do Google Kubernetes Engine, Cloud Run, Compute Engine, Anthos e outros ambientes de execução. Colete métricas, traces e registros sem nenhuma configuração. Com a latência de ingestão de menos de um segundo e a taxa de ingestão de terabytes por segundo, é possível realizar o gerenciamento de registros e análises em tempo real em escala. 

Receber mais ajuda de especialistas do Google Cloud SRE

Se você precisar de mais ajuda prática durante a jornada, use outros serviços, como os serviços de consultoria do Google. Entre em contato com a equipe de vendas para ver qual opção seria melhor para sua organização. Veja com nossa equipe CRE e histórias de sucesso de clientes como as ferramentas e práticas do Google Cloud ajudaram outras empresas a implementar a SRE na organização.

Impulsione a colaboração SRE/desenvolvedor para a observação da "mudança para a esquerda"

Com os pacotes da OpenTelemetry (OT) e o Google Exporter, os desenvolvedores podem instrumentar e exportar dados de rastreamento para o Cloud Trace. Nosso novo agente de operações unificado (na visualização), coleta métricas e registros, também é compatível com a OpenTelemetry para capturar e transportar métricas. Estamos trabalhando para implementar bibliotecas de OT como recursos prontos para uso em muitos dos nossos produtos de nuvem. O Cloud SQL Insights é um exemplo desse esforço.


Documentação

Saiba como implementar a SRE na sua organização com estes recursos

Prática recomendada
Engenharia de confiabilidade de sites do Google

Acesse os livros sobre SRE, ouça os SREs e saiba como fazemos isso no Google.

Princípios básicos do Google Cloud
Como criar um SLO

Para monitorar um serviço, você precisa de pelo menos um objetivo de nível de serviço (SLO). Aprenda como criar seu primeiro SLO no Cloud Monitoring.

Tutorial
Engenharia de confiabilidade

Saiba como definir e defender seus SLOs no pacote de operações do Google Cloud e melhorar a observabilidade dos aplicativos em execução no Google Cloud.

Tutorial
SRE: medição e gerenciamento de confiabilidade

Neste curso, você aprenderá a teoria dos objetivos de nível de serviço (SLOs), uma maneira de descrever e avaliar a confiabilidade pretendida de um serviço com base em princípios.

Tutorial
Como desenvolver uma cultura de SRE do Google

Neste curso, apresentamos as principais práticas de SRE do Google e o papel importante que os líderes de TI e de negócios desempenham em uma adoção organizacional de SRE bem-sucedida.

O que há de novo

O que há de novo na SRE do Google Cloud

Inscreva-se na newsletter do Google Cloud para receber atualizações de produtos, informações sobre eventos, ofertas especiais e muito mais.