Engenharia de confiabilidade do site (SRE)
Benefícios
Encontre o equilíbrio entre velocidade e confiabilidade
Aproveite os benefícios da velocidade
Automatize todo o processo, desde a escrita de um código até a execução de serviços na produção. Alinhe o desenvolvimento e as operações em torno das metas compartilhadas para agilizar o processo. Conecte-se às ferramentas que você adora, incluindo o gerenciamento de incidentes, enquanto minimiza o trabalho.
Melhore a confiabilidade com os princípios de SRE comprovados
Aproveite os princípios de SRE desenvolvidos no Google e comprovados trabalhar em escala. Implemente facilmente práticas recomendadas de SRE com o pacote de operações do Google Cloud (em inglês) para acelerar a resolução de problemas e melhorar a confiabilidade.
Encontramos você onde está na sua jornada de SRE
Aumente a entrega de software, independentemente do tamanho da empresa, do setor ou se você usa VMs, Kubernetes ou Serverless. Escolha uma das ferramentas gratuitas ou das ofertas pagas para impulsionar sua jornada de SRE.
Principais recursos
Ferramentas e recursos de SRE para tornar suas operações e as equipes de SRE mais eficientes
Monitorar a integridade do serviço usando os princípios da SRE
Monitore a integridade dos serviços e trabalhe com desenvolvedores para aumentar a velocidade das mudanças usando o suporte integrado para o monitoramento de serviços. Selecionar métricas para SLIs, defina SLOs e rastrear erro de orçamento para reduzir o risco do seu serviço. Use painéis eficientes para agregar métricas e registros, incluindo sinais dourados e reduzir o MTTR } e responda a perguntas rapidamente sobre a integridade do serviço.
Integrações prontas para uso para aumentar a automação e reduzir o trabalho
Use nossas integrações com as ferramentas que você adora para resolver incidentes rapidamente. Implemente lançamentos progressivos e reverta alterações com segurança. Integrações pré-criadas com o Cloud Build estão disponíveis para que você possa criar, testar e implantar artefatos no Google Kubernetes Engine, App Engine, Cloud Functions, Firebase e Cloud Run como parte da CI/CD.
Uma visualização integrada para resolução mais rápida
Tenha uma visualização unificada de todos os registros, eventos, métricas e SLOs. Receba dados de observabilidade no contexto, diretamente nos consoles de serviços do Google Kubernetes Engine, Cloud Run, Compute Engine, Anthos e outros ambientes de execução. Colete métricas, traces e registros sem nenhuma configuração. Com a latência de ingestão de menos de um segundo e a taxa de ingestão de terabytes por segundo, é possível realizar o gerenciamento de registros e análises em tempo real em escala.
Receber mais ajuda de especialistas do Google Cloud SRE
Se você precisar de mais ajuda prática durante a jornada, use outros serviços, como os serviços de consultoria do Google. Entre em contato com a equipe de vendas para ver qual opção seria melhor para sua organização. Veja com nossa equipe CRE e histórias de sucesso de clientes como as ferramentas e práticas do Google Cloud ajudaram outras empresas a implementar a SRE na organização.
Impulsione a colaboração SRE/desenvolvedor para a observação da "mudança para a esquerda"
Com os pacotes da OpenTelemetry (OT) e o Google Exporter, os desenvolvedores podem instrumentar e exportar dados de rastreamento para o Cloud Trace. Nosso novo agente de operações unificado (na visualização), coleta métricas e registros, também é compatível com a OpenTelemetry para capturar e transportar métricas. Estamos trabalhando para implementar bibliotecas de OT como recursos prontos para uso em muitos dos nossos produtos de nuvem. O Cloud SQL Insights é um exemplo desse esforço.
Serviços relacionados
Integrações e produtos de SRE
Crie e implante novos aplicativos de nuvem, armazene artefatos e monitore a confiabilidade e a segurança dos apps no Google Cloud.
Documentação
Saiba como implementar a SRE na sua organização com estes recursos
Engenharia de confiabilidade de sites do Google
Acesse os livros sobre SRE, ouça os SREs e saiba como fazemos isso no Google.
Como criar um SLO
Para monitorar um serviço, você precisa de pelo menos um objetivo de nível de serviço (SLO). Aprenda como criar seu primeiro SLO no Cloud Monitoring.
Engenharia de confiabilidade
Saiba como definir e defender seus SLOs no pacote de operações do Google Cloud e melhorar a observabilidade dos aplicativos em execução no Google Cloud.
SRE: medição e gerenciamento de confiabilidade
Neste curso, você aprenderá a teoria dos objetivos de nível de serviço (SLOs), uma maneira de descrever e avaliar a confiabilidade pretendida de um serviço com base em princípios.
Como desenvolver uma cultura de SRE do Google
Neste curso, apresentamos as principais práticas de SRE do Google e o papel importante que os líderes de TI e de negócios desempenham em uma adoção organizacional de SRE bem-sucedida.
O que há de novo na SRE do Google Cloud
Inscreva-se na newsletter do Google Cloud para receber atualizações de produtos, informações sobre eventos, ofertas especiais e muito mais.