Monitorização num ambiente de Solução Bare Metal
A solução Bare Metal permite-lhe executar cargas de trabalho especializadas em extensões regionais localizadas perto de Google Cloud centros de dados. Ao implementar um ambiente da Solução Bare Metal, pode reduzir os custos gerais e os riscos associados à migração para a nuvem.
Vista geral da monitorização
Uma das nossas principais prioridades é oferecer a maior disponibilidade possível para o ambiente da Solução Bare Metal. Por esse motivo, Google Cloud nós e os nossos parceiros realizamos várias atividades de monitorização. Segue-se uma lista de dispositivos de infraestrutura num ambiente da Solução Bare Metal que monitorizamos:
Infraestrutura de computação
- Hardware do servidor
Infraestrutura de armazenamento
- Dispositivos de armazenamento
- Comutadores SAN
Infraestrutura de rede
- Routers
- Interruptores
- Infraestrutura de interligação
Google Cloud também monitoriza o ambiente do centro de dados, incluindo a temperatura e a humidade da sala de servidores.
Não monitorizamos sistemas operativos, atividade ao nível da aplicação e cargas de trabalho, nem tráfego de rede que se desloca para e a partir dos servidores da Bare Metal Solution. Para pré-visualizar uma utilidade que lhe permite usar as Cloud Operations para monitorizar a atividade ao nível do SO, contacte Google Cloud Vendas.
Ferramentas de monitorização
O nosso parceiro usa soluções de software de nível comercial para monitorização que estão em total conformidade com a Information Technology Infrastructure Library (ITIL).Google Cloud O nosso parceiro também usa Google Cloud serviços, como o Pub/Sub, as funções do Cloud Run e o Cloud Monitoring, para recolher e processar estes dados de monitorização. Os nossos sistemas internos de notificações e pedidos funcionam diretamente com estes serviços.
Dados de monitorização
A um nível elevado, os nossos dados de monitorização provêm das seguintes origens:
- Armadilhas SNMP
- Mensagens Syslog
- Mensagens de software de gestão dedicado
- Intelligent Platform Management Interface (IPMI)
Métricas comuns dos dispositivos monitorizados:
- Utilização da CPU
- Interface de rede:
- Utilização da largura de banda
- Rejeições de pacotes
- Erros
Alertas
Google Cloud realizaram atividades de normalização e validação extensivas para os requisitos específicos do ambiente da Bare Metal Solution. Se um evento certificado estiver fora do intervalo normal, o sistema de monitorização aciona um alerta.
Gestão de incidentes
Google Cloud e o nosso fornecedor de infraestrutura parceiro têm uma equipa disponível 24 horas por dia, 7 dias por semana, responsável pela resposta a incidentes. Uma equipa de ligação também está disponível 24 horas por dia, 7 dias por semana para realizar a análise inicial de cada pedido de apoio técnico e tomar as ações necessárias para mitigar o problema. Com base na gravidade do incidente, implementamos as equipas adequadas para resolver o incidente.
O Cloud Customer Care trabalha com a Google Cloud equipa de engenharia de operações de sistemas. Podem fornecer-lhe atualizações e coordenar quaisquer ações que exijam a sua ajuda. Conforme necessário, a Google Cloud equipa de engenharia interage com o parceiro fornecedor de infraestrutura ou os fornecedores de hardware para ajudar a resolver o seu problema.
Processo de análise da causa principal
Quando os incidentes têm um impacto amplo e grave, a Google fornece relatórios de incidentes que descrevem os sintomas, o impacto, a causa principal, a correção e a prevenção futura de incidentes. Tal como nas análises post mortem, prestamos especial atenção aos passos que damos para aprender com o problema e melhorar a fiabilidade.
Esperamos que este resumo das nossas capacidades de monitorização ajude a ter confiança no ambiente da solução Bare Metal à medida que migra a sua infraestrutura e aplicações para a nuvem.