베어메탈 솔루션 환경에서 모니터링

베어메탈 솔루션을 사용하면 Google Cloud 데이터 센터 근처에 있는 리전 확장 프로그램에서 전문 워크로드를 실행할 수 있습니다. 베어메탈 솔루션 환경을 구현하면 전반적인 비용을 절감하고 클라우드로의 마이그레이션과 관련된 위험을 줄일 수 있습니다.

모니터링 개요

Google의 주요 우선순위 중 하나는 베어메탈 솔루션 환경에 가장 높은 가용성을 제공하는 것입니다. 이러한 이유로 Google Cloud와 Google 파트너는 다양한 모니터링 활동을 수행하고 있습니다. 다음은 Google에서 모니터링하는 베어메탈 솔루션 환경의 인프라 기기 목록입니다.

컴퓨팅 인프라

  • 서버 하드웨어

스토리지 인프라

  • 저장 기기
  • SAN 스위치

네트워크 인프라

  • 라우터
  • 스위치
  • Interconnect 인프라

또한 Google Cloud는 서버 룸 온도 및 습도를 포함한 데이터 센터 환경을 추적합니다.

Google은 운영체제, 애플리케이션 수준 활동 및 워크로드, 베어메탈 솔루션 서버를 오가는 네트워크 트래픽을 모니터링하지 않습니다. Cloud 운영을 사용하여 OS 수준 활동을 모니터링할 수 있는 유틸리티를 미리 보려면 Google Cloud 영업팀에 문의하세요.

모니터링 도구

Google 파트너는 정보 기술 인프라 라이브러리(ITIL)를 준수하는 상업용 소프트웨어 솔루션을 모니터링합니다. 또한 Google Cloud 및 Google 파트너는 Pub/Sub, Cloud Run 함수, Cloud Monitoring과 같은 Google Cloud 서비스를 사용하여 이러한 모니터링 데이터를 수집하고 처리합니다. Google의 내부 티켓팅 및 알림 시스템은 이러한 서비스를 직접 사용합니다.

모니터링 데이터

대략적으로 Google의 모니터링 데이터는 다음 소스에서 제공됩니다.

  • SNMP 트랩
  • Syslog 메시지
  • 전용 관리 소프트웨어의 메시지
  • 지능형 플랫폼 관리 인터페이스(IPMI)

모니터링되는 기기의 일반적인 측정항목:

  • CPU 사용률
  • 네트워크 인터페이스:
    • 대역폭 사용률
    • 패킷 삭제
    • 오류

알림

Google Cloud는 베어메탈 솔루션 환경의 특정 요구사항에 대한 광범위한 정규화 및 검증 활동을 수행해 왔습니다. 만일 인증된 이벤트가 정상 범위를 벗어나면 모니터링 시스템에서 알림을 트리거합니다.

이슈 관리

Google Cloud 및 Google 파트너 인프라 제공업체에는 이슈 대응을 담당하는 전담팀이 연중무휴 운영됩니다. 브리지팀은 연중무휴 운영되며 각 지원 티켓의 초기 분석을 수행하고 문제를 완화하는 데 필요한 조치를 취합니다. Google은 이슈 심각도에 따라 적절한 팀을 배치하여 이슈를 해결합니다.

Cloud Customer Care는 Google Cloud 엔지니어링 SysOps팀과 협력합니다. 업데이트를 제공하고 사용자 도움이 필요한 모든 조치를 조정할 수 있습니다. 필요한 경우 Google Cloud 엔지니어링팀은 인프라 제공업체 파트너나 하드웨어 공급업체와 협력하여 문제를 해결합니다.

근본 원인 분석 프로세스

이슈가 광범위하고 심각한 영향을 미치는 경우 Google은 증상, 영향, 근본 원인, 구제 조치, 이슈의 향후 방지 대책을 개략적으로 설명하는 이슈 보고서를 제공합니다. 사후 조사와 마찬가지로 Google은 문제로부터 학습을 시작하고 안정성을 개선하는 데 필요한 조치에 각별히 주의를 기울입니다.

부디 인프라와 애플리케이션을 클라우드로 마이그레이션할 때 베어메탈 솔루션 환경에서 안심하고 모니터링 기능을 사용할 수 있기를 바랍니다.