상태 모니터링

이 페이지에서는 상태 대시보드에 액세스하여 잠재적인 문제를 모니터링하고 식별하는 방법을 설명합니다.

상태를 사용하면 Google Distributed Cloud (GDC) 오프라인 어플라이언스 인프라의 필수 측정항목을 시각화하고 구성요소 상태의 개요를 확인할 수 있습니다. 상태 대시보드를 시각화하면 문제 해결을 위한 조사 중에 근본 원인을 파악하고, 동작을 진단하고, 추가 컨텍스트를 얻을 수 있습니다.

GDC는 다음을 포함한 각 하드웨어 및 소프트웨어 구성요소의 상태를 모니터링하고 제공합니다.

  • 하드웨어: 서버 노드
  • 소프트웨어: 클러스터, VM, 스토리지

상태 대시보드를 사용하면 각 구성요소가 모니터링 상태를 측정하는 측정항목을 시각화할 수 있습니다.

시작하기 전에

루트 클러스터에는 인프라 운영자를 위한 Grafana 인스턴스가 포함되어 있습니다. 이러한 Grafana 인스턴스에는 상태 대시보드가 포함되어 있습니다.

Grafana 인스턴스의 대시보드에서 데이터 시각화에 안전하게 액세스하려면 역할 기반 액세스 제어가 필요합니다. 따라서 시작하기 전에 섹션의 안내에 따라 대시보드에서 측정항목을 쿼리하고 확인하여 Grafana 인스턴스의 대시보드에 액세스하세요.

Grafana 엔드포인트

다음 URL 중 하나를 열어 infra-obs 프로젝트 또는 루트 관리자 클러스터의 Grafana 엔드포인트에 액세스합니다.

  • infra-obs 프로젝트의 Grafana 엔드포인트:

    https://GDC_URL/infra-obs/grafana
    

    GDC_URL을 GDC의 조직 URL로 바꿉니다.

  • 루트 관리자 클러스터의 Grafana 엔드포인트:

    https://ROOT_ADMIN_CLUSTER_URL/grafana
    

    ROOT_ADMIN_CLUSTER_URL를 GDC의 루트 관리자 클러스터 URL로 바꿉니다.

사용 사례

이 섹션에는 실제 사례에 대시보드를 사용하는 방법의 예가 포함되어 있습니다.

성능 조정

구성요소의 성능이 좋지 않지만 SLO에 영향을 미치거나 알림을 트리거하지 않는 경우 개발자에게 선제적으로 연락하여 향후 문제가 발생하지 않도록 할 수 있습니다.

마찬가지로 구성요소는 올바른 성능 트레이드오프를 만들기 위해 기능이 작동하는 방식을 알고 싶어할 수 있습니다. 건강 상태는 구성요소에 필요한 정보를 수집하는 한 가지 메커니즘입니다.

기능 개발

고객이 새 기능을 출시하기 위해 변경사항이나 GDC 계획을 요청한다고 가정해 보겠습니다. 이 경우 관련 구성요소의 상태를 관찰하여 새 기능 또는 변경사항을 지원할 수 있는지 확인할 수 있습니다. 또한 상태는 작업의 우선순위를 지정할 때 제품 결정을 내리는 데 사용할 수 있습니다.

예를 들어 구성요소의 평균 지연 시간이 500ms이고 이를 250ms로 줄이고자 한다고 가정해 보겠습니다. 이 경우 팀은 50% 의 점진적 감소의 상대적 비용을 계산하고 이를 응답 시간이 250ms인 엔드포인트 설계와 비교할 수 있습니다.