성능 대시보드 개요

성능 대시보드는 Virtual Private Cloud(VPC) 네트워크의 성능에 대한 시각화를 제공합니다. 가상 머신(VM) 인스턴스가 있는 영역 간에 패킷 손실(가용성) 측정항목과 지연 시간(왕복 시간 또는 RTT) 측정항목을 제공합니다.

성능 대시보드는 전체 영역에서 집계된 VM 간 패킷 손실 및 지연 시간(RTT)에 대한 요약 차트 및 히트맵 뷰를 제공합니다. 지난 6주간의 값 내역을 볼 수 있습니다. Cloud Monitoring을 사용하여 이러한 측정항목을 쿼리할 수도 있습니다.

이러한 네트워크 성능 모니터링 기능을 사용하면 애플리케이션의 문제와 기본 Google Cloud 네트워크의 문제를 빠르게 구분하고 네트워크 성능 문제 내역을 쉽게 디버깅할 수 있습니다.

측정항목

성능 대시보드에서는 패킷 손실 측정항목과 지연 시간 측정항목 등 두 가지 측정항목을 제공합니다. 두 측정항목 모두 내부 IP 주소와 외부 IP 주소에 대해 측정됩니다. 내부 IP 주소의 패킷 손실은 UDP 패킷을 통해 측정되고 외부 IP 주소의 패킷 손실은 TCP 패킷을 통해 측정됩니다. 지연 시간 측정항목은 모두 TCP 기반입니다.

VM이 있는 프로젝트의 모든 영역에 대해 성능 대시보드 측정항목이 자동으로 수집됩니다. 성능 대시보드에서 프로버를 수동으로 설정 또는 설치할 필요가 없습니다. 하지만 패킷 손실 측정항목을 가져오려면 프로젝트에 VM이 충분하게 있어야 하고 지연 시간 측정항목을 가져오려면 트래픽이 충분하게 있어야 합니다.

Google Kubernetes Engine(GKE)에서 만든 VM을 포함한 모든 VM은 프로젝트의 총 VM 수에 포함됩니다.

패킷 손실 측정항목

패킷 손실 측정항목에서는 지정된 VPC 네트워크의 VM 간의 활성 프로브 결과를 보여줍니다. 성능 대시보드는 VM이 있는 물리적 호스트에서 작업자를 실행합니다. 이러한 작업자는 트래픽과 동일한 네트워크에서 실행되는 프로브 패킷을 삽입 및 수신하여 네트워크 문제를 나타냅니다. 작업자는 VM이 아닌 물리적 호스트에서 실행되므로 이러한 작업자는 VM 리소스를 소비하지 않으며 트래픽이 VM에 표시되지 않습니다. 패킷 손실은 모든 영역 쌍에 대해 집계됩니다.

프로브 수에 따라 패킷 손실 측정의 신뢰도 수준은 3가지입니다. 프로브 수는 VM 수에 비례합니다.

  • 분당 충분한 수의 프로브가 충족되면 표시되는 값의 신뢰도는 90% 이상입니다.

  • 분당 프로브 수가 90% 신뢰도에 부족하지만 최솟값을 초과하면 히트맵이 값 옆에 별표(*)를 표시합니다.

  • 최소 프로브 수가 충족되지 않으면 히트맵에 NA가 표시됩니다.

프로브가 네트워크 하위 집합에서 패킷 손실을 측정하여 같은 네트워크에서 발생할 수 있는 패킷 손실을 예측합니다. 프로빙 속도는 영역당 VM 수에 따라 다르며 데이터에 대한 신뢰도는 프로빙 속도에 따라 다릅니다.

  • 신뢰도 95%로 신뢰할 수 있는 성능 대시보드 데이터의 경우(최대 오류 발생 가능성 5%) 각 영역에 VM이 프로젝트에 있는 영역 수에 10을 곱한 수로 있어야 합니다. 프로젝트에 영역이 12개 있는 경우 패킷 손실 측정항목에 대한 신뢰도 90%를 얻으려면 각 영역에 VM이 120개 있어야 합니다.

  • 신뢰도 90%의 경우 각 영역에 VM이 프로젝트의 영역 수에 2.5를 곱한 수로 있으면 됩니다. 영역이 12개인 경우 각 영역에 VM이 30개 있어야 합니다.

  • 프로브의 수가 적어 신뢰도가 낮으면 성능 대시보드에 *가 표시됩니다.

  • 신뢰할 수 있는 프로브가 너무 적으면 성능 대시보드에 NA가 표시됩니다.

공유 VPC를 사용하는 두 프로젝트 간의 패킷 손실은 대상 서비스 프로젝트에 대해 측정됩니다.

프로브는 서로 통신할 수 있는 VM의 전체 메시를 포괄하며 이는 트래픽 패턴과 반드시 동일하지는 않습니다. 따라서 성능 대시보드에 패킷 손실이 표시될 수 있지만 애플리케이션에는 패킷 손실이 나타나지 않습니다.

지연 시간 측정항목

실제 TCP VM 트래픽의 샘플을 기반으로 하는 이 측정항목은 VPC 흐름 로그에 사용된 샘플링 방법과 유사합니다. 지연 시간은 TCP 시퀀스 번호(SEQ) 전송과 네트워크 RTT 및 TCP 스택 관련 지연이 포함된 해당 ACK 수신 간의 경과 시간으로 계산됩니다. UI는 지연 시간을 모든 관련 측정의 중앙값으로 표시합니다.

지연 시간 측정항목은 TCP 트래픽이 분당 약 1000 패킷 이상인 경우에만 사용할 수 있습니다.

측정항목 요약 표

이 표에는 패킷 손실 및 지연 시간 측정항목을 보고하는 데 사용되는 프로빙 메서드 및 프로토콜이 요약되어 있습니다.

패킷 손실 지연 시간
프로빙 메서드 활성 프로빙(합성 VM 트래픽) 수동 프로빙(실제 VM 트래픽)
프로토콜 UDP(내부 IP), TCP(외부 IP) TCP(내부/외부 IP)

사용 사례

현재 성능 진단: 네트워크입니까, 아니면 애플리케이션입니까?

성능 대시보드는 VPC 네트워크 성능에 대한 실시간 가시성을 제공하여 애플리케이션 문제가 소프트웨어 또는 네트워크 문제의 결과인지 확인할 수 있습니다. 패킷 손실이 심하거나 지연 시간이 길면 Google Cloud 네트워크 문제가 문제의 일부 또는 전부일 수 있습니다. 패킷 손실 및 지연 시간이 정상적으로 보이면 애플리케이션에 문제가 있을 수 있습니다.

시나리오: 지금 발생하는 문제 조사

성능 대시보드를 열고 지난 1시간 동안 패킷 손실 요약 차트에서 급격한 증가를 볼 수 있습니다. 이 차트는 모든 영역에서의 패킷 손실을 요약하므로 패킷 손실이 발생한 위치를 아직 확인할 수 없습니다.

현재 패킷 손실(확대하려면 클릭)
현재 패킷 손실(확대하려면 클릭)

더 자세히 조사하려면 급격한 증가가 발생한 시간을 클릭하여 영역 쌍 히트맵을 봅니다. 요약 차트의 시간 축에서 선택기를 드래그하여 보고 있는 시간을 정확하게 조정할 수 있습니다.

시간을 클릭하여 시간 세부정보 확인(확대하려면 클릭).
시간을 클릭하면 해당 시간의 세부정보를 볼 수 있습니다(확대하려면 클릭)

히트맵에는 요약 차트에서 선택한 시간의 데이터가 표시됩니다. 히트맵 사각형은 히트맵 왼쪽의 범례에 따라 색상으로 구분됩니다. 각 색상은 한 영역에서 다른 영역으로의 패킷 손실 비율 차이를 나타냅니다.

특정 시간 동안의 패킷 손실 히트맵(확대하려면 클릭)
특정 시간 동안의 패킷 손실 히트맵(확대하려면 클릭)

패킷 손실은 각 방향으로 측정되므로 패킷 손실을 나타내는 정사각형은 소스 축에 표시된 영역에서 대상 축에 표시된 영역으로의 패킷 손실을 나타냅니다. 히트맵의 각 사각형에는 패킷 손실에 대한 백분율 값도 표시됩니다.

구체적으로 영역 쌍의 차트를 보려면 대상 영역 us-central1-a에 대한 소스 영역 europe-west1-b의 보라색 정사각형을 클릭합니다. 세부정보 차트는 이전 페이지의 시간 선택에 따라 파란색 핀을 표시합니다.

선택한 시간 동안의 패킷 손실(확대하려면 클릭)
선택한 시간 동안 패킷 손실(확대하려면 클릭)

차트에는 데이터 흐름의 각 방향마다 하나씩 두 개의 선이 표시됩니다. 이 예시에서 자주색 선은 소스 영역 europe-west1-b에서 대상 영역 us-central1-a까지의 트래픽에 대한 패킷 손실을 보여줍니다. 빨간색 선은 소스 영역 us-central1-a에서 대상 영역 europe-west1-b까지의 반대 방향을 나타냅니다.

이 차트는 패킷 손실의 급증이 이상점이라는 것을 보여줍니다. 오른쪽 상단에 있는 시간 선택기를 클릭하여 이 영역 쌍에 대해 표시되는 데이터의 기간을 변경할 수 있습니다. 최대 6주간의 데이터를 볼 수 있습니다. 이 예시에서는 7일을 클릭하여 선택한 영역 쌍의 패킷 손실 추세를 확인합니다.

7일 동안의 패킷 손실(확대하려면 클릭)
7일 동안의 패킷 손실(확대하려면 클릭)

성능 진단 내역

시나리오: 최근 발생한 문제 조사

이번 주에 발생한 지연 시간 문제를 조사하고 있습니다. 성능 대시보드에서 성능 데이터 내역을 사용하여 해당 영역을 검사합니다.

뷰를 변경하려면 지연 시간 탭을 클릭합니다.

지연 시간 탭(확대하려면 클릭)
지연 시간 탭(확대하려면 클릭)

지연 시간 요약 차트의 기간을 조정하려면 오른쪽 상단에 있는 시간 선택기를 사용합니다. 이 예시에서는 1시간으로 설정되어 있습니다. 특정 시간의 지연 시간에 대한 히트맵을 보려면 차트의 시간 축에서 시간을 클릭합니다.

시간 선택(확대하려면 클릭)
시간 선택 (확대하려면 클릭)

차트의 왼쪽에는 일관되게 더 높은 값이 있으므로 시간 축을 클릭하여 해당 시점의 지연 시간에 대한 히트맵을 확인합니다.

지연 시간 히트맵(확대하려면 클릭)
지연 시간 히트맵(확대하려면 클릭)

히트맵에서 밝은 보라색 정사각형은 asia-east1-beurope-west2-c 영역 간의 지연 시간이 261밀리초(ms)임을 보여줍니다. 더 자세히 조사하려면 밝은 보라색 정사각형을 클릭합니다. 지연 시간 세부정보 차트가 열리면 이전 페이지에서 선택한 시간이 파란색 핀으로 표시됩니다.

지연 시간 급증(확대하려면 클릭)
지연 시간 급증(확대하려면 클릭)

파란색 선은 europe-west2-c에서 asia-east1-b로 이동하는 트래픽의 지연 시간이 급증한 것을 보여줍니다.

급증 부분을 확대하려면 마우스를 클릭하고 드래그하세요.

클릭하고 드래그하여 확대(확대하려면 클릭)
확대/축소하려면 클릭 및 드래그(확대하려면 클릭)

이제 급등이 2~3분 동안 지속되어 오전 8시 19분에 정점에 도달했음을 알 수 있습니다.

지연 시간 급증 세부정보(확대하려면 클릭)
지연 시간 급증 세부정보(확대하려면 클릭)

데이터 내역을 볼 때 데이터 시각화

하루 이상의 기간 동안 데이터를 볼 때 차트는 기본 데이터 주위에 밝은 색(후광)으로 추가 데이터를 제공합니다. 더 긴 기간으로 인해 데이터가 더 긴 간격으로 집계됩니다. 예를 들어 1시간 분량의 데이터는 1분 간격으로 집계되고 24시간 분량의 데이터는 5분 간격으로 집계됩니다. 선을 둘러싼 밝은 색상은 기본 선을 그리도록 집계된 가장 낮은 값에서 가장 높은 값의 범위를 나타냅니다.

집계된 이전 데이터(확대하려면 클릭)
집계된 데이터 내역(확대하려면 클릭)

다음 단계