성능 대시보드 측정항목 및 뷰

이 페이지에서는 Google Cloud 프로젝트의 리소스 성능 및 전체 Google Cloud의 성능을 파악하는 데 사용되는 측정항목에 대해 설명합니다. 그리고 이러한 성능 측정항목에 대해 추가적인 세부정보를 보여주는 다양한 뷰에 대해서도 더 자세히 알아볼 수 있습니다.

측정항목

성능 대시보드는 패킷 손실 및 지연 시간(왕복 시간, 즉 RTT)과 같은 두 가지 유형의 측정항목을 제공합니다. Google Cloud 프로젝트의 패킷 손실 측정항목을 가져오려면 프로젝트에 VM 수가 충분하게 있어야 합니다. 지연 시간 측정항목을 가져오려면 트래픽 양이 충분해야 합니다. 또한 성능 대시보드에는 별도의 설정이 필요하지 않습니다.

다음 섹션에서는 두 측정항목을 자세히 설명합니다.

패킷 손실

패킷 손실 측정항목은 다음 VM 간의 활성 프로브 결과를 보여줍니다.

  • 단일 VPC 네트워크 내 VM.

  • 피어링된 VPC 네트워크의 VM(프로젝트 내 하나 또는 두 네트워크가 있는 경우). 피어링된 네트워크가 서로 다른 프로젝트에 있는 경우 패킷 손실이 대상 프로젝트에 표시됩니다.

  • 프로젝트에서 사용되는 공유 VPC 네트워크의 VM. 대상 서비스 프로젝트에서 공유 VPC 네트워크를 사용하는 두 프로젝트 간의 패킷 손실을 확인할 수 있습니다.

예를 들어 프로젝트 A에 두 개의 VPC 네트워크(영역 A에만 VM이 있는 네트워크 A, 영역 M에만 VM이 있는 네트워크 M)가 있다고 가정해 보겠습니다. 이러한 두 네트워크가 피어링되면 프로젝트 A의 성능 대시보드에는 A/M 영역 쌍의 패킷 손실 데이터가 표시됩니다. 네트워크가 피어링되지 않은 경우 성능 대시보드에는 해당 영역 쌍의 패킷 손실 측정항목이 표시되지 않습니다.

이러한 두 네트워크가 동일한 프로젝트에 있지 않은 경우 각 네트워크의 성능 대시보드에 측정항목이 표시되는 때가 언제인지 주의 깊게 살펴야 합니다. 즉, 네트워크 A가 프로젝트 A의 일부이고 네트워크 M이 프로젝트 M의 일부라고 가정합니다. 네트워크가 피어링되면 프로젝트 M의 성능 대시보드에는 영역 M이 대상 영역인 경우의 패킷 손실 데이터가 표시됩니다. 반대로 영역 A가 대상 영역이면 프로젝트 A에 대한 패킷 손실 데이터만 표시됩니다. 네트워크가 피어링되지 않은 경우, 프로젝트의 성능 대시보드에는 영역 쌍의 패킷 손실 데이터가 표시되지 않습니다.

모든 프로브를 통해 수집된 데이터는 성능 대시보드에서 집계됩니다. 즉, 성능 대시보드에서는 프로젝트 내 패킷 손실에 대한 데이터를 다른 유형(예: 다른 프로젝트의 피어링된 VPC 네트워크와 관련된 패킷 손실)과 별도로 분리할 수 없습니다. 하지만 Monitoring을 사용하여 더 세부적인 결과를 볼 수 있습니다. 자세한 내용은 성능 대시보드 측정항목 참조를 확인하세요.

성능 대시보드는 Cloud VPN 연결을 통해 프로브를 전송하지 않습니다.

방법론

성능 대시보드는 VM이 있는 물리적 호스트에서 작업자를 실행합니다. 이러한 작업자는 트래픽과 동일한 네트워크에서 실행되는 프로브 패킷을 삽입하고 수신합니다. 작업자는 VM이 아닌 물리적 호스트에서 실행되므로 이러한 작업자는 VM 리소스를 소비하지 않으며 트래픽이 VM에 표시되지 않습니다.

프로브는 서로 통신할 수 있는 VM의 전체 메시를 포괄하며 이는 트래픽 패턴과 반드시 동일하지는 않습니다. 따라서 성능 대시보드에 패킷 손실이 표시될 수 있지만 애플리케이션에는 패킷 손실이 나타나지 않습니다.

모든 프로브된 VM에 대해 Google Cloud는 내부 IP 주소와 외부 IP 주소(있는 경우)를 사용하여 VM에 액세스하려고 합니다. 프로브는 Google Cloud에서 나가지 않지만 성능 대시보드는 외부 IP 주소를 사용하여 인터넷에서 발생하는 트래픽과 같은 외부 트래픽이 사용하는 경로의 일부를 다룰 수 있습니다.

내부 IP 주소의 패킷 손실은 UDP 패킷을 통해 측정되고 외부 IP 주소의 패킷 손실은 TCP 패킷을 통해 측정됩니다.

측정항목 가용성 및 신뢰도 수준

성능 대시보드는 네트워크의 모든 VM-VM 쌍의 하위 집합을 조사합니다. 수집된 데이터는 발생할 수 있는 패킷 손실을 추정하는 데 사용됩니다. Google의 데이터 신뢰도는 프로빙 속도에 따라 달라지며 프로빙 속도는 각 영역에 있는 VM 수와 VM을 배포한 영역의 수에 따라 달라집니다. 예를 들어 두 영역에 VM이 10개 있으면 10개 영역에 VM이 10개 있는 것보다 신뢰도가 높아집니다.

Google Kubernetes Engine(GKE)에서 만든 VM을 포함한 모든 VM은 총 VM 수에 포함됩니다.

다음 표는 다양한 수준의 신뢰도를 설명합니다. 신뢰도 수준이 낮은 경우 히트맵에서 별표(*) 또는 N/A로 플래그됩니다.

수준 각 영역에 필요한 VM 수 히트맵에서 성능 대시보드가 보여주는 항목
신뢰도 95% VM 10개에 프로젝트의 영역 수를 곱합니다. 예를 들어 프로젝트에 영역이 12개 있으면 영역마다 VM이 120개 있어야 합니다. 추가적인 표기법이 없는 측정
신뢰도 90% VM 2.5개에 프로젝트의 영역 수를 곱합니다. 예를 들어 프로젝트에 영역이 12개 있으면 영역마다 VM이 30개 있어야 합니다. 추가적인 표기법이 없는 측정
신뢰도 낮음 별표가 있는 측정
의미있는 데이터를 얻을 만큼 프로브가 충분하지 않음 N/A

언제든지 Google Cloud 패킷 손실 측정항목을 사용할 수 있습니다. 분당 프로브가 400개 미만인 경우 별표(*)가 표시됩니다.

프로젝트별 지연 시간

지연 시간 측정항목은 다음 VM 간의 고객 트래픽을 사용하여 측정됩니다.

  • 단일 VPC 네트워크 내 VM
  • 피어링된 VPC 네트워크 간의 VM(네트워크가 동일한 프로젝트에 있는 경우)
  • VM 및 인터넷 엔드포인트

또한 공유 VPC 네트워크 내 서비스 프로젝트의 성능 대시보드는 서비스 프로젝트 내 영역에 대해서만 데이터를 표시합니다. 즉, 영역 A에 있는 VM과 서비스 프로젝트 A에서 호스트 프로젝트를 사용하여 영역 B에 있는 VM과 서비스 프로젝트 B와 통신한다고 가정해 보겠습니다. 서비스 프로젝트 또는 호스트 프로젝트에서는 트래픽을 측정할 수 없습니다.

Google Cloud 지연 시간

지연 시간 측정항목은 다음 VM 간의 실제 고객 트래픽을 사용하여 측정됩니다.

  • 단일 VPC 네트워크 내 VM
  • 피어링된 VPC 네트워크 간의 VM
  • VM 및 인터넷 엔드포인트

프로젝트 및 Google Cloud 지연 시간 방법론

지연 시간은 TCP 패킷을 사용하여 측정됩니다.

실제 트래픽의 샘플을 기반으로, 지연 시간은 TCP 시퀀스 넘버(SEQ)를 보내고 네트워크 RTT와 TCP 스택 관련 지연이 포함된 해당 ACK를 수신하기까지 경과한 시간이 계산됩니다. 대시보드는 지연 시간을 모든 관련 측정의 중앙값으로 표시합니다.

지연 시간 측정항목은 VPC 흐름 로그와 동일한 데이터 소스 및 샘플링 방법론을 기반으로 합니다.

프로젝트별 지연 시간은 프로젝트의 샘플을 기반으로 합니다. Google Cloud 지연 시간은 모든 Google Cloud의 샘플을 기반으로 합니다.

전역 지연 시간 측정항목은 Google Cloud에서 인터넷 엔드포인트로의 활성 프로브를 통하지 않고 TCP 트래픽 헤더의 수동 샘플링에서 파생됩니다.

지연 시간 측정항목 이상치

다음 지연 시간 측정항목 이상치에 유의하세요.

  • 저속 환경의 경우 Network Intelligence Center는 지연 시간 측정항목으로 60초 프로브를 사용합니다. 따라서 패킷 샘플링 기반의 RTT 측정항목이 TCP 기반 서비스가 지연된 애플리케이션 수준 응답을 반환할 때 높은 지연 시간 수준을 거짓되게 보고할 수 있습니다. 일반적으로 애플리케이션 수준 지연과 일치하는지 확인하여 RTT 수준이 부정확한지 확인할 수 있습니다.

    TCP 기반 서비스는 ACK로 신속하게 응답하지만 샘플링이 ACK를 누락하고 나중 데이터 응답을 훨씬 이른 SEND의 닫는 ACK로 간주하면 전체 RTT 측정이 왜곡됩니다. 이러한 경우 RTT 측정항목을 무시해도 됩니다.

  • 때로는 프로젝트별 지연 시간 데이터가 전역 지연 시간 데이터와 일치하지 않습니다. 전역 데이터 세트에서 특정 프로젝트에 사용되는 네트워크 경로와 지연 시간이 현저히 다른 네트워크 경로를 포함하면 이러한 불일치가 발생할 수 있습니다.

측정항목 가용성

언제든지 Google Cloud 지연 시간 측정항목을 사용할 수 있습니다. TCP 트래픽이 분당 약 1,000 패킷 이상인 경우에만 프로젝트당 지연 시간 측정항목을 사용할 수 있습니다.

측정항목 요약 표

다음 표에는 패킷 손실 및 지연 시간 측정항목을 보고하는 데 사용되는 프로브 메서드와 프로토콜이 요약되어 있습니다.

패킷 손실 지연 시간
프로빙 메서드 활성 프로빙(합성 VM 트래픽) 수동 프로빙(실제 VM 트래픽)
프로토콜 UDP(내부 IP 주소), TCP(외부 IP 주소) TCP(내부/외부 IP 주소)

지연 시간 뷰

인터넷에서 Google Cloud 방향 트래픽 유형의 지연 시간 세부정보는 테이블 뷰,지도 뷰, 타임라인 뷰의 세 가지 뷰로 제공됩니다.

테이블 뷰

테이블 뷰에는 선택한 지리적 위치와 프로젝트의 VM 인스턴스가 포함된 리전 간의 RTT 중앙값이 표시됩니다. 표에는 다음 세부정보가 포함됩니다.

  • 국가: 국가 이름입니다.
  • 도시: 도시 수입니다. 국가 세부정보 그래프에서 도시별 지연 시간 세부정보를 볼 수 있습니다.
  • 대상 리전: 특정 국가의 사용자 트래픽이 있는 대상 리전의 수입니다.
  • 지연 시간 중앙값: 국가와 리전 간 RTT 중앙값(밀리초)입니다.

지도 뷰

지도 뷰에는 지리적 위치(대도시 지역 또는 도시)와 Google Cloud 리전이 표시됩니다.

  • 특정 위치 및 Google Cloud 리전의 지연 시간 중앙값을 봅니다.
  • Google Cloud 리전을 선택하여 선택한 리전에 대한 트래픽이 있는 위치를 봅니다.
  • 사이드바의 지연 시간 그래프에서 위치별 세부정보를 봅니다.
  • 지도에서 검색창을 사용하여 위치를 검색합니다.

위치는 지도 위에 지연 시간 중앙값 범위를 나타내기 위해 파란색 계열의 음영을 사용해 표시됩니다. 다음 이미지의 세계 지도에서 특정 도시를 표시하는 원의 색상이 파란색 음영 한 가지일 수 있습니다. 파란색의 음영이 어두울수록 특정 Google Cloud 리전에 속하는 도시의 지연 시간이 길어집니다.

지도 위에 표시되는 지연 시간 중앙값 범위
지도 위에 표시되는 지연 시간 중앙값 범위(확대하려면 클릭)

타임라인 뷰

타임라인 뷰에는 선택한 지리적 위치와 Google Cloud 리전 간의 RTT 중앙값이 표시됩니다. 현재 지연 시간 측정항목과 6주간의 이전 데이터를 제공합니다. 필터를 사용하면 도시, 지역, 국가 수준으로 향하는 트래픽을 추가로 집계할 수 있습니다. 특정 리전-지리적 위치 쌍에 해당하는 지연 시간 측정항목은 해당 쌍에 충분한 Google Cloud 트래픽이 있는 경우에만 볼 수 있습니다.