애플리케이션 모니터링 지원 인프라

다음 표에는 애플리케이션 모니터링과 통합된 인프라 리소스가 나와 있습니다. 이러한 리소스가 App Hub 서비스나 워크로드로 등록되면 리소스에서 생성하는 원격 분석에는 애플리케이션별 라벨이 포함됩니다. 이 원격 분석에는 플랫폼 및 감사 로그 항목, 측정항목 데이터, 추적 데이터가 포함됩니다. App Hub와 통합된 서비스 및 워크로드 목록은 App Hub 지원 리소스를 참고하세요.

애플리케이션 모니터링에서 생성된 기본 (OOTB) 대시보드는 데이터에 애플리케이션별 라벨이 포함된 경우 다음 골든 시그널을 비롯한 로그 및 측정항목 데이터를 표시합니다.

  • 트래픽: 선택한 기간 동안 서비스 또는 워크로드의 수신 요청 비율입니다.
  • 서버 오류율: 선택한 기간 동안 5xx HTTP 응답 코드를 생성하거나 여기에 매핑되는 수신 요청의 평균 비율입니다.
  • P95 지연 시간: 선택한 기간 동안 처리된 요청의 지연 시간에 대한 95번째 백분위수(밀리초)입니다.
  • 포화도: 서비스 또는 워크로드의 포화도를 측정합니다. 예를 들어 관리형 인스턴스 그룹(MIG), Cloud Run, Google Kubernetes Engine 배포의 경우 이 필드에 CPU 사용률이 표시됩니다.

지원되는 인프라 리소스

참고 열에는 지원되는 골든 신호에 대한 세부정보가 표시됩니다. 이 열에 제한사항도 표시됩니다.

인프라 리소스 골든 시그널 참고사항 및 제한사항
PostgreSQL용 AlloyDB 클러스터
(리전)
애플리케이션 라벨이 스팬에 연결되지 않습니다.
PostgreSQL용 AlloyDB 인스턴스
(리전)
애플리케이션 라벨이 스팬에 연결되지 않습니다.
Bigtable 클러스터
(리전)
애플리케이션 라벨이 스팬에 연결되지 않습니다.
Bigtable 인스턴스
(리전)
애플리케이션 라벨이 측정항목 데이터나 스팬에 연결되지 않습니다.
Cloud Run 작업
(리전)
Cloud Run 서비스 및 함수
(리전)

계측된 워크로드에서 생성된 추적 스팬에만 애플리케이션 라벨이 포함됩니다.

Cloud Run 내에서 실행되는 고객 계측 워크로드만 골든 시그널을 생성합니다.

Cloud Logging 로그 버킷
(전역 및 리전)
감사 로그에만 애플리케이션 라벨이 포함됩니다.
Cloud SQL 인스턴스
(리전)
애플리케이션 라벨이 스팬에 연결되지 않습니다.
Cloud Storage 버킷
(리전 및 멀티 리전)
  • 트래픽: api/request_count
  • 서버 오류율: 전체 요청 수 대비 응답 상태가 오류를 나타내는 요청의 비율입니다. 다음 상태 값은 오류를 나타냅니다.
    • DATA_LOSS
    • DEADLINE_EXCEEDED
    • INTERNAL
    • UNAVAILABLE
    • UNIMPLEMENTED
    • UNKNOWN
애플리케이션 라벨이 스팬에 연결되지 않습니다.
Compute Engine MIG
(리전 및 영역)
Dataproc Metastore 서비스
(리전 및 멀티 리전)

애플리케이션 라벨이 스팬에 연결되지 않습니다.

일반적인 내용은 Dataproc Metastore 개요를 참고하세요.

Cloud Deploy 배포 파이프라인
(리전)
애플리케이션 라벨이 스팬에 연결되지 않습니다.
Firestore 데이터베이스
(리전)
  • 트래픽: api/request_count
  • 서버 오류율: 전체 요청 수 대비 응답 상태가 오류를 나타내는 요청의 비율입니다. 다음 상태 값은 오류를 나타냅니다.
    • DEADLINE_EXCEEDED
    • INTERNAL
    • UNAVAILABLE
    • UNIMPLEMENTED
  • P95 지연 시간: api/request_latencies
애플리케이션 라벨이 스팬에 연결되지 않습니다.
Kubernetes CronJobs
(리전 및 영역)
GKE에서 크론 작업을 실행하는 방법은 GKE의 크론 작업 소개를 참조하세요.
Kubernetes DaemonSets
(리전 및 영역)
  • 포화도: container/cpu/request_cores 대비 container/cpu/core_usage_time의 비율입니다.
  • 트래픽, 서버 오류율, P95 지연 시간: GKE에서 실행되는 워크로드의 경우 이러한 신호는 OpenTelemetry를 사용하여 애플리케이션을 계측할 때만 사용할 수 있는 Prometheus 측정항목 http_server_request_duration_seconds에서 캡처됩니다. 자세한 내용은 애플리케이션 계측을 참고하세요.
Kubernetes 배포
(리전 및 영역)
  • 포화도: container/cpu/request_cores 대비 container/cpu/core_usage_time의 비율입니다.
  • 트래픽, 서버 오류율, P95 지연 시간: GKE에서 실행되는 워크로드의 경우 이러한 신호는 OpenTelemetry를 사용하여 애플리케이션을 계측할 때만 사용할 수 있는 Prometheus 측정항목 http_server_request_duration_seconds에서 캡처됩니다. 자세한 내용은 애플리케이션 계측을 참고하세요.
Kubernetes StatefulSets
(리전 및 영역)
  • 포화도: container/cpu/request_cores 대비 container/cpu/core_usage_time의 비율입니다.
  • 트래픽, 서버 오류율, P95 지연 시간: GKE에서 실행되는 워크로드의 경우 이러한 신호는 OpenTelemetry를 사용하여 애플리케이션을 계측할 때만 사용할 수 있는 Prometheus 측정항목 http_server_request_duration_seconds에서 캡처됩니다. 자세한 내용은 애플리케이션 계측을 참고하세요.
StatefulSet를 사용하거나 스테이트풀(Stateful) 애플리케이션을 배포하는 방법은 Google Kubernetes Engine의 StatefulSet 정보를 참조하세요.
HTTP 또는 HTTPS 트래픽이 있는 레이어 7 외부 및 내부 애플리케이션 부하 분산기
(전역 및 리전)
  • 트래픽: https/request_count와 같이 요청 수를 기록하는 Cloud Load Balancing 측정항목 유형을 기반으로 합니다. Cloud Load Balancing 구성에 따라 실제 측정항목이 결정됩니다.
  • 서버 오류율: 전체 요청 수 대비 응답 상태가 5xx인 요청 수의 비율입니다.
  • P95 지연 시간: https/total_latencies와 같이 총 지연 시간을 기록하는 Cloud Load Balancing 측정항목 유형을 기반으로 합니다. Cloud Load Balancing 구성에 따라 실제 측정항목이 결정됩니다.
애플리케이션 부하 분산기의 경우 전달 규칙백엔드 서비스만 App Hub와 통합됩니다. 애플리케이션 라벨이 스팬에 연결되지 않습니다.
Memorystore for Redis Cluster
(리전)
애플리케이션 라벨이 로그 항목이나 스팬에 연결되지 않습니다.
Memorystore for Redis 인스턴스
(리전)
애플리케이션 라벨이 측정항목 데이터나 스팬에 연결되지 않습니다.
Pub/Sub 주제
(전역)
애플리케이션 라벨이 스팬에 연결되지 않습니다.
Pub/Sub 구독
(전역)
애플리케이션 라벨이 스팬에 연결되지 않습니다.
Secret Manager 보안 비밀
(전역 및 리전)
애플리케이션 라벨이 스팬에 연결되지 않습니다.
Spanner 데이터베이스
(전역 및 리전)
애플리케이션 라벨이 측정항목 데이터나 스팬에 연결되지 않습니다.
Spanner 인스턴스
(전역 및 리전)
  • 트래픽: api/api_request_count
  • 서버 오류율: 전체 요청 수 대비 응답 상태가 오류를 나타내는 요청의 비율입니다. 다음 상태 값은 오류를 나타냅니다.
    • data_loss
    • deadline_exceeded
    • internal
    • unavailable
    • unimplemented
    • unknown
  • P95 지연 시간: api/request_latencies
  • 포화도: instance/cpu/utilization
애플리케이션 라벨이 스팬에 연결되지 않습니다.