SAP용 Google Cloud 에이전트를 사용하여 프로세스 모니터링

이 계획 가이드에서는 SAP용 Google Cloud 에이전트의 프로세스 모니터링 측정항목 수집 기능만을 집중적으로 다룹니다. 에이전트 및 모든 기능에 대한 자세한 내용은 SAP용 Google Cloud 에이전트 계획 가이드를 참조하세요.

Linux에서 SAP용 Google Cloud 에이전트는 SAP 애플리케이션의 프로세스를 모니터링하고 런타임 상태를 추적하는 데 도움을 줄 수 있습니다. 이 에이전트는 Compute Engine VM 인스턴스 또는 베어메탈 솔루션 서버에 에이전트를 설치한 후 사용 설정할 수 있는 프로세스 모니터링 측정항목 컬렉션을 통해 제공됩니다.

프로세스 모니터링 측정항목에 수집된 정보는 SAP 시스템 관련 문제를 해결하는 데 도움이 됩니다. 문제가 발생하면 Cloud Customer Care가 프로세스 모니터링 측정항목을 활용해서 해결 방법에 더 효과적으로 도달할 수 있게 도와줍니다. 프로세스 모니터링 측정항목을 사용하여 수집된 데이터는 SAP HANA 고가용성 클러스터 구성에 대한 관측 가능성을 제공합니다.

프로세스 모니터링 측정항목을 수집하도록 SAP용 Google Cloud 에이전트를 구성하는 방법은 프로세스 모니터링 측정항목 수집 구성을 참조하세요.

프로세스 모니터링 측정항목 유형

SAP용 Google Cloud 에이전트의 버전 2.6부터 에이전트에서 수집되는 프로세스 모니터링 측정항목은 다음과 같습니다.

  • 변경 속도가 빠른 측정항목: sap/hana/availability, sap/hana/ha/availability, sap/nw/availability가 포함됩니다. 이러한 측정항목은 기본 빈도인 5초로 수집됩니다. 이 수집 빈도는 구성 매개변수 process_metrics_frequency를 사용하여 업데이트할 수 있습니다.
  • 변경 속도가 느린 측정항목: 변경 속도가 빠른 측정항목 이외의 프로세스 모니터링 측정항목을 변경 속도가 느린 측정항목이라고 합니다. 이러한 측정항목은 기본 빈도인 30초로 수집됩니다. 이 수집 빈도는 구성 매개변수 slow_process_metrics_frequency를 사용하여 업데이트할 수 있습니다.

Cloud Monitoring 가격 책정

SAP용 Google Cloud 에이전트가 수집하여 Monitoring으로 전송하는 프로세스 모니터링 측정항목은 Monitoring에서 청구 가능 측정항목으로 분류되고 수집된 볼륨에 따라 가격이 책정됩니다.

에이전트가 프로세스 모니터링 측정항목을 수집하기 위해 SAP 시스템에 쿼리하는 빈도는 Monitoring에 전송되는 측정항목 볼륨에 영향을 줍니다.

프로세스 모니터링 측정항목은 기본적으로 5초마다 수집되는 변경 속도가 빠른 측정항목입니다.

Monitoring 가격 책정에 대한 자세한 내용은 Google Cloud Observability 가격 책정을 참조하세요.

샘플 비용 예상

SAP용 Google Cloud 에이전트를 사용하여 프로세스 모니터링 측정항목을 수집하기 위한 샘플 예상 비용을 보려면 수집된 바이트별로 청구되는 측정항목 가격 책정 예시를 참조하세요.

프로세스 모니터링 측정항목

다음 표에서는 SAP용 Google Cloud 에이전트에서 수집된 프로세스 모니터링 측정항목에 대해 설명합니다. 이 테이블의 측정항목 문자열에는 workload.googleapis.com/을 프리픽스로 추가해야 합니다. 다음 표에서는 항목에 이 프리픽스가 생략되어 있습니다.

측정항목 카테고리 설명
sap/hana/service SAP HANA SAP HANA 서비스 가용성에 대한 숫자 응답 코드입니다.
  • 0: 서비스가 실행 중이 아닙니다.
  • 1: 서비스가 실행 중입니다.
sap/hana/ha/replication SAP HANA SAP 시스템 ID, SAP 인스턴스 번호, SAP 서비스 이름을 기반으로 하는 SAP HANA 시스템 복제에 대한 숫자 응답 코드입니다.
  • 0: 오류가 발생했습니다.
  • 10: 시스템이 복제되고 있지 않습니다(독립형 모드).
  • 11: 연결에 오류가 발생했습니다.
  • 12: 기본 시스템이 마지막으로 다시 시작된 후 보조 시스템이 기본 시스템에 연결되지 않았습니다.
  • 13: 초기 데이터 전송이 진행 중입니다. 이 상태에서는 보조 시스템을 전혀 사용할 수 없습니다.
  • 14: 보조 시스템이 다시 동기화됩니다. 보조 시스템이 재시작을 완료했거나 일시적인 연결 손실로부터 복구된 상황을 예로 들 수 있습니다.
  • 15: 초기화 또는 기본 시스템과의 동기화가 완료되었고 보조 시스템이 계속 복제를 수행하는 중입니다. SYNC 모드에서는 데이터가 손실되지 않습니다.
sap/hana/availability SAP HANA SAP 시스템 ID, SAP 인스턴스 번호를 기반으로 하는 SAP HANA 시스템 가용성에 대한 숫자 응답 코드입니다.
  • 0: 하나 이상의 프로세스가 활성 상태가 아닙니다.
  • 1: 모든 프로세스가 활성 상태입니다.
sap/hana/ha/availability SAP HANA SAP 시스템 ID 및 SAP 인스턴스 번호를 기반으로 하는 SAP HANA 시스템 고가용성 상태에 대한 숫자 응답 코드입니다.
  • 0: 알 수 없는 상태
  • 1: 현재 노드가 보조 노드입니다.
  • 2: 기본 노드에 오류가 있습니다.
  • 3: 기본 노드가 온라인 상태이지만 복제가 완전히 작동하지 않습니다.
  • 4: 기본 노드가 온라인 상태이고 복제가 실행되고 있습니다.
sap/hana/query/state SAP HANA select * from dummy 쿼리를 기반으로 SAP HANA 상태 점검을 나타내는 숫자 응답 코드입니다. 값 0은 성공을 나타냅니다. 다른 값은 실패를 나타냅니다.
sap/hana/query/overalltime SAP HANA query/state0인 경우에만 보고됩니다. 클라이언트 측 시간과 서버 측 시간을 포함하여 쿼리로 수행된 전체 시간(마이크로초)입니다.
sap/hana/query/servertime SAP HANA query/state0인 경우에만 보고됩니다. 서버가 쿼리를 처리하는 데 걸린 시간(마이크로초)입니다.
sap/cluster/failcounts SAP HANA Linux HA 리소스의 failcount 값입니다. 리소스가 없으면 failcount가 등록되지 않습니다. 그렇지 않으면 클러스터 모니터링 crm_mon이 실패한 작업 수를 보고합니다.
sap/cluster/nodes Pacemaker 클러스터 Linux HA 클러스터 상태를 나타내는 숫자 응답 코드입니다.
  • -10: 알 수 없음
  • -1: 비정상 상태
  • 0: 종료
  • 1: 대기
  • 2: 온라인
sap/cluster/resources Pacemaker 클러스터 Linux HA 클러스터 리소스가 작동되어 실행 중인지 여부를 나타내는 숫자 응답 코드입니다.
  • -10: 알 수 없음
  • 0: 실패
  • 1: 중지됨
  • 2: 시작 중
  • 3: 리소스가 Master, Slave 또는 Started의 지속 상태 중 하나
sap/nw/availability SAP NetWeaver SAP 시스템 ID, SAP 인스턴스 번호, SAP 서비스 이름을 기반으로 하는 SAP NetWeaver 시스템 가용성에 대한 숫자 응답 코드입니다.
  • 0: 알 수 없는 상태
  • 1: 현재 노드가 활성 상태이거나 가동 중입니다.
sap/nw/service SAP NetWeaver SAP 시스템 ID, SAP 인스턴스 번호, SAP 서비스 이름을 기반으로 하는 SAP NetWeaver 서비스 가용성에 대한 숫자 응답 코드입니다.
  • 0: 서비스가 실행 중이 아닙니다.
  • 1: 서비스가 실행 중입니다.
sap/nw/icm/rcode SAP NetWeaver 인증되지 않은 ICM URL 리소스(로컬 호출)의 HTTP 1.1 프로토콜을 기반으로 하는 응답 코드입니다.
sap/nw/icm/rtime SAP NetWeaver 인증되지 않은 ICM URL 리소스(로컬 호출)의 응답 시간(밀리초)입니다.
sap/nw/ms/rcode SAP NetWeaver 인증되지 않은 메시지 서버 URL 리소스(로컬 호출)의 HTTP 1.1 프로토콜을 기반으로 하는 응답 코드입니다.
sap/nw/ms/rtime SAP NetWeaver 인증되지 않은 메시지 서버 URL 리소스(로컬 호출)의 응답 시간(밀리초)입니다.
sap/nw/ms/wp SAP NetWeaver 메시지 서버 정보 페이지에서 보고된 ABAP 작업 프로세스(NW ABAP) 또는 자바 서버 노드(NW 자바)의 개수입니다.
sap/nw/abap/proc/busy SAP NetWeaver DIA, ICM, DISP와 같은 유형별로 분류된 사용 중인 ABAP 작업 프로세스의 개수입니다.
sap/nw/abap/proc/count SAP NetWeaver DIA, ICM, DISP와 같은 유형별로 분류된 모든 ABAP 작업 프로세스의 개수입니다.
sap/nw/abap/queue/current SAP NetWeaver ABAP 작업 프로세스에서 사용하는 현재 ABAP 큐 수이며 DIA, ICM, DISP와 같은 작업 프로세스 유형별로 그룹화됩니다.
sap/nw/abap/queue/peak SAP NetWeaver ABAP 작업 프로세스에서 사용하는 최대 ABAP 큐 수이며 DIA, ICM, DISP와 같은 작업 프로세스 유형별로 그룹화됩니다.
sap/nw/abap/sessions SAP NetWeaver 세션 유형별로 분류된 ABAP 세션의 개수입니다.
sap/nw/abap/rfc SAP NetWeaver 세션 유형별로 분류된 ABAP RFC 연결의 개수입니다.
sap/nw/enq/locks/usercountowner SAP NetWeaver SAP NetWeaver 시스템의 큐에 추가 잠금 수입니다. 시스템에 열린 잠금 항목이 많으면 사용자의 성능 문제로 이어질 수 있습니다.
sap/mntmode 추가 SAP 측정항목 시스템이 의도적으로 작동 중지된 것을 나타내기 위해 수동으로 설정된 해당 SAP 시스템 ID(SID)의 유지보수 모드입니다(maintenancemode = TRUE). 이 측정항목의 값은 계획된 유지보수 기간 중에 사용할 수 없는 시스템에 대한 알림을 숨기기 위해 사용됩니다.

특정 SID가 계획된 유지보수를 진행 중인지 여부를 에이전트에 알리기 위해서는 다음 명령어를 실행합니다.

google_cloud_sap_agent maintenance \
    --enable=TRUE or FALSE \
    --sid=SID
sap/service/is-failed 추가 SAP 측정항목 SAP와 관련된 OS 서비스와 클러스터 서비스가 실패했는지 여부를 나타냅니다. 종료 코드 0은 실패를 나타냅니다.
sap/service/is-disabled 추가 SAP 측정항목 이 측정항목은 pacemaker, corosync, sapconf, saptune, sapinit 서비스가 사용 설정되지 않은 경우에 채워집니다.
sap/hana/cpu/utilization 추가 SAP 측정항목 SAP HANA 프로세스의 프로세스당 CPU 활용률(%)입니다.
sap/nw/cpu/utilization 추가 SAP 측정항목 SAP NetWeaver 프로세스의 프로세스당 CPU 활용률(%)입니다.
sap/control/cpu/utilization 추가 SAP 측정항목 SAP 제어 프로세스의 프로세스당 CPU 활용률(%)입니다.
sap/hana/memory/utilization 추가 SAP 측정항목 HANA 프로세스의 프로세스당 메모리 사용률(MB)입니다.
sap/nw/memory/utilization 추가 SAP 측정항목 NetWeaver 프로세스의 프로세스당 메모리 활용률(MB)입니다.
sap/control/memory/utilization 추가 SAP 측정항목 SAP 제어 프로세스의 프로세스당 메모리 활용률(MB)입니다.
sap/hana/iops/reads 추가 SAP 측정항목 SAP HANA 프로세스의 프로세스당 읽기 IOPS입니다.
sap/hana/iops/writes 추가 SAP 측정항목 SAP HANA 프로세스의 프로세스당 쓰기 IOPS입니다.
sap/nw/iops/reads 추가 SAP 측정항목 SAP NetWeaver 프로세스의 프로세스당 읽기 IOPS입니다.
sap/nw/iops/writes 추가 SAP 측정항목 SAP NetWeaver 프로세스의 프로세스당 쓰기 IOPS입니다.
sap/infra/migration Google Cloud 인프라 측정항목 VM 인스턴스가 라이브 마이그레이션을 진행하는 중인지 여부를 나타냅니다.
sap/pacemaker 추가 SAP 측정항목 호스트에 Pacemaker 구성이 포함된 경우에 전달하는 숫자 응답 코드입니다.
  • 0: Pacemaker 구성을 찾을 수 없습니다.
  • 1: pacemaker 구성이 발견되었습니다.

이 측정항목은 에이전트 버전 3.2부터 지원됩니다.

sap/hana/volumes 추가 SAP 측정항목

볼륨, 사용된 스토리지, 사용 가능한 스토리지의 총 크기 및 스토리지 사용량 비율과 같은 마운트된 SAP HANA 볼륨에 대한 정보를 노출합니다.

이 측정항목은 에이전트 버전 3.2부터 지원됩니다.

sap/networkstats/rtt 추가 SAP 측정항목 평균 왕복 시간(밀리초)입니다.

이 측정항목에는 SAP HANA 시스템 관련 TCP 연결 정보가 포함됩니다. 이 측정항목은 ss 유틸리티를 사용하여 SAP HANA hdbnameserver 프로세스의 소켓에 대해 수집됩니다.

sap/networkstats/rcv_rtt 추가 SAP 측정항목 데이터의 사용자 공간 소비가 발생하지 않은 경우 원격 클라이언트가 현재 공지된 원격 수신 기간(RWIN)을 소진하는 데 걸린 시간입니다. 연결에 대해 관측된 대역폭을 기반으로 하며 0이 아닌 값을 반환합니다.

이 측정항목에는 SAP HANA 시스템 관련 TCP 연결 정보가 포함됩니다. 이 측정항목은 ss 유틸리티를 사용하여 SAP HANA hdbnameserver 프로세스의 소켓에 대해 수집됩니다.

sap/networkstats/rto 추가 SAP 측정항목 TCP 재전송 제한 시간(밀리초)입니다.

이 측정항목에는 SAP HANA 시스템 관련 TCP 연결 정보가 포함됩니다. 이 측정항목은 ss 유틸리티를 사용하여 SAP HANA hdbnameserver 프로세스의 소켓에 대해 수집됩니다.

sap/networkstats/bytes_acked 추가 SAP 측정항목 확인된 바이트 수입니다.

이 측정항목에는 SAP HANA 시스템 관련 TCP 연결 정보가 포함됩니다. 이 측정항목은 ss 유틸리티를 사용하여 SAP HANA hdbnameserver 프로세스의 소켓에 대해 수집됩니다.

sap/networkstats/bytes_received 추가 SAP 측정항목 수신된 바이트 수입니다.

이 측정항목에는 SAP HANA 시스템 관련 TCP 연결 정보가 포함됩니다. 이 측정항목은 ss 유틸리티를 사용하여 SAP HANA hdbnameserver 프로세스의 소켓에 대해 수집됩니다.

sap/networkstats/lastsnd 추가 SAP 측정항목 마지막 패킷이 전송된 이후 경과한 시간(밀리초)입니다.

이 측정항목에는 SAP HANA 시스템 관련 TCP 연결 정보가 포함됩니다. 이 측정항목은 ss 유틸리티를 사용하여 SAP HANA hdbnameserver 프로세스의 소켓에 대해 수집됩니다.

sap/networkstats/lastrcv 추가 SAP 측정항목 마지막 패킷이 수신된 이후 경과한 시간(밀리초)입니다.

이 측정항목에는 SAP HANA 시스템 관련 TCP 연결 정보가 포함됩니다. 이 측정항목은 ss 유틸리티를 사용하여 SAP HANA hdbnameserver 프로세스의 소켓에 대해 수집됩니다.

Monitoring에서 측정항목 보기

Google Cloud는 SAP용 Google Cloud 에이전트가 수집한 프로세스 모니터링 측정항목을 시각화하는 데 도움이 되는 커스텀 대시보드를 제공합니다. GitHub의 GoogleCloudPlatform/monitoring-dashboard-samples 저장소에서 dashboards/google-cloud-agent-for-sap 디렉터리를 확인하세요.

설치 안내를 포함하여 이러한 대시보드에 대한 자세한 내용은 수집된 측정항목 보기를 참조하세요.

모니터링에서 측정항목 데이터를 찾고 알림을 구성하는 방법에 대한 자세한 내용은 모니터링의 측정항목을 참조하세요.