Google Cloud 기반 SAP의 측정항목 기반 알림 정책 만들기

Google Cloud에서 SAP 시스템을 모니터링하려면 SAP 관리자에게 잠재적인 구성 오류나 리소스 오류를 알리는 Cloud Monitoring 알림 정책을 설정하면 됩니다.

이 문서에서는 몇 가지 일반적인 HA 문제를 설명하고 이에 대한 알림 정책을 만들거나 예시 알림을 참조로 사용하여 자체 커스텀 알림을 만드는 방법을 보여줍니다. 이 문서에서 설명하는 알림 예시에서는 모니터링 쿼리 언어(MQL)를 사용하여 SAP용 Google Cloud 에이전트에서 생성한 측정항목을 쿼리합니다. 기본적으로 이러한 알림은 지정된 Google Cloud 프로젝트의 모든 SAP 시스템에 적용되지만 필요한 SID를 필터링하거나 경과 시간을 조정하여 알림을 트리거하도록 알림을 맞춤설정할 수 있습니다.

Cloud Monitoring 알림 작동 방식은 알림 개요를 참조하세요.

시작하기 전에

사전 정의된 알림 정책 가져오기

Google Cloud는 몇 가지 일반적인 HA 문제에 대한 알림을 가져오고 설정할 수 있는 사전 정의된 알림 정책을 제공합니다. 자세한 내용은 다음 섹션을 참조하세요.

위치 제약조건 감지 알림 가져오기

클러스터 명령어를 사용하여 Pacemaker 클러스터의 리소스를 수동으로 이동하면 해당 리소스에 제약조건이 발생하거나 클라이언트 환경설정이 특정 노드를 선호하도록 설정됩니다. 이러한 상황은 시스템 중단 시 리소스가 장애 조치를 하지 못하게 할 수 있습니다. 자세한 내용은 ClusterLabs 문서의 리소스 하나 이동 섹션을 참조하세요.

Google Cloud에서 실행되는 SAP HA 시스템에서 이러한 상황에 대한 알림을 받으려면 사전 정의된 알림 정책 Pacemaker: Location constraint detected를 가져오면 됩니다.

이 알림 정책은 환경설정 기반 제약조건이 감지될 때 알림을 전송하고 SAP 관리자가 SAP의 고가용성 구성 문제 해결 가이드의 '특정 노드를 선호하는 의도하지 않은 노드 어피니티' 섹션을 참조하도록 합니다. 이 정책은 SAP용 Google Cloud 에이전트에서 수집한 프로세스 모니터링 측정항목 workload.googleapis.com/sap/validation/pacemaker를 사용합니다.

Google Cloud 콘솔을 사용하여 Google Cloud 프로젝트에서 이 알림 정책을 가져오려면 다음 단계를 완료합니다.

  1. Google Cloud 콘솔에서  통합 페이지로 이동합니다.

    통합으로 이동

    검색창을 사용하여 이 페이지를 찾은 경우 부제목이 Monitoring인 결과를 선택합니다.

  2. Google Cloud Agent for SAP를 필터링한 후 세부정보 보기를 클릭합니다.
  3. 알림 탭으로 이동합니다.
  4. Pacemaker: Location constraint detected를 선택한 후 옵션 표시 > 알림 정책 맞춤설정을 클릭합니다.
  5. (선택사항) Google Cloud 프로젝트의 모든 SAP 시스템 대신 특정 SAP 시스템 하나 이상에 대한 알림을 구성하려면 다음과 같이 쿼리 편집기에서 filter 문을 업데이트합니다.
    1. # 문자를 삭제합니다.
    2. 필수 SID를 지정합니다. SID를 여러 개 지정하려면 | 문자를 사용하여 SID를 구분합니다. 다음은 이러한 필터 문이 표시되는 방식의 예시입니다.
      | filter (metric.sid =~ 'ABC|XYZ|HDB')

      이 예시에서 ABC, XYZ, HDB가 SID입니다.

  6. (선택사항) 알림을 트리거하기 전에 경과 시간을 맞춤설정하려면 쿼리 편집기에서 window 문을 업데이트하여 선호하는 측정 단위를 지정합니다.
    1. 예를 들어 시간 제한을 3분으로 설정하려면 다음 안내를 따르세요.
      | window 3m
  7. 알림 세부정보에서 알림 및 이름 탭으로 이동합니다.
  8. 필요한 알림 채널을 선택합니다.
  9. 알림을 검토한 후 정책 만들기를 클릭합니다.

리소스 오류 감지 알림 가져오기

HA 시스템에서 실행 중인 리소스 에이전트가 실패하면 Pacemaker에서 해당 에이전트를 중지하고 다시 시작하려고 시도합니다. 어떤 이유로든 다시 시작 작업이 실패하면 Pacemaker는 해당 리소스 에이전트의 failcount 값을 INFINITY로 설정한(start-failure-is-fatal이 기본값인 true로 설정된 경우) 후 다른 노드에서 에이전트를 시작하려고 시도합니다. 리소스 에이전트가 모든 노드에서 시작할 수 없으면 리소스 에이전트는 Stopped 상태로 유지됩니다. 이 리소스 에이전트를 다시 작동 상태로 복원하려면 SAP 관리자가 리소스 에이전트 실패 횟수를 수동으로 지워야 합니다. Pacemaker의 실패 횟수 동작에 대한 자세한 내용은 ClusterLabs 문서를 참조하세요.

Google Cloud에서 실행되는 SAP HA 시스템에서 이러한 상황에 대한 알림을 받으려면 사전 정의된 알림 정책 Pacemaker: Resource failed to start를 가져오면 됩니다.

이 알림 정책은 리소스 에이전트가 시작될 수 없고 3분 넘게 Stopped 상태로 유지되면 알림을 전송합니다. 이 정책에서는 SAP 관리자가 SAP의 고가용성 구성 문제 해결 가이드의 '리소스 에이전트가 중지됨' 섹션을 참조하도록 합니다. 이 정책은 SAP용 Google Cloud 에이전트에서 수집한 프로세스 모니터링 측정항목 workload.googleapis.com/sap/cluster/failcounts를 사용합니다.

Google Cloud 콘솔을 사용하여 Google Cloud 프로젝트에서 이 알림 정책을 가져오려면 다음 단계를 완료합니다.

  1. Google Cloud 콘솔에서  통합 페이지로 이동합니다.

    통합으로 이동

    검색창을 사용하여 이 페이지를 찾은 경우 부제목이 Monitoring인 결과를 선택합니다.

  2. Google Cloud Agent for SAP를 필터링한 후 세부정보 보기를 클릭합니다.
  3. 알림 탭으로 이동합니다.
  4. Pacemaker: Resource failed to start를 선택한 후 옵션 표시 > 알림 정책 맞춤설정을 클릭합니다.
  5. (선택사항) Google Cloud 프로젝트의 모든 SAP 시스템 대신 특정 SAP 시스템 하나 이상에 대한 알림을 구성하려면 다음과 같이 쿼리 편집기에서 filter 문을 업데이트합니다.
    1. # 문자를 삭제합니다.
    2. 필수 SID를 지정합니다. SID를 여러 개 지정하려면 | 문자를 사용하여 SID를 구분합니다. 다음은 이러한 필터 문이 표시되는 방식의 예시입니다.
      | filter (metric.sid =~ 'ABC|XYZ|HDB')

      이 예시에서 ABC, XYZ, HDB가 SID입니다.

  6. (선택사항) 알림을 트리거하기 전에 경과 시간을 맞춤설정하려면 쿼리 편집기에서 window 문을 업데이트하여 선호하는 측정 단위를 지정합니다.
    1. 예를 들어 시간 제한을 3분으로 설정하려면 다음 안내를 따르세요.
      | window 3m
  7. 알림 세부정보에서 알림 및 이름 탭으로 이동합니다.
  8. 필요한 알림 채널을 선택합니다.
  9. 알림을 검토한 후 정책 만들기를 클릭합니다.

커스텀 알림 정책 만들기

사전 정의된 알림 정책을 가져오는 것 외에도 이를 업데이트하여 요구사항에 맞는 커스텀 알림 정책을 만들 수 있습니다. 이를 위해 Google Cloud 콘솔, Cloud Monitoring API, Google Cloud CLI 또는 Terraform을 사용할 수 있습니다.

먼저 이 문서에 설명된 사전 구성된 알림 정책과 함께 예시 알림 정책 요약을 검토하는 것이 좋습니다.

알림 정책을 관리하거나 수정하는 방법에 대한 자세한 내용은 알림 정책 관리를 참조하세요.