Prometheus란 무엇인가요?

Prometheus는 Kubernetes의 성장과 함께 인기를 얻은 오픈소스 모니터링 및 알림 도구 모음입니다. 원래 SoundCloud에서 빌드한 Prometheus의 뿌리는 Google의 모니터링 프로젝트인 Borgmon까지 거슬러 올라갈 수 있습니다.

Prometheus는 가져오기 기반 모델을 사용하여 애플리케이션과 인프라에서 측정항목을 수집하는 주요 지지자입니다. 즉, Prometheus가 대상에 주기적으로 요청을 보내면 수집된 측정항목은 시계열 데이터베이스에 저장됩니다. 자체 관리형 Prometheus 인스턴스에서는 사용자가 측정항목을 수집, 저장, 쿼리하기 위한 인프라를 제공합니다. Prometheus의 관리형 버전에서는 공급업체가 서비스 업타임에 대한 모든 인프라와 서비스수준계약(SLA)을 제공합니다. 

Prometheus는 시계열 데이터 쿼리를 위해 PromQL이라는 쿼리 언어를 제공합니다. Grafana와 Alertmanager를 포함하여 PromQL을 활용하는 많은 프로젝트가 데이터 시각화, 알림 생성, 모니터링 인프라 확장과 같은 분석 및 운영 작업을 지원합니다.  

Prometheus의 용도

Prometheus는 애플리케이션과 인프라에서 측정항목을 수집하는 데 사용됩니다. 이러한 측정항목은 시스템 상태를 추적하고 잠재적인 문제를 식별하며 문제를 해결하는 데 사용할 수 있습니다.

Prometheus의 이점은 무엇인가요?

Prometheus를 사용하여 얻을 수 있는 몇 가지 구체적인 이점은 다음과 같습니다.

  • 개방성: Cloud Native Computing Foundation(CNCF)의 일부인 Prometheus는 오픈소스이며 무료로 사용할 수 있습니다.
  • 안정성: Prometheus는 안정적이며 세계 최대 기업 중 일부의 프로덕션 환경에서 우수한 실적을 자랑합니다.
  • 커뮤니티 지원: Prometheus에는 지원, 문서, 개선사항을 제공하는 활발한 대규모 커뮤니티가 있습니다. 또한 다른 도구와 많이 통합되어 시스템 및 인프라를 모니터링하고 데이터를 시각화할 수 있습니다.
  • Kubernetes와 호환: 사실상 Kubernetes를 위한 기본 모니터링 솔루션으로, 대부분의 서드파티 애플리케이션은 이미 Prometheus 측정항목을 위해 계측되고 있습니다.
  • 어디서나 사용 가능: 대부분의 도입이 Kubernetes 배포에서 이루어졌지만 Prometheus는 VM 및 일부 서버리스 환경에도 사용할 수 있습니다.

Prometheus의 구성요소는 무엇인가요? 

  • Prometheus 서버: Prometheus 모니터링 시스템의 핵심 구성요소입니다. 시계열 데이터를 저장하고 해당 데이터를 쿼리하고 알림을 보내기 위한 HTTP API를 노출합니다.
  • Prometheus 내보내기 도구: 다양한 시스템에서 측정항목을 수집하여 Prometheus에 노출하는 소프트웨어 에이전트입니다.
  • Alertmanager: Prometheus에서 알림을 수신하여 적절한 사용자 또는 시스템으로 라우팅하는 서비스입니다.
  • Prometheus 제휴: 여러 Prometheus 서버에서 데이터를 공유할 수 있는 기능입니다.
  • Prometheus Pushgateway: 서비스에서 측정항목을 스크레이핑하지 않고 Prometheus에 푸시할 수 있는 구성요소입니다. 이 기능은 단기 작업에 가장 적합합니다.
  • Prometheus 블랙박스 내보내기 도구: HTTP, TCP, DNS 엔드포인트의 가용성을 모니터링하는 데 사용할 수 있는 서비스입니다.

Prometheus는 측정항목을 어떻게 수집하나요?

Prometheus는 풀 모델을 사용하여 측정항목을 수집합니다. 즉, Prometheus 서버는 측정항목을 모니터링하는 시스템 또는 애플리케이션을 폴링합니다. 이는 정기적으로 서버에 측정항목을 전송하도록 애플리케이션 코드를 수정하는 다른 많은 모니터링 시스템에서 사용하는 푸시 모델과 대조됩니다. 

풀 모델은 모니터링 중인 시스템이나 애플리케이션이 Prometheus 서버를 인식할 필요가 없으므로 애플리케이션 코드를 변경하지 않고도 모니터링 시스템에 추가할 수 있습니다. 풀 모델은 필요할 때만 측정항목을 수집하므로 Prometheus는 사용되지 않는 측정항목을 수집하지 않으므로 리소스를 낭비하지 않습니다.

또한 Prometheus는 다음 방법을 통해 데이터 소스를 자동으로 검색할 수 있습니다. 

  • 서비스 검색: Prometheus는 다양한 서비스 검색 메커니즘을 사용하여 측정항목을 노출하는 서비스를 실행 중인 호스트를 찾을 수 있습니다. 예를 들어 Prometheus는 Kubernetes API를 사용하여 Prometheus 내보내기 도구를 실행하는 포드를 검색할 수 있습니다.
  • 정적 구성: 특정 리소스를 스크레이핑하도록 Prometheus를 정적으로 구성할 수도 있습니다. 이는 다른 방법으로 검색할 수 없는 리소스에 유용합니다.
  • 파일 검색: Prometheus는 측정항목이 포함된 파일을 찾아 리소스를 검색할 수도 있습니다. 예를 들어 Prometheus는 collectd 또는 Nagios에서 생성된 파일을 검색할 수 있습니다.

Prometheus가 리소스를 찾으면 주기적으로 리소스를 스크레이핑하여 측정항목을 확인합니다. 그런 다음 측정항목은 Prometheus의 데이터베이스에 저장되어 쿼리하고 시각화할 수 있습니다.

Prometheus의 4가지 측정항목 유형은 무엇인가요?

  • 카운터는 증가하기만 하는 누적 값을 추적합니다. 주로 처리된 요청, 오류, 전송된 바이트 등을 추적하는 데 사용됩니다.
  • 게이지는 증가하거나 감소할 수 있는 비율을 추적하며, 가장 일반적으로 초당 속도를 측정합니다. 메모리 사용량, CPU 사용량, 디스크 공간 등을 추적하는 데 자주 사용됩니다.
  • 히스토그램은 값의 분포를 추적합니다. 요청 지연 시간, 응답 크기 등을 추적하는 데 자주 사용됩니다.
  • 요약은 히스토그램과 비슷하지만 분위수도 추적합니다. 따라서 이상점을 식별하고 값의 전체 분포를 이해하는 데 더 유용합니다.

PromQL이란 무엇인가요?

PromQL은 Prometheus가 수집하는 측정항목을 위한 강력하고 유연한 쿼리 언어로, 임시 그래프, 테이블, 알림을 만드는 데 사용할 수 있습니다.

PromQL은 사용자가 시계열 데이터를 실시간으로 선택하고 집계할 수 있는 기능적 쿼리 언어를 사용합니다. 표현식의 결과는 그래프로 표시되거나, Prometheus의 표현식 브라우저에서 테이블 형식 데이터로 표시되거나, HTTP API를 통해 외부 시스템에서 사용될 수 있습니다. 

Prometheus와 PromQL은 다음과 같은 용도로 사용할 수 있습니다.

  • 애플리케이션 및 인프라 상태 모니터링: Prometheus는 잠재적인 문제에 대한 측정항목과 알림을 수집합니다.
  • 잠재적 문제 식별: Prometheus가 현재 측정항목을 이전 데이터와 비교하고 중대한 편차가 있으면 알림을 전송합니다.
  • 문제 해결: Prometheus는 시스템 상태에 관한 자세한 뷰를 제공하고 사용자가 특정 측정항목과 리소스를 드릴다운하여 문제의 근본 원인을 파악할 수 있게 해 줍니다.
  • 데이터 시각화: Prometheus는 PromQL 쿼리 언어를 사용하여 시계열 데이터를 쿼리한 후 그래프, 테이블, 알림 등 다양한 형식으로 결과를 표시합니다.
  • 알림 생성: Prometheus는 PromQL 쿼리 언어를 사용하여 시계열 데이터를 쿼리한 후 결과가 특정 조건을 충족하면 알림을 보냅니다.
  • 서드파티 도구로 시각화: Grafana 또는 Kiali와 같이 Prometheus Query API를 이해하는 모든 프런트엔드는 Prometheus 서버를 쿼리하고 데이터를 표시할 수 있습니다.

PromQL 쿼리 예시

다음은 PromQL 쿼리의 몇 가지 예입니다.

초당 평균 CPU 사용량

특정 애플리케이션의 초당 평균 CPU 사용량을 가져오려면 다음 쿼리를 사용할 수 있습니다.

PromQL 초당 CPU 사용량 쿼리

엔드포인트 요청 수

특정 엔드포인트에 전송된 요청 수를 가져오려면 다음 쿼리를 사용할 수 있습니다.

엔드포인트 요청 수에 대한 PromQL 쿼리

엔드포인트 요청 오류 수

특정 엔드포인트에서 반환된 오류의 총 개수를 가져오려면 다음 쿼리를 사용할 수 있습니다.

PromQL 엔드포인트 요청 오류 쿼리 예시

Google Cloud로 비즈니스 문제 해결

신규 고객에게는 Google Cloud에서 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
Google Cloud 영업 전문가에게 고유한 문제에 대해 자세히 논의해 보세요.
Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
콘솔
Google Cloud