Cloud Bigtable 모니터링

Google Cloud ConsoleCloud Monitoring에 제공되는 차트를 사용하여 시각적으로 또는 Cloud Monitoring을 사용하여 프로그래매틱 방식으로 Cloud Bigtable 인스턴스를 모니터링할 수 있습니다.

Google Cloud Console과 Cloud Monitoring을 통해 제공되는 데이터는 Cloud Bigtable 사용량에 대한 대략적인 개요를 제공합니다. 또한 Key Visualizer 도구를 사용하여 row key별로 액세스 패턴을 자세히 확인하고 특정 성능 문제를 해결할 수 있습니다. 자세한 내용은 Key Visualizer 시작하기를 참조하세요.

CPU 및 디스크 사용량 이해

인스턴스 모니터링을 위해 어떤 도구를 사용하든, 인스턴스에 있는 각 클러스터의 CPU 및 디스크 사용량을 모니터링하는 것이 중요합니다. 클러스터의 CPU 또는 디스크 사용량이 특정 임계값을 초과하면 클러스터가 올바르게 작동하지 않으며, 데이터 읽기 또는 쓰기를 시도할 때 오류가 반환될 수 있습니다.

CPU 사용량

클러스터의 노드는 CPU 리소스를 사용하여 읽기, 쓰기, 관리 작업을 처리합니다. 노드 수가 클러스터 성능에 미치는 영향을 자세히 알아보려면 일반 작업 부하 성능을 참조하세요.

Cloud Bigtable은 CPU 사용량에 대한 다음과 같은 측정항목을 보고합니다.

측정항목 설명
평균 CPU 사용률

클러스터에 있는 모든 노드의 평균 CPU 사용률입니다.

권장 최댓값은 사용량이 급증할 때 여유분을 제공합니다.

클러스터가 몇 분 이상 구성의 권장 최댓값을 초과하면 클러스터에 노드를 추가해야 합니다.

사용량이 가장 많은 노드의 CPU 사용률

클러스터에서 사용량이 가장 많은 노드의 CPU 사용률입니다.

사용량이 가장 많은 노드가 권장값을 자주 초과하는 경우 평균 CPU 사용률이 합당한 수준이더라도 소량의 데이터에 액세스하는 빈도가 나머지 데이터보다 훨씬 많은 것일 수 있습니다.

  • Key Visualizer 도구를 사용하여 테이블에서 CPU 사용률을 급증시킬 수 있는 부하 집중을 식별합니다.
  • 스키마 설계를 점검하여 각 테이블에서 읽기와 쓰기의 균등 분포를 지원하는지 확인합니다.

이러한 측정항목 값은 다음을 초과하면 안 됩니다.

구성 권장 최댓값
단일 클러스터

평균 CPU 사용률 70%
사용량이 가장 많은 노드의 CPU 사용률 90%

단일 클러스터 라우팅을 사용하는 클러스터 수

평균 CPU 사용률 70%
사용량이 가장 많은 노드의 CPU 사용률 90%

멀티 클러스터 라우팅을 사용하는 클러스터 2개

평균 CPU 사용률 35%
사용량이 가장 많은 노드의 CPU 사용률 45%

멀티 클러스터 라우팅을 사용하는 클러스터 3개 이상

구성에 따라 달라집니다. 일반적인 사용 사례는 복제 설정 예를 참조하세요.

디스크 사용량

Cloud Bigtable은 인스턴스의 각 클러스터별로 해당 인스턴스에 있는 모든 테이블의 사본을 별도로 저장합니다.

Cloud Bigtable은 바이너리 GB(기가바이트)와 같은 바이너리 단위로 디스크 사용량을 추적합니다. 여기서 1GB는 230바이트입니다. 이 측정 단위는 기비바이트(GiB)라고도 합니다.

Cloud Bigtable은 디스크 사용량에 대해 다음과 같은 측정항목을 보고합니다.

측정항목 설명
스토리지 사용량(바이트)

클러스터에 저장된 데이터 양입니다.

이 값은 비용에 영향을 줍니다. 또한 아래 설명된 것처럼 데이터 양 증가에 따라 각 클러스터에 노드를 추가해야 할 수 있습니다.

스토리지 사용량(최대 %)

사용 중인 클러스터 저장소 용량의 백분율입니다. 이 용량은 클러스터에 있는 노드 수를 기준으로 합니다.

일반적으로, 데이터를 더 추가할 수 있는 공간이 있도록 총 스토리지에서 엄격한 제한의 70%를 넘겨서 사용하지 마세요. 인스턴스에 많은 양의 데이터를 추가할 계획이 없으면 엄격한 제한의 100%까지 사용할 수 있습니다.

사용률이 권장되는 저장용량 백분율 한도를 초과하는 경우 클러스터에 노드를 추가하세요. 기존 데이터를 삭제할 수도 있지만, 압축하기 전에는 데이터 삭제로 공간이 늘어나는 것이 아니라 오히려 줄어듭니다.

이 값의 계산 방법에 관한 자세한 내용은 노드당 스토리지 사용률을 참조하세요.

디스크 로드

HDD 읽기 및 쓰기 작업에 최대로 사용 가능한 대역폭 중 클러스터에서 사용하고 있는 대역폭의 비율입니다. HDD 클러스터에만 제공됩니다.

이 값이 100%로 표시되는 경우가 많으면 지연 시간이 늘어날 수 있습니다. 디스크 로드 백분율을 줄이려면 클러스터에 노드를 추가합니다.

Cloud Console을 사용하여 성능 개요 가져오기

인스턴스 개요 페이지에서 인스턴스 클러스터의 현재 상태를 확인할 수 있습니다.

개요 페이지에는 각 클러스터에 대한 여러 주요 측정항목의 현재 값이 표시됩니다.

측정항목 설명
CPU 사용률 평균 클러스터에 있는 모든 노드의 평균 CPU 사용률입니다.
사용량이 가장 많은 노드의 CPU 사용률

클러스터에서 사용량이 가장 많은 노드의 CPU 사용률입니다.

가장 많이 사용되는 노드의 권장 최대값을 초과하면 해당 클러스터에 지연 시간 및 기타 문제가 발생할 수 있습니다.

읽은 행 초당 읽은 행 수입니다.
작성한 행 초당 작성한 행 수입니다.
읽기 처리량 전송된 응답 데이터의 초당 압축되지 않은 바이트 수입니다. 이 측정항목은 필터 적용 후에 반환된 전체 데이터 양을 나타냅니다.
쓰기 처리량 데이터를 쓸 때 수신된 초당 압축되지 않은 바이트 수입니다.
시스템 오류율 Cloud Bigtable 서버측에서 실패한 모든 요청의 백분율입니다.
입력 복제 지연 시간 다른 클러스터에 대한 쓰기가 이 클러스터에 복제되는 데 걸리는 최장 시간(초)으로, 99번째 백분위수로 표시됩니다.
출력 복제 지연 시간 이 클러스터에 대한 쓰기가 다른 클러스터에 복제되는 데 걸리는 최장 시간(초)으로, 99번째 백분위수로 표시됩니다.

이러한 주요 측정항목의 개요를 보려면 다음 안내를 따르세요.

  1. Cloud Console에서 Cloud Bigtable 인스턴스 목록을 엽니다.

    인스턴스 목록 열기

  2. 측정항목을 보려는 인스턴스를 클릭합니다. Cloud Console은 인스턴스 클러스터의 현재 측정항목을 표시합니다.

Cloud Console로 시간별 성능 모니터링

인스턴스 모니터링 페이지에서는 인스턴스의 과거 성능을 확인할 수 있습니다. 각 클러스터의 성능을 분석하고 여러 가지 Cloud Bigtable 리소스의 측정항목을 세분화할 수 있습니다. 차트에는 지난 1시간부터 지난 30일까지의 기간이 표시될 수 있습니다.

Cloud Bigtable 리소스 차트

모니터링 페이지에는 다음 유형의 Cloud Bigtable 리소스에 대한 차트가 제공됩니다.

  • 인스턴스
  • 테이블
  • 애플리케이션 프로필

다음 측정항목에 대한 차트가 제공됩니다.

측정항목 적용 대상 설명
CPU 사용률 인스턴스 클러스터에 있는 모든 노드의 평균 CPU 사용률입니다.
CPU 사용률(사용량 상위 노드) 인스턴스

클러스터에서 사용량이 가장 많은 노드의 CPU 사용률입니다.

가장 많이 사용되는 노드의 권장 최대값을 초과하면 해당 클러스터에 지연 시간 및 기타 문제가 발생할 수 있습니다.

사용자 오류율 인스턴스

Cloud Bigtable 서버 측의 오류가 아닌 요청으로 인해 발생한 오류율입니다. 사용자 오류율에는 다음의 상태 코드가 포함됩니다.

  • INVALID_ARGUMENT
  • NOT_FOUND
  • PERMISSION_DENIED
  • RESOURCE_EXHAUSTED
  • OUT_OF_RANGE

사용자 오류는 잘못된 클러스터, 테이블 또는 앱 프로필을 지정하는 요청과 같은 구성 문제로 인해 발생합니다.

시스템 오류율 인스턴스
테이블
앱 프로필
Cloud Bigtable 서버 측에서 실패한 모든 요청의 백분율입니다. 시스템 오류율에는 다음의 상태 코드가 포함됩니다.
  • 알 수 없음
  • ABORTED
  • UNIMPLEMENTED
  • INTERNAL
  • UNAVAILABLE
자동 장애 조치 인스턴스
테이블
앱 프로필

짧은 중단 또는 지연과 같은 장애 조치 상황으로 인해 자동으로 한 클러스터에서 다른 클러스터로 자동으로 다시 라우팅된 요청 수입니다. 앱 프로필에서 멀티 클러스터 라우팅을 사용하는 경우에 자동으로 다시 라우팅될 수 있습니다.

이 차트에는 수동으로 다시 라우팅된 요청은 포함되지 않습니다.

스토리지 사용량(바이트) 인스턴스
테이블

클러스터에 저장된 데이터 양입니다.

이 측정항목에는 데이터가 저장될 때 Cloud Bigtable이 데이터를 압축한 사실이 반영됩니다.

스토리지 사용량(최대 %) 인스턴스

클러스터의 사용 중인 저장소 용량 백분율입니다. 이 용량은 클러스터의 노드 수를 기준으로 합니다.

이 값의 계산 방법에 관한 자세한 내용은 노드당 스토리지 사용률을 참조하세요.

디스크 로드 인스턴스 HDD 읽기 및 쓰기 작업에 최대로 사용 가능한 대역폭 중 클러스터에서 사용하고 있는 대역폭의 비율입니다. HDD 클러스터에만 제공됩니다.
읽은 행 인스턴스
테이블
앱 프로필

초당 읽은 행 수입니다.

단일 요청으로 많은 수의 행을 읽을 수 있으므로, 이 측정항목은 읽기 요청 수보다 유용한 Cloud Bigtable의 전체 처리량을 보여줍니다.

작성한 행 인스턴스
테이블
앱 프로필

초당 작성한 행 수입니다.

단일 요청으로 많은 수의 행을 작성할 수 있으므로, 이 측정항목은 쓰기 요청 수보다 유용한 Cloud Bigtable의 전체 처리량을 보여줍니다.

읽기 요청 인스턴스
테이블
앱 프로필
임의의 초당 읽기 및 스캔 요청 수입니다.
쓰기 요청 인스턴스
테이블
앱 프로필
초당 쓰기 요청 수입니다.
읽기 처리량 인스턴스
테이블
앱 프로필
전송된 응답 데이터의 초당 압축되지 않은 바이트 수입니다. 이 측정항목은 필터 적용 후에 반환된 전체 데이터 양을 나타냅니다.
쓰기 처리량 인스턴스
테이블
앱 프로필
데이터를 쓸 때 수신된 초당 압축되지 않은 바이트 수입니다.
노드 수 인스턴스 클러스터에 있는 노드 수입니다.

이러한 리소스에 대한 측정항목을 보려면 다음 안내를 따르세요.

  1. Cloud Console에서 Cloud Bigtable 인스턴스 목록을 엽니다.

    인스턴스 목록 열기

  2. 측정항목을 보려는 인스턴스를 클릭합니다.

  3. 왼쪽 창에서 모니터링을 클릭합니다. Cloud Console은 인스턴스 측정항목의 테이블 형식 보기는 물론 일련의 인스턴스 차트도 표시합니다. 기본적으로 Cloud Console은 이전 1시간 동안의 측정항목을 표시하며, 인스턴스의 각 클러스터에 대한 개별 측정항목을 표시합니다.

    모든 차트를 보려면 창에서 차트가 표시된 부분으로 스크롤합니다.

    테이블 수준에서 측정항목을 보려면 테이블을 클릭합니다.

    개별 앱 프로필의 측정항목을 보려면 애플리케이션 프로필을 클릭합니다.

    인스턴스의 결합 측정항목 전체를 보려면 차트 위에서 그룹화 기준 섹션을 찾은 다음 인스턴스를 클릭합니다.

    장기간 동안의 측정항목을 보려면 1시간 옆의 화살표를 클릭합니다. 사전 설정된 기간을 선택하거나 커스텀 기간을 입력한 다음 적용을 클릭합니다.

복제 차트

모니터링 페이지에는 시간별 복제 지연 시간을 보여주는 차트가 제공됩니다. 쓰기 작업 복제의 평균 지연 시간을 50, 99, 100 백분위수로 표시할 수 있습니다.

시간별 복제 지연 시간을 보려면 다음 안내를 따르세요.

  1. Cloud Console에서 Cloud Bigtable 인스턴스 목록을 엽니다.

    인스턴스 목록 열기

  2. 측정항목을 보려는 인스턴스를 클릭합니다.

  3. 왼쪽 창에서 모니터링을 클릭합니다. 인스턴스 탭이 선택된 상태로 페이지가 열립니다.

  4. 복제 탭을 클릭합니다. Cloud Console에 시간별 복제 지연 시간이 표시됩니다. 기본적으로 Cloud Console은 이전 1시간 동안의 복제 지연 시간을 표시합니다.

    테이블 또는 클러스터별로 그룹화된 지연 시간 차트 간에 전환하려면 그룹화 기준 메뉴를 사용하세요.

    표시할 백분위 수를 변경하려면 백분위 수 메뉴를 사용합니다.

    장기간 동안의 측정항목을 보려면 1시간 옆의 화살표를 클릭합니다. 사전 설정된 기간을 선택하거나 커스텀 기간을 입력한 다음 적용을 클릭합니다.

Cloud Monitoring을 사용하여 인스턴스 모니터링

Cloud Bigtable은 Cloud Monitoring을 사용하여 프로그래매틱 방식으로 모니터링할 수 있는 사용량 측정항목을 내보냅니다. Cloud Monitoring API 또는 측정항목 탐색기를 사용하여 Cloud Bigtable 사용량 측정항목을 추적할 수 있습니다. 또한 사용량 측정항목을 토대로 알림 정책을 설정하고 Cloud Bigtable 사용량 측정항목 차트를 커스텀 대시보드에 추가할 수 있습니다.

측정항목 탐색기에서 사용량 측정항목을 보려면 다음 안내를 따르세요.

  1. Cloud Console에서 모니터링 페이지를 엽니다.

    모니터링 페이지 열기

    계정을 선택하라는 메시지가 표시되면 Google Cloud에 액세스하기 위해 사용할 계정을 선택합니다.

  2. 리소스를 클릭한 후 측정항목 탐색기를 클릭합니다.

  3. 리소스 유형 및 측정항목 찾기bigtable을 입력합니다. Cloud Bigtable 리소스 및 측정항목 목록이 표시됩니다.

  4. 측정항목을 클릭하여 해당 측정항목 차트를 표시합니다.

또한 Python용 매트플롯립과 같은 그래프 라이브러리를 사용하여 Cloud Bigtable의 사용량 측정항목을 구성하고 분석할 수도 있습니다. 자세한 내용은 Cloud Monitoring 및 Cloud Bigtable에서 매트플롯립을 사용하는 방법 가이드를 참조하세요.

Cloud Monitoring 사용에 대한 자세한 내용은 Cloud Monitoring 문서를 참조하세요.

다음 단계