인스턴스, 클러스터, 노드

Cloud Bigtable을 사용하려면 애플리케이션에서 연결할 수 있는 최대 4개의 클러스터를 포함하는 인스턴스를 만듭니다. 각 클러스터에는 데이터를 관리하고 유지보수 작업을 수행하는 컴퓨팅 단위인 노드가 있습니다.

이 페이지에서는 Cloud Bigtable 인스턴스, 클러스터, 노드에 대해 자세히 설명합니다.

Cloud Bigtable 개요를 숙지하고 이 페이지를 살펴보세요.

인스턴스

Cloud Bigtable 인스턴스는 데이터의 컨테이너입니다. 인스턴스에는 클러스터가 한 개 이상 있으며 이러한 클러스터는 서로 다른 영역에 있습니다. 클러스터마다 노드가 최소 1개 이상 있습니다.

테이블은 클러스터나 노드가 아닌 인스턴스에 속합니다. 인스턴스에 클러스터가 두 개 이상 있으면 복제를 사용하고 있는 것입니다. 즉, 개별 클러스터에 테이블을 할당하거나 인스턴스의 클러스터마다 고유한 가비지 컬렉션 정책을 만들 수 없습니다. 또한 각 클러스터가 같은 테이블에 서로 다른 데이터 집합을 저장하도록 할 수 없습니다.

인스턴스에는 알아야 할 몇 가지 중요한 속성이 있습니다.

  • 스토리지 유형(SSD 또는 HDD)
  • 복제를 사용하는 인스턴스에 주로 사용되는 애플리케이션 프로필

다음 섹션에서는 이러한 속성을 설명합니다.

스토리지 유형

인스턴스를 만들 때 인스턴스 클러스터에서 데이터를 솔리드 스테이트 드라이브(SSD) 또는 하드 디스크 드라이브(HDD) 중 어디에 저장할지를 선택해야 합니다. 대부분의 경우 SSD를 선택하는 것이 가장 효율적이고 경제적입니다.

SSD 또는 HDD를 선택하면 되돌릴 수 없으며 인스턴스의 모든 클러스터가 동일한 유형의 스토리지를 사용해야 하므로 사용 사례에 맞는 스토리지 유형을 선택해야 합니다. 스토리지 결정에 유용한 자세한 내용은 SSD와 HDD 스토리지 중 선택을 참조하세요.

애플리케이션 프로필

인스턴스를 만들면 Cloud Bigtable은 인스턴스를 사용하여 애플리케이션 프로필 또는 앱 프로필을 저장합니다. 복제를 사용하는 인스턴스의 경우 앱 프로필에서 애플리케이션이 인스턴스 클러스터에 연결하는 방법을 제어합니다.

인스턴스에서 복제를 사용하지 않는 경우에도 앱 프로필을 사용하여 애플리케이션마다 또는 애플리케이션 내 각 함수에 별도의 식별자를 제공할 수 있습니다. 그러면 Cloud Console에서 앱 프로필마다 별도의 차트를 볼 수 있습니다.

앱 프로필에 대한 자세한 내용은 애플리케이션 프로필을 참조하세요. 인스턴스의 앱 프로필을 설정하는 방법은 앱 프로필 구성을 참조하세요.

클러스터

클러스터는 특정 위치의 Cloud Bigtable 서비스를 나타냅니다. 각 클러스터는 Cloud Bigtable 인스턴스 하나에 속하며 클러스터는 인스턴스 하나에 최대 4개까지 있을 수 있습니다. 애플리케이션이 Cloud Bigtable 인스턴스에 요청을 보내면 이 요청은 인스턴스의 클러스터 중 하나에서 처리됩니다.

각 클러스터는 단일 영역에 있습니다. 인스턴스 클러스터는 각각 고유한 영역에 있어야 합니다. Cloud Bigtable을 사용할 수 있는 모든 영역에 추가 클러스터를 만들 수 있습니다. 예를 들어 첫 번째 클러스터가 us-east1-b에 있으면 같은 리전에 있는 다른 영역(예: us-east1-c)을 선택하거나 별도의 리전에 있는 한 영역(예: europe-west2-a)을 선택할 수 있습니다. Cloud Bigtable을 사용할 수 있는 영역 및 리전 목록은 Cloud Bigtable 위치를 참조하세요.

클러스터가 1개뿐인 Cloud Bigtable 인스턴스는 복제를 사용하지 않습니다. 인스턴스에 2번째 클러스터를 추가하면 Cloud Bigtable은 각 클러스터 영역에 별도의 데이터 복사본을 유지하고 복사본 간에 업데이트를 동기화하여 자동으로 데이터 복제를 시작합니다. 애플리케이션에서 연결할 클러스터를 선택하여 서로 다른 유형의 트래픽을 격리할 수 있습니다. Cloud Bigtable이 클러스터 간에 트래픽을 분산하도록 할 수도 있습니다. 클러스터를 사용할 수 없게 되면 한 클러스터에서 다른 클러스터로 장애 조치할 수 있습니다. 복제 작동 방식에 대한 자세한 내용은 복제 개요를 참조하세요.

노드

인스턴스의 각 클러스터에는 노드가 1개 이상 있으며, 이러한 노드는 Cloud Bigtable이 데이터를 관리하는 데 사용하는 컴퓨팅 리소스입니다.

내부적으로 Cloud Bigtable은 테이블의 모든 데이터를 별도의 태블릿으로 분할합니다. 태블릿은 노드와 분리되어 있지만 노드와 동일한 영역에 있는 디스크에 저장됩니다. 태블릿은 단일 노드와 연결됩니다.

각 노드는 다음을 수행합니다.

  • 디스크의 특정 태블릿 추적
  • 태블릿에 수신된 읽기 및 쓰기 처리
  • 태블릿에서 유지보수 태스크 수행(예: 정기적인 압축)

클러스터에는 현재 워크로드와 클러스터에 저장되는 데이터 양을 지원하기에 충분한 노드가 있어야 합니다. 그렇지 않으면 클러스터가 수신한 요청을 처리하지 못해 지연 시간이 길어질 수 있습니다. 클러스터의 CPU와 디스크 사용량을 모니터링하고 측정항목이 아래에 나열된 권장사항과 한도를 초과하면 인스턴스에 노드를 추가합니다.

Cloud Bigtable가 데이터를 저장 및 관리하는 방법에 대한 자세한 내용은 Cloud Bigtable 아키텍처를 참조하세요.

CPU 사용량

Cloud Bigtable은 CPU 사용량에 대한 다음과 같은 측정항목을 보고합니다.

측정항목 설명
평균 CPU 사용률

클러스터에 있는 모든 노드의 평균 CPU 사용률입니다.

권장 최댓값은 사용량이 급증할 때 여유분을 제공합니다.

클러스터가 몇 분 이상 구성의 권장 최댓값을 초과하면 클러스터에 노드를 추가해야 합니다.

사용량이 가장 많은 노드의 CPU 사용률

클러스터에서 사용량이 가장 많은 노드의 CPU 사용률입니다.

사용량이 가장 많은 노드가 권장값을 자주 초과하는 경우 평균 CPU 사용률이 합당한 수준이더라도 소량의 데이터에 액세스하는 빈도가 나머지 데이터보다 훨씬 많은 것일 수 있습니다.

  • Key Visualizer 도구를 사용하여 테이블에서 CPU 사용률을 급증시킬 수 있는 부하 집중을 식별합니다.
  • 스키마 설계를 점검하여 각 테이블에서 읽기와 쓰기의 균등 분포를 지원하는지 확인합니다.

이러한 측정항목 값은 다음을 초과하면 안 됩니다.

구성 권장 최댓값
단일 클러스터

평균 CPU 사용률 70%
사용량이 가장 많은 노드의 CPU 사용률 90%

단일 클러스터 라우팅을 사용하는 클러스터 수

평균 CPU 사용률 70%
사용량이 가장 많은 노드의 CPU 사용률 90%

멀티 클러스터 라우팅을 사용하는 클러스터 2개

평균 CPU 사용률 35%
사용량이 가장 많은 노드의 CPU 사용률 45%

멀티 클러스터 라우팅을 사용하는 클러스터 3개 이상

구성에 따라 달라집니다. 일반적인 사용 사례는 복제 설정 예를 참조하세요.

디스크 사용량

Cloud Bigtable은 디스크 사용량에 대해 다음과 같은 측정항목을 보고합니다.

측정항목 설명
스토리지 사용량(바이트)

클러스터에 저장된 데이터 양입니다.

이 값은 비용에 영향을 줍니다. 또한 아래 설명된 것처럼 데이터 양 증가에 따라 각 클러스터에 노드를 추가해야 할 수 있습니다.

스토리지 사용량(최대 %)

사용 중인 클러스터 저장소 용량의 백분율입니다. 이 용량은 클러스터에 있는 노드 수를 기준으로 합니다.

일반적으로, 데이터를 더 추가할 수 있는 공간이 있도록 총 스토리지에서 엄격한 제한의 70%를 넘겨서 사용하지 마세요. 인스턴스에 많은 양의 데이터를 추가할 계획이 없으면 엄격한 제한의 100%까지 사용할 수 있습니다.

사용률이 권장되는 저장용량 백분율 한도를 초과하는 경우 클러스터에 노드를 추가하세요. 기존 데이터를 삭제할 수도 있지만, 압축하기 전에는 데이터 삭제로 공간이 늘어나는 것이 아니라 오히려 줄어듭니다.

이 값의 계산 방법에 관한 자세한 내용은 노드당 스토리지 사용률을 참조하세요.

디스크 로드

HDD 읽기 및 쓰기 작업에 최대로 사용 가능한 대역폭 중 클러스터에서 사용하고 있는 대역폭의 비율입니다. HDD 클러스터에만 제공됩니다.

이 값이 100%로 표시되는 경우가 많으면 지연 시간이 늘어날 수 있습니다. 디스크 로드 백분율을 줄이려면 클러스터에 노드를 추가합니다.

복제된 클러스터의 노드

복제를 사용하는 인스턴스의 경우 각 클러스터에 사용 사례를 지원하기에 충분한 노드가 있는지 확인하세요.

  • 복제를 사용하여 고가용성을 제공하거나 앱 프로필에서 멀티 클러스터 라우팅을 사용하는 경우 각 클러스터에 동일한 수의 노드가 있어야 합니다. 또한 위의 CPU 사용량에 표시된 바와 같이 권장 CPU 사용률이 절반으로 줄어듭니다.

    이 구성을 통해 자동 장애 조치가 필요한 경우 응답 클러스터에 모든 트래픽을 처리하기에 충분한 용량이 확보됩니다.

  • 모든 앱 프로필에서 단일 클러스터 라우팅을 사용하는 경우 각 클러스터에 다른 수의 노드가 있을 수 있습니다. 클러스터의 워크로드를 기준으로 필요에 따라 각 클러스터의 크기를 조정합니다.

    Cloud Bigtable은 클러스터마다 별도의 데이터 사본을 저장하기 때문에 디스크 사용량을 지원하고 클러스터 간에 쓰기를 복제하기에 충분한 노드가 각 클러스터에 있어야 합니다.

    필요한 경우 한 클러스터에서 다른 클러스터로 수동으로 장애 조치할 수 있습니다. 그러나 한 클러스터에 다른 노드보다 더 많은 노드가 있고, 더 적은 수의 노드가 있는 클러스터로 장애 조치해야 하는 경우 먼저 노드를 추가해야 할 수 있습니다. 장애 조치가 필요할 때 추가 노드를 사용할 수 있다는 보장은 없습니다. 미리 노드를 예약하는 유일한 방법은 클러스터에 노드를 추가하는 것입니다.

다음 단계