PostgreSQL에서 VACUUM 작업 최적화, 모니터링, 문제 해결

이 문서에서는 PostgreSQL 데이터베이스에서 VACUUM 작업의 기초에 대해 설명합니다. 또한 데이터베이스 인스턴스 상태를 유지관리하는 데이터베이스 엔진을 모니터링하고 조정하는 메커니즘에 대해서도 설명합니다.

PostgreSQL에서는 데이터를 수정하면서 데이터 행의 여러 버전을 만드는 스냅샷 기반 동시성 프로토콜이 사용됩니다. 이러한 데이터 행 버전은 데이터 행에 대한 읽기 잠금을 획득하지 않고 계산된 스냅샷을 사용하여 데이터의 표시 가능한 버전을 읽기 위해 사용됩니다. PostgreSQL은 모든 데이터 행에 대해 트랜잭션 ID(삽입된 및 삭제된 트랜잭션 ID)를 유지관리하고 계산된 스냅샷과 함께 트랜잭션 ID를 사용하여 행의 가시성을 확인합니다. 오래된 데이터 버전으로 인해 데이터가 계속 증가하므로, 데이터 스캔에 걸리는 시간(테이블 스캔 또는 인덱스 스캔)이 늘어납니다. 스캔 작업의 응답 시간을 최적화하고 공간을 효율적으로 사용하기 위해서는 버전 유지관리에 사용된 메타데이터(예: 트랜잭션 ID)와 버전을 회수해야 합니다.

VACUUM 작업은 삭제된 버전(가비지 컬렉션) 및 트랜잭션 ID(트랜잭션 ID 고정)를 확보합니다. VACUUM 작업은 데이터 가용성이 서로 다른 상이한 모드의 데이터를 대상으로 작동합니다. 사용된 트랜잭션 ID 공간이 예약된 공간에 들어갈 때마다 시스템이 작성자를 차단하므로 트랜잭션 ID 고정은 데이터베이스 시스템의 상태에 매우 중요합니다.

구성한 autovacuum 작업이 트랜잭션 ID를 회수하기 위해 계속 시도하지만, 실패할 수 있습니다. 이러한 실패는 구성이 충분하지 않거나 트랜잭션 ID의 생성 속도가 너무 높아서 autovacuum 작업이 그러한 워크로드를 따라잡기 힘들기 때문입니다. 이 문서의 목적은 이러한 메커니즘과 함께 VACUUM 작업을 사용하여 VACUUM 작업의 여러 특성을 조정하고 모니터링하는 방법을 보여주기 위한 것입니다.

개요

이 문서에서는 다음 내용을 다룹니다.

  • 트랜잭션 ID를 고정
  • 트랜잭션 ID 모니터링
  • 스토리지 공간 확보
  • 자동화된 Cloud Monitoring 알림 구성

전체 백서를 읽으려면 아래의 버튼을 클릭하세요.

PDF 다운로드