데이터베이스 정규화는 데이터베이스 설계에서 데이터를 효율적으로 구성하기 위해 사용되는 프로세스입니다. 데이터 중복을 줄이고 데이터 무결성(데이터 정확성 및 일관성)을 개선하는 데 도움이 될 수 있습니다. 마치 어질러진 서류함을 정리하는 것과 같습니다. 동일한 정보를 여러 곳에 두는 대신 각 정보를 한곳에 두고 교차 참조 시스템을 사용하여 연결합니다.
데이터베이스는 단순히 체계화된 데이터 모음으로, 일반적으로 컴퓨터 시스템에 전자적으로 저장됩니다. 디지털 자료실이라고 생각하면 됩니다. 종이 폴더와 서랍 대신 구조화된 테이블(또는 기타 데이터 정리 방법)을 사용하여 정보를 빠르고 효율적으로 저장, 관리, 검색할 수 있습니다.
최신 비즈니스에서는 데이터베이스를 사용하여 고객 주문, 재고 수준, 사용자 계정 세부정보, 금융 거래 등 모든 것을 추적하며, 많은 기업이 데이터베이스를 클라우드에서 실행하기로 선택합니다.
관계형 데이터베이스는 데이터를 하나 이상의 열과 행 테이블로 구성합니다. 이러한 테이블 간에 특정하고 미리 정의된 관계를 설정하기 때문에 '관계형'이라고 합니다. 핵심 아이디어는 복잡한 정보를 더 작고 관리하기 쉬운 조각으로 나누어 동일한 정보를 여러 번 저장할 필요가 없도록 하는 것입니다.
온라인 상점을 위한 간단한 데이터베이스를 상상해 보세요. 고객(이름, 주소, 전화번호) 테이블과 주문(날짜, 총액) 테이블이 있다고 가정해 보겠습니다. 고객이 주문할 때 고객의 전체 주소를 주문 테이블에 복사할 필요가 없습니다. 고유한 고객 ID를 사용하여 주문을 고객의 전체 세부정보에 연결하기만 하면 됩니다.
고객이 이사하여 주소를 변경하는 경우 고객 테이블 한 곳에서만 업데이트하면 됩니다. 100개의 주문 기록에 복사한 경우 100개를 모두 업데이트해야 하므로 데이터가 엉망이 되고 일관성이 없어질 가능성이 높습니다. 여러 위치에서 정보를 업데이트해야 하는 이 문제를 데이터 이상이라고 합니다.
그러나 구매 시점에 제품 가격을 주문 기록에 복사하고 싶습니다. 왜일까요? 주요 제품 테이블에서 제품 가격이 나중에 변경될 수 있지만 주문 기록에는 거래 날짜에 고객이 실제로 지불한 가격이 반영되어야 합니다. 이 경우 데이터를 복사하고 고정(또는 스냅샷 생성)하는 것이 올바른 설계 선택입니다.
정규화는 이러한 불일치를 제거하고 스토리지 공간을 절약하기 위해 관계형 테이블과 테이블 간의 관계를 설계하는 체계적인 프로세스입니다. '정규형'(1NF, 2NF, 3NF 등)은 일련의 규범적 규칙입니다. 데이터 중복과 그로 인해 발생하는 데이터 이상에 대한 솔루션으로, 애플리케이션 요구사항에 따라 데이터를 효율적이고 안정적으로 구성할 수 있는 명확한 경로를 제공합니다.
정규화는 테이블을 구조화하기 위한 단계별 가이드로, 각 단계(또는 '형식')는 이전 단계를 기반으로 합니다. 제3정규형(3NF)이 되려면 테이블이 제1정규형과 제2정규형에 대한 테스트를 통과해야 합니다. 대부분의 운영 데이터베이스는 데이터 무결성과 성능의 균형을 제공할 수 있기 때문에 최소한 3NF 표준을 충족하도록 설계되었습니다.
1NF의 규칙은 클린 스프레드시트를 설정하는 것처럼 테이블이 처음부터 적절하게 구조화되도록 하는 것입니다.
규칙: 모든 열에는 고유한 이름이 있어야 하며 모든 셀에는 분할할 수 없는 단일 값만 포함되어야 합니다.
해결하는 문제: 항목 목록을 단일 셀에 넣을 수 없습니다. 예를 들어 '주문' 테이블에서 '주문한 제품' 열의 한 셀에 '우유, 계란, 빵'을 나열할 수 없습니다. 대신 각 제품은 자체 행을 가져야 하며, 이를 통해 데이터를 검색하고 관리할 수 있습니다.
2NF 규칙은 테이블에서 복합 키(결합된 두 개 이상의 열로 구성된 기본 키(예: 주문 ID와 제품 ID))를 사용하는 경우에만 적용됩니다. 기본 키는 테이블의 모든 행을 고유하게 식별하는 값을 가진 열 또는 열 집합입니다. 키가 아닌 열은 기본 키의 일부가 아닌 열입니다.
규칙: 테이블은 이미 1NF에 있어야 하며, 모든 키가 아닌 열은 일부가 아닌 전체 복합 키에 의존해야 합니다.
해결하는 문제: 데이터는 완전히 속한 위치에만 저장해야 합니다. 키가 (OrderID, ProductID)인 테이블이 있는 경우 '제품 가격'과 같은 열은 OrderID가 아닌 ProductID에만 가격이 종속되므로 테이블에 포함되어서는 안 됩니다. 해결책은 ProductID와 '제품 가격'을 별도의 '제품' 테이블로 이동하는 것입니다. 여기서 ProductID는 단일 기본 키입니다. 이렇게 하면 제품이 포함된 모든 주문에 대해 제품 가격이 불필요하게 반복되는 것을 방지할 수 있습니다.
3NF 규칙은 데이터베이스 설계의 가장 일반적인 목표이며 데이터 포인트 간의 간접적인 관계를 제거하는 것입니다.
규칙: 테이블은 2NF에 있어야 하며, 키가 아닌 열은 다른 키가 아닌 열이 아닌 기본 키에만 종속되어야 합니다.
해결하는 문제: 키가 아닌 하나의 데이터가 다른 키가 아닌 데이터의 값을 결정하는 것을 방지합니다. '사무실 ID'(키가 아닌 열)와 '사무실 위치'(또 다른 키가 아닌 열)를 저장하는 '직원' 테이블을 고려해 보겠습니다. '사무실 위치'는 직원 ID(테이블의 기본 키)가 아닌 '사무실 ID'로 결정됩니다. 이 간접 링크는 임시 종속 항목입니다. 이 문제를 해결하기 위해 '사무실 ID'와 '사무실 위치'만 포함된 새 '사무실' 테이블을 만든 다음 '사무실 ID'를 사용하여 두 테이블을 연결합니다. 이렇게 하면 사무실 위치가 변경될 때 한곳에서만 업데이트하면 됩니다.
기능 | 정규화 | 비정규화 |
기본 목표 | 중복 감소, 데이터 무결성 개선 | 읽기 성능 향상 |
사용 사례 | 트랜잭션 데이터베이스(잦은 업데이트) | 분석 데이터베이스 및 데이터 웨어하우스(잦은 읽기), 생성 후 변경해서는 안 되는 데이터(예: 계약 또는 인보이스 스냅샷) |
결과 | 테이블 증가, 데이터 중복 감소 | 테이블 감소, 의도적인 데이터 중복 |
기능
정규화
비정규화
기본 목표
중복 감소, 데이터 무결성 개선
읽기 성능 향상
사용 사례
트랜잭션 데이터베이스(잦은 업데이트)
분석 데이터베이스 및 데이터 웨어하우스(잦은 읽기), 생성 후 변경해서는 안 되는 데이터(예: 계약 또는 인보이스 스냅샷)
결과
테이블 증가, 데이터 중복 감소
테이블 감소, 의도적인 데이터 중복
비정규화는 보고 또는 분석을 위한 쿼리 성능을 개선하기 위해 데이터베이스에 의도적으로 중복 데이터를 추가하는 것입니다. 데이터 검색 속도를 높이기 위해 무결성을 일부 희생하고 스토리지 공간을 늘리는 절충안입니다. 그러나 법적 계약과 같은 시나리오에서는 의도적인 중복을 통해 향후 변경과 독립적인 데이터 스냅샷을 만들고 싶을 수 있습니다. 이렇게 하면 계약 체결 시 기록된 약관, 이름, 가격이 기본 고객 또는 제품 데이터가 나중에 업데이트되더라도 영구적으로 고정되어 사용할 수 있습니다.
정규화는 '정규 형식'을 사용하여 데이터를 구조화하고 일반적인 문제를 방지함으로써 관계형 데이터베이스(예: Cloud SQL 또는 Spanner)를 더욱 효율적이고 안정적이며 관리하기 쉽게 만듭니다.
데이터 중복 감소
고객 주소와 같은 각 데이터를 한곳에만 저장하여 스토리지 공간을 절약하고 효율성을 높입니다.
데이터 이상치 제거
삽입, 삭제 또는 업데이트 이상과 같은 중복 데이터로 인해 발생할 수 있는 불일치를 방지합니다.
데이터 무결성 개선
각 데이터가 정확하고 한곳에만 저장되도록 보장하여 데이터베이스 전반에서 데이터의 정확성과 일관성을 유지합니다.
Google Cloud는 데이터베이스 정규화를 지원하고 이점을 활용하는 다양한 서비스를 제공합니다.



