SQL/정규형

제4정규형 (Fourth Normal Form)

domsam 2025. 2. 21. 16:18
반응형

제4정규형은 다가 종속 개념이 기반이 되는 정규형이다. 

한 릴레이션에 다가 속성이 두 개 이상 존재할 때 발생할 수 있다. 하나의 다가 속성의 모든 값이 다른 다가 속성의 모든 값마다 중복되는 문제가 발생할 수 있는데 이를 다가 종속이라 한다. 

그림(1) 다가 종속이 발생한 릴레이션과 모델

그림(1) [릴레이션1]을 보면 '홍길동'의 기술은 '모델링', '튜닝'이며 구사하는 언어는 '영어', '한국어'인 것을 알 수 있다. 그리고 기술과 언어와는 종속 관계가 없다. 이를 [릴레이션2]를 사용해 관리할 수 있는데 많은 중복 데이터가 발생한다. 사원은 두 명인데 열개의 레코드(row)가 생성된다. 사원과 기술, 사원과 언어라는 두 개의 다가 속성을 하나의 엔터티에서 관리하기 때문이다. 사원과 기술은 일대다(1:M) 관계이고 사원과 언어 또한 일대다(1:M) 관계이다.

(그림(1) 모델에서의 전제이다. 실제는 사원과 기술은 다대다(N:M), 사원과 언어 또한 다대다(N:M) 관계이다.)

그림(2) 제4정규형 릴레이션과 모델

제4정규형은 다가 종속이 발생한 릴레이션에서 새로운 엔터티를 생성해 다가 종속을 제거한다. 기술과 언어 사이에 직접적인 연관이 없고 단지 한 사원에 속해 있어 간접적인 연관 관계만이 존재한다. 그림(2)와 같이 2개의 릴레이션으로 분해해서  제4정규형을 만족하도록 하여 데이터를 정확하고 효율적으로 관리할 수 있도록 한다.

쉽게말해 제4정규화는 서로 관련이 없는 다가 속성을 개별 엔터티로 분해하는 것이다.