SQL/데이터 통합

데이터 통합이란

domsam 2025. 2. 7. 16:36
반응형
데이터 성격에 의해서 데이터 통합을 결정한다. 
통합했을 때 발생하는 문제보다 통합하지 않을 때 발생하는 문제가 더욱 많고 심각하므로 우선 고려한다.

 

1. 데이터 통합

- 데이터 통합은 일반화(Generalization)라고 부르기도 한다.
- 데이터를 일반화하면 슈퍼타입(SuperTypes)과 서브타입(SubTypes)이 생긴다.
- 공통된 속성이 존재하는 엔터티를 통합하여 슈퍼타입을 도출하는 것이 엔터티 통합이다.
- 동질성을 가진 데이터를 합치는 것 (데이터의 성격을 규정할 수 있어야 동질한 데이터인지 판단 가능)
- 정규화가 끝난 다음에 데이터 통합 과정을 거쳐야 한다.
- 데이터 추출 시간을 줄이려고 비정규화로 엔터티를 합체하는 방법과는 다르다.
- 1:1 관계의 테이블을 합치는 것과는 다르다.
- 데이터를 통합하면 중복 데이터가 늘어나지 않는다.
- 조회 성능을 높이려는 목적은 아니나 조회 성능이 좋아질 때가 많다.
- 통합 여부는 모델러의 역량에 따라 경험에 따라 달라질 수 있다.
- 실체, 행위, 기준 엔터티 간에는 통합하지 않는다.

 

2. 장점

데이터 통합을 하면 확장성이 좋은 유연한 모델을 만들 수 있고 단순한 데이터 모델을 만들 수 있다. 

 

3. 단점

기준이 명확하지 않아 모델러의 경험과 능력에 따라 결과가 다를 수 있다. 
테이블 구조에 따라 Null값의 사용이 많아질 수 있다.
운영 DB가 있을 시 마이그레이션이 불가능할 수도 있다.
데이터 성격을 꼼꼼하게 점검하지 않으면 성격이 다른 두 속성의 데이터를 하나의 속성으로 관리하여 데이터의 의미가 변질 될 수 있다. 

관계형 데이터 모델링 프리미엄 가이드 도서의 내용을 참고하였습니다.