#title DW에서의 데이터 중복 작성 중.. DW에서는 여러가지 이유로 데이터가 중복된다. * 모델링 기법(다차원 모델) 상의 데이터 중복 * 사용자(개발자, Ad-Hoc Query 날리는 사람들)의 편의성 * 분산환경의 계획된 중복 * DW구조 상의 데이터 흐름에 의한 중복 (운영계 -> ODS -> DW -> DM) * 중복되는지도 모르는 중복 or 중복의 커다란 영향력을 인식하지 못함 필자가 아는 DW의 모델링 기법은 3정규화된 모델, 다차원 모델, 데이터 볼트 이렇게 3개다. 데이터 볼트는 3정규화와 다차원의 하이브리드 방식의 모델링 기법이다. 3가지 모델링 기법이 모두 장/단점이 있으니 뭐가 좋다고는 할 수 없다. 상황에 맞출뿐이다. 마지막의 '중복되는지도 모르는 중복 or 중복의 커다란 영향력을 인식하지 못함'이 문제이지 다른 것은 문제라고 볼 수는 없다. 기술적인 한계라고나 할까? 문제는 우리나라에선 DW라고 하면 꼭 다차원 모델링을 해야하는 것으로 오인되고 있다는 것이다. 이상적인 DW 데이터 모델링 방법은 3정규화된 모델이다.