#title DW의 정의와 용어 [[TableOfContents]] 작업 중.. ==== DW의 정의 ==== Dr. William Inmon은 다음과 같이 DW를 정의하였다. {{{ A Data warehouse is a > Subject-oriented, > Integrated, > Time-variant, > Nonvolatile collection of data in support of management’s decision-making process (1990) }}} 각각에 대하여 살펴보자. '''주제지향적(Subject Oriented) ''' 운영계의 시스템은 운영에 필요한 트랜잭션을 처리하기 위해 최적화된 데이터베이스이다. 예를 들어 빌링시스템은 기업의 서비스 상품에 대한 요금을 처리하기 위해 최적화되어 있다. “A 고객의 이번달 사용시간은 2시간이고, 시간당 1만원, 연속된 사용기간이 1년이므로 0.05%의 할인율이 적용되는 업무규칙으로 “20,000 – (20,000 * 0.05)원 = 19,000원” 이 A고객에게 청구된다.” 와 같은 예가 될 수 있다. 그러나 데이터웨어하우스에서는 다양한 관점에서의 데이터 분석을 위해 주제 지향적인 데이터구조를 가진다. 여기서 말하는 주제는 각 기업의 사업 주제이다. 이러한 사업 주제는 기업마다 다르다. 제조회사와 같은 경우는 매출, 선적, 재고 등과 같은 사업 주제이고, 온라인 게임회사의 경우는 개별게임, 고객등이 사업 주제가 될 수 있다. attachment:dw_define01.jpg '''통합적(Integrated)''' 최적화된 데이터 분석은 의사 결정에 매우 큰 도움을 줄 수 있다. 그러기 위해서는 각 운영시스템이나 부서간에 사용되는 데이터의 의미를 통합해야 할 필요가 있다. 동음이의어나 이음동의어를 하나로 통합하고, 용어나 개념에 대한 의미를 통합할 필요가 있다. 예를 들어 빌링시스템은 성별을 “남, 여” 로 표현하고, 고객시스템은 “1, 0”으로, 주문시스템에서는 “M, F”표현하는 것을 통합하여 “남, 여”로 통합하는 것이다. 또한 재무회계팀의 충성고객은 “매출에 0.001% 이상 기여한 고객”이고, 마케팅팀은 “한달에 사용시간이 5시간 이상인 고객”이 될 수 있다. 데이터웨어하우스는 이러한 의미적인 통합으로 전사적인 관점에서 데이터를 분석할 수 있도록 한다. 이러한 통합의 과정은 ETT과정에서 이루어지기도 하며, 운영계의 분석시 통합되기도 한다. attachment:dw_define02.jpg 이러한 통합을 위해서는 다음과 같은 사항들이 필요로 할 것이다. * 네이밍룰(Naming Rule) * Codes * 측정값(Measurements) * 용어사전 * 기타 '''시계열적(Time Variant)''' 운영시스템은 현재의 값을 가지는 것이 일반적이다. 은행에서 수취계정시스템에서의 차감잔액은 고객의 계정에서 현재의 값을 가리킨다. 또한 주문처리 시스템에서 고객이 주문한 상태는 현재의 주문내역이다. 만약 특정 고객의 구매 패턴을 분석하고자 한다면 현재의 주문내역뿐만 아니라 과거의 주문내역도 필요로 하게 된다. 또한 특정 지역의 매출 감소와 관련된 원인을 분석하기 위해서는 매출과 관련(주제지향)된 모든 과거 데이터를 필요로 하게 된다. 데이터웨어하우스는 이러한 특성으로 과거와 현재에 걸쳐 스냅샷으로 저장된다. 그러므로 데이터웨어하우스는 ‘시간’이라는 관점이 추가되는 구조를 가진다. 이러한 데이터웨어하우스의 시계열적 특징은 과거의 분석을 허용하며, 정보를 과거에서 현재까지 관련지어 설명하고, 미래에 대한 예측을 가능하게하는 정보허브 역할을 하게 된다. attachment:dw_define03.jpg '''비휘발적(Nonvolatile)''' 다양한 운영계의 시스템으로부터 추출된 데이터(내부데이터)와 외부데이터는 데이터웨어하우스의 구조(분석에 용이한 구조)로 변환되고, 통합되며, 저장된다. 운영시스템은 트랜잭션이 발생할 때마다 데이터웨어하우스에 대한 데이터를 갱신하지 않는다. 예를 들어 고객이 주문을 하면 데이터가 생성(Create)되고, 주문을 취소하면 데이터가 갱신(Update)되거나 삭제(Delete)된다. 그러나 데이터웨어하우스는 갱신되거나 삭제되지 않는다. 데이터웨어하우스로 데이터가 로딩되면 데이터웨어하우스의 데이터는 삭제되지 않는다. attachment:dw_define04.jpg 이러한 변경된 데이터는 일정한 시간 간격을 두어 하루, 일주일 등의 단위로 데이터웨어하우스로 로딩된다. 이러한 주기는 사업의 요구에 따라 틀려진다. 예를 들어 주문처리 시스템에서 데이터웨어하우스로의 데이터 로딩은 하루 주기를 가진다고 하자. 만약 A라는 고객이 전날 주문했고 다음날 A고객은 주문을 취소하였다는 사실은 데이터웨어하우스에는 고스란히 남아있게(Nonvolatile) 된다. 하지만 주문처리 시스템에서는 주문을 취소한 현재상태(휘발적, Volatile)로 남아 주문했다는 사실은 잃어버리게 된다. 그러므로 데이터웨어하우스는 읽기-전용(Read) 데이터베이스가 된다. ==== 용어등 ==== '''Data warehousing?''' DW는 정적인 의미를 가진다. Data warehousing이란, 조직체들이 DW라는 특정 저장장치를 이용함으로써 그들의 정보 자산으로부터 가치를 추출하는 과정 '''Virtual warehouse?''' 사용자들이 현재 작동중인 시스템에 조회 접근을 할 수 있는 오랜 사용으로 보증된 환경 '''ODS(Operational data store)''' 추출영역의 문제점(반복된 추출로 인한 운영계에 영향)을 해결하기 위한 중간 단계의 저장소. 운영 시스템에 있는 데이터 수준을 벗어나 광범위한 과거 데이터가 유지될 경우, 이 새로운 시스템을 일반적으로 DW 또는 DM(Data Mart)라고 부른다. * 기업이 운영시스템별로 관리하는 데이터를 전사적 관점에서 통합 관리함으로써 전사 데이터 공유를 가능하게 해 주는 통합 데이터베이스 * DW의 소스 * BAM[* Business Activity Monitoring]에서 안정적인 분석 '''ODS는 언제 구축되는가?''' 상태정보( 우리가 특별 할인을 제공할 만큼 충분한 재고량이 있는가?)에 의존하는 의사결정을 하는 경우 ODS가 구축된다. '''DW, DM은 언제 구축되는가?''' 역사적인 분석, 복잡한 패턴 '''DW 정당성의 주장''' 본질적인 사업 목표와 연결 -> 조직이 목표를 달성하는데 어떻게 도움주는가 보여주면 된다. '''Critical Sucess Factor of DW''' 사용자가 정보를 찾을 수 있게 잘 도와주는 것이 데이터 웨어하우징의 결정적인 성공요인 '''경보를 통해 어떻게 가치가 추가되는가?''' DW라는 직업에 엄청난 가치를 부여 -> 매출이 5%이상 하락, 5%이상 상승 -> 웹사이트 최고 방문기록의 경신 등.. '''Master Data''' 기업 비즈니스에서 마스터 데이터의 의미는 비즈니스 거래 및 평가를 위한 근간이면서 전사 차원에서 활용되는 핵심적인 기업 정보(Core Enterprise Information)를 말한다. 예를 들어 고객, 상품, 사원 등이 이에 해당된다. 마스터데이터는 기업 활동의 근간이 되는 핵심항목들로 이루어진 기준 정보로 기업의 비즈니스를 정의하는 코어 데이터를 의미한다. 예를 들어 상품·자재·고객·공급사·설비 등이 여기에 속하는데, 이들은 어느 특정 시스템에 국한되지 않고 여러 업무 프로세스에서 공통으로 사용되며 여러 부서와 사용자들에 의해 생성되고 활용된다. 1. 소스 데이터 프로파일링 2. 데이터 스테이징 3. 표준화 4. 글로벌 입증 및 증명 5. 마스트 데이터 강화 6. 매칭 및 분류 7. 데이터 존속 8. 변형 9. 연결 및 전달 10. 메타데이터 관리 "제품과 고객 데이터의 조화로 SOA로의 초석을 제공합니다. 실제 마스터 데이터를 사용하면 웹 서비스 및 관련 비즈니스 프로세스의 정확도, 시기, 효율성이 향상되어 기존 투자에 대한 투자 수익과 비즈니스 인텔리전스가 향상됩니다." - Forrester Research - Trends 2006: 마스터 데이터 관리; 2006년 3월 6일 ==== Informaion On Demand Strategy ==== * 적시에 적절한 정보 제공 (right time right information ) * 적절한 사람이나 프로세스에게 전달되어 (right people or process ) * 비즈니스 효율성과 가치 창출 (Better and Faster Decision through Information and Process Optimization ) ==== DW, ODS ==== * DW :전략파트 * ODS:전술파트