#title 데이터 웨어하우징에 대한 강력한 요구 [[TableOfContents]] ==== 장의 목표 ==== * 전략 정보를 간절히 바라는 것을 이해 * 모든 기업에서 정보 위기를 인식 * 운용 시스템과 정보 시스템의 구별 * 전략 정보를 제공하는 과거의 시도들이 실패 * 왜 데이터 웨어하우징이 실용적인 해결책인지를 살핌 1990년대에 들어서 사업 환경은 많은 변화가 되었다. 세계화되고 경쟁은 더욱 심해졌다. 경영진들은 경쟁력 제고와 핵심을 개선하기 위한 정보를 찾는데 혈안이 되었다. 운영을 위한 정보는 얻을 수 있었지만 경영진들이 원하는 전략적 의사결정을 위한 정보를 얻기 힘들었다. 그 정보는 운영정보와는 다른 즉시 사용어질 수 있는 다른 형태의 정보였다. 경영진들은 다음과 같은 Business Question에 대한 답을 얻고 싶었다. * 창고는 어디에 지어야 하는가? * 어떤 생산라인이 증설되어야 하는가? * 어떤 마켓을 강화시켜야 하는가? 그래서 탄생한 것이 데이터 웨어하우징이다. 데이터 웨어하우징은 실행 가능한 전략 정보를 제공하기 위한 새로운 패러다임이다. 참고 {{{ Data warehouse는 정적인 의미를 가진다. Data warehousing이란, 조직체들이 DW라는 특정 저장장치를 이용함으로써 그들의 정보 자산으로부터 가치를 추출하는 "과정" }}} ==== 전략 정보의 필요성 확대 ==== '''전략 정보'''란, 사업 목적들에 대한 의사결정을 돕기 위해 통합된 정보를 말한다. 데이터 웨어하우징은 이러한 전략정보를 취득하기 위한 과정이다. 전략정보의 필요성 전략정보가 제공하는 기회에 대한 가치에 있다. 여러 사업 목표들에 대한 의사결정을 하기 위해서 경영자와 관리자들은 다음과 같은 사업목표를 위한 정보를 요구한다. * 현재 고객 기반(customer base)을 유지한다 * 다음 5년간 동안 고객 기반을 15%까지 증가한다 * 다음 3년 안에 시장 점유를 10%까지 얻는다 * 최고 5개 제품 그룹들에서 제품 품질 수준을 개선한다 * 선적에서 고객 서비스 수준을 향상한다 * 2년 안에 세 개의 새로운 제품들을 시장에 내놓는다 * 북동쪽 구역에서 매출을 15% 증가시킨다 관리자나 경영진들은 이러한 사업목표를 달성하기 위해 여러가지 의사결정을 해야 할 것이다. 그러기 위해서는 다음과 같은 정보를 요구한다. * 회사의 운영에 대한 철저한 지식. * 주요 사업요인들과 이것들이 서로 영향을 끼치는 방법. * 사업 요인들이 시간이 지남에 따라 어떻게 변하는 지를 감시. * 그들 회사의 성과를 경쟁자와 비교하고 그리고 산업 벤치마크와 비교. 경영자와 관리자들은 그들의 관심을 * 고객들의 요구와 좋아하는 물건들, * 부상하는 기술들, * 판매와 마케팅 결과들 제품과 서비스들의 품질 수준 에 집중할 필요가 있다. 사업 전략과 목적들의 공식화와 실행을 결정하게 하는데 필요한 정보의 형태들은 광범위한 근거가 있어야 되고 전체 조직을 포함하게 한다. 전략정보는 기업의 계속된 번영과 생존을 위해서 매우 중요하다. 결정적인 사업 의사결정은 기업에서 적절한 전략 정보의 유효성에 달려 있다. 다음은 전략 정보의 특징이다. * 전사적인 하나의 관점 * 데이터 통합: 정확하고 비지니스 룰에 맞는 정보 * 직관적고 쉬운 접근 및 분석적인 응답 * 모든 비지니스 요소는 하나의 값을 가진다. * 시계열적인 정보 ==== 정보 위기 ==== 우리는 깜짝 놀라게 하는 두 개의 사실에 직면에 있다. 1. 조직은 많은 데이터를 갖고 있다. 2. 정보 기술 자원과 시스템들은 이 모든 데이터를 유용한 전략정보로 바꾸는 데 효과적이지 않다. 대부분 회사들은 충분한 데이터의 부족 때문이 아니고, 이용 가능한 데이터가 전략적인 의사 결정을 위해 즉시 사용될 수 없기 때문에 정보 위기에 직면해 있다. 정보위기에 대해 말하게 된 이유는 다음과 같다. * 호환성 없는 구조와 이기종 환경 * 기업 전역에 퍼져있는 시스템 * 운용 데이터는 사건-주도(event-driven)방식 이러한 이유로 전체 기업 전략과 목적들에 관한 적절한 의사결정을 위해 우리는 모든 시스템들로부터 통합된 정보를 요구한다. 전략정보는 분석하는 방향에 따라 적당한 형식으로 되어 있어야만 한다. 경영자와 관리자들은 다른 사업 관점들에서 데이터를 재검토 할 수 있어야만 한다. 하지만 운영 데이터를 이러한 전략정보를 얻기에는 적합하지 않다. 전략정보의 필요성과 정보 위기는 DW를 출현하게 만들었다. ==== 운영계 vs[* 요즘(2008년) 게시판에서는 '붙자씹새'라고 하더군요] 정보계 ==== 운영계와 정보계가 독립된 시스템으로 구축되어야 하는 이유 * 다른 목적들을 서비스하고 * 그 범위가 다르고 * 그 데이터 내용이 다르고 * 데이터 사용 패턴들이 다르고 * 데이터 접근 형태들이 다른 정보계와 운영계의 차이점 || || 운영계 || 정보계 || ||조직화||트랜잭션에 관하여 조직화||특정 주제에 대하여 조직화|| ||사용자수||많다||적다(일반적으로 수십명 내외)|| ||응답시간||매우짧다||수초~수분, 많게는 수시간|| ||규모||일반적으로 수십GB ~수백GB||일반적으로 수TB ~ 수백TB|| ||정규화||정규화됨||비정규화됨(일부 정규화)|| ||시간||거의 현재를 나타냄||이력 데이터|| ||갱신빈도||매우 자주 일어남||거의 일어나지 않음|| 운영계와 정보계는 이처럼 현격히 다른 특성을 가지지만 어플리케이션은 두 가지 특성을 모두 가질 수도 있다. ==== 데이터 웨어하우징 - 유일한 실행 가능한 솔루션 ==== 전략정보를 위해 설계된 시스템에서 요구되는 특성은 다음과 같다. * 분석 작업을 위해 설계된 데이터베이스 * 다수의 응용들로부터 온 데이터 * 사용하기 쉽고 사용자들에 의해 오래 계속되는 대화식의 세션들에 도움이 되는 환경 * 읽기-집중의 데이터 사용 * '''IT 도움 없이 사용자들에 의한 시스템과 직접 상호작용''' * 주기적으로 경신되고 안정된 내용 * 현재와 이력 데이터를 포함하는 내용 * '''사용자가 온라인으로 질의를 돌리고 결과를 얻는 능력''' * 사용자가 보고서를 시작하게 하는 능력 분석적인 처리 요구조건들의 4가지 수준 * 현재와 이력 데이터에 대한 간단한 질의들과 보고서들의 수행 * 다수의 다른 방법들로 “가정” 분석("what-if" analysis)을 수행하는 능력 * 질의를 하고, 물러서서, 분석하고, 그런 후에 어떤 원하는 기간에서 처리를 계속하게 하는 능력 * 역사적인 경향들을 탐지해내고 그것들을 미래의 결과를 위해 적용한다 데이터 웨어하우스에서의 비즈니스 인텔리젼스 * 사용자들이 전략 정보를 얻으려고 간절히 바라는 이런 새 시스템 환경은 새로운 패러다임의 데이터 웨어하우징(data warehousing)으로 되었다. * 새로운 시스템 환경은 일일 운용들을 지원하는 시스템 환경과 분리되어 유지된다. * 데이터 웨어하우스는 필수적으로 기업이 전략적인 의사결정을 하게 하는 비즈니스 인텔리젼스를 유지한다 * 데이터 스테이징 영역: 운용 데이터는 정제되고 데이터 웨어하우스에서 쉬운 검색을 위해 배치에 적합한 형태로 변환된다. ==== 데이터 웨어하우스의 정의 ==== 데이터 웨어하우스의 기능적 정의는 다음과 같다. {{{ 데이터 웨어하우스는 - 기업의 통합되고 전체적인 관점을 제공하고 - 의사결정에 즉시 이용할 수 있는 기업의 현재와 이력 정보를 만들고 - 운영 시스템들을 방해함이 없이 의사결정지원 트랜잭션들을 가능하게 하고 - 조직의 정보가 모순 없게 하고 - 전략 정보의 유연하고 상호작용하는 공급원을 주는 정보를 제공하는 환경이다. }}} ===== 정보 전달을 위한 간단한 개념 ===== 결국 데이터 웨어하우스는 전략 정보에 대한 요구로 태어났고, 전략 정보를 제공하기 위한 새로운 방법을 모색한 결과다. 이제까지 없는 데이터를 생성하는 것이 아니고, 현존하는 데이터를 사용하게끔 만들고 그것을 전략 정보를 제공하는데 적합한 형태로 변환시키는 것이다. 데이터 웨어하우스는 의사결정 과정들을 지원하기 위해 존재한다. 조직에서 이미 가지고 있는 모든 데이터를 획득하고, 그것을 정제/변환하고, 유용한 전략정보를 제공하는 것이 데이터 웨어하우스다. ===== 제품이 아닌, 환경이다 ===== 데이터 웨어하우스는 전략정보를 제공하는 컴퓨팅 환경이다. 사용자들이 보다 올바른 의사결저을 내릴 수 있는데 필요한 데이터를 직접 만질 수 있도록하는 환경이다. 다음의 데이터 웨어하우스 환경에 대한 특징이다. * 데이터 분석과 의사결정 지원을 위한 이상적인 환경 * 유동적이고, 유연하고, 그리고 대화식 * 100% 사용자 주도 * "질문-대답-또 다시 질문"이라는 패턴에 아주 응답성이 높고 도움이 되는 * 복잡하고 예상하지 못하는 질문들에 답을 발견하는 능력을 제공한다. ===== 많은 기술들의 혼합물 ===== 데이터 웨어하우스는 다음과 같은 작업을 해야 한다. * 운영 시스템들로부터 데이터를 획득한다. * 필요하다면 산업 벤치마크와 같은 외부자료도 포함한다. * 다양한 소스들로부터 데이터를 통합한다. * 불일치성을 제거하고 데이터를 변환한다. * 의사 결정을 위해 손쉽운 접근에 적합한 형태로 데이터를 저장한다. 이러한 작업은 서로 다른 기능들을 수반한다. 이러한 기능들을 위해서 다음과 같은 많은 기술들이 필요하다. * 데이터 품질 * Data Modeling * Data Management * Metadata Management * Data Acquisition * 관리 * Analysis * Applications * Development Tools * Storage Managment