#title DW의 개관 [[TableOfContents]] ==== 전략 정보 ==== 전략 정보란, 사업 목적들에 대한 의사결정을 하기 위해 필요한 통합된 정보를 말한다. 전략 정보가 제공되는 않은 회사는 전략 정보가 제공하는 기회에 대한 가치를 누릴 수 없다. 여러 사업 목표들에 대한 결정을 하기 위해서 경영자와 관리자들은 다음 목적을 위한 정보를 요구한다. * 회사의 운영에 대한 철저한 지식을 얻는다. * 주요 사업요인들과 이것들이 서로 영향을 끼치는 방법을 배운다. * 사업 요인들이 시간이 지남에 따라 어떻게 변하는 지를 감시한다. * 그들 회사의 성과를 경쟁자와 비교하고 그리고 산업 베니마크와 비교한다. 경영자와 관리자들은 그들의 관심을 고객들의 요구와 좋아하는 물건들, 부상하는 기술들, 판매와 마케팅 결과들 제품과 서비스들의 품질 수준에 집중할 필요가 있다. 사업 전략과 목적들의 공식화와 ㅣㄹ행을 결정하게 하는데 필요한 정보의 형태들은 광범위한 근거가 있어야 되고 전체 조직을 포함하게 한다. 결정적인 사업 의사결정은 기업에서 적절한 전략 정보의 유효성에 달려 있다. 다음은 전략 정보의 특징이다. * 전사적인 하나의 관점 * 데이터 통합: 정확하고 비지니스 룰에 맞는 정보 * 직관적고 쉬운 접근 및 분석적인 응답 * 모든 비지니스 요소는 하나의 값을 가진다. * 시계열적인 정보 ==== 정보 위기 ==== 우리는 깜짝 놀라게 하는 두 개의 사실에 직면에 있다. 1. 조직은 많은 데이터를 갖고 있다. 2. 정보 기술 자원과 시스템들은 이 모든 데이터를 유용한 전략정보로 바꾸는 데 효과적이지 않다. 대부분 회사들은 충분한 데이터의 부족 때문이 아니고, 이용 가능한 데이터가 전략적인 의사 결정을 위해 즉시 사용될 수 없기 때문에 정보 위기에 직면해 있다. 전략정보의 필요성과 정보 위기는 DW를 출현하게 만들었다. ==== DW를 구축하기 위해서 필요한 물음들 ==== * 조직에서 얼마나 많은 리스크를 받아들이고 허용할 수 있는가? * 프로젝트의 요구사항과 범위를 정의하는 사용자들을 가졌냐? * 강력한 스폰서가 있냐? * 내부 스폰서는 기술 제안 사항을 이해했냐? * 예산은 확보했냐? * 프로젝트 계획은 이해할 수 있는 합리적인 스케줄이냐? * 프로젝트 매니저는 경험이 있냐? * 프로젝트를 위한 완벽한 공부가 되었냐? ==== DW의 기능 ==== * 표준보고서와 그래프(운영계에서도 물론 할 수 있다. 하지만 DW에서 더 쉽게 할 수 있다.) * 차원분석(Dimensinal Analysis)이라는 조회 및 보고 타입을 지원하여 가설을 조사하고 해답을 구할 수 있도록 돕는 기능. * 큰 관점에서 점점 더 세부적인 관점으로 조회 * 연속적인 조회로 연속적인 사고를 할 수 있음. * DW와 대화식으로 조회를 함 * 데이터 마이닝(데이터에서 패턴을 자동으로 인식하여, 현재의 특성을 근거로 기존의 데이터를 설명하고 미래의 행동양식을 예측할 수 있게 도와줌) ==== DW의 목적 ==== * 기업 전체에 고객에 대한 단일 관점 제공 * 가능한 많은 사람들에게 많은 비즈니스 정보를 쥐어주는 것 * 통상 보고서 생성시간 단축 * 고객 행위 관찰 * 제품 구매에 대한 예측 * 통계적 분석을 한 곳에서 하게 하기 * 전산실의 다운사이징에 대한 상쇄 * 비즈니스 이슈에 대한 대응력 향상 * 측정 정확도 향상 * 생산성 향상 * 책임 증대 및 분산 ==== 운영계 vs[* 요즘(2008년) 게시판에서는 '붙자씹새'라고 하더군요] 정보계 ==== || || 운영계 || 정보계 || ||조직화||트랜잭션에 관하여 조직화||특정 주제에 대하여 조직화|| ||사용자수||많다||적다(일반적으로 수십명 내외)|| ||응답시간||매우짧다||수초~수분, 많게는 수시간|| ||규모||일반적으로 수십GB ~수백GB||일반적으로 수TB ~ 수백TB|| ||정규화||정규화됨||비정규화됨(일부 정규화)|| ||시간||거의 현재를 나타냄||이력 데이터|| ||갱신빈도||매우 자주 일어남||거의 일어나지 않음|| 운영계와 정보계는 이처럼 현격히 다른 특성을 가지지만 어플리케이션은 두 가지 특성을 모두 가질 수도 있다. ==== DW를 어렵게 만드는 것들 ==== * 크기 문제.(DW는 졸라 크다) 크다는 것은 비용이 많이 투자되어야 함을 의미한다. * DB설계 문제. 운영계는 트랜잭션이 안정적으로 설계되는 것이 기본인 반면, DW는 끊임없는 변화에 대한 압박을 받는다. * 소스의 변경 * 요구사항의 변경 * 데이터 통합(가장 어려움) * 사용자의 무리한 요구(어려움) ==== DW구성요소 ==== * 데이터 이주 도구 * 메타데이터 저장소 * 데이터 스토어 * 검색, 형식화 및 분석을 위한 도구모음 * DW관리도구 ==== 데이터 품질 ==== 사용자가 DW에 대한 신뢰성을 잃으면 DW는 사용자를 잃을 것이다. 아주 기본적이며 가장 중요한 문제다. (조낸 관리해야 한다. 요즘[* 2008년] 정보계 뿐만 아니라 운영계에도 화두가 되고 있다. 그래서 요즘은 IT Governance라는 용어가 자꾸 튀어 나온다.) 사용목적을 충족시키기 위해서는 * 정확성 * 옳은 표현 * 올바른 값 * 유효한 값 * 적시성 * 적절성 * 완전성 * 이해성 * 신뢰성 을 가져야 한다. ==== ETL ==== 다음 그림으로 잘 설명된다. attachment:etl_concept.gif {{{* 출처: http://www.bifocus.co.kr}}} ==== Metadata ==== 메타데이터는 두 가지 커다른 범주로 나뉜다. * 관리를 위한 메타데이터 * 소스DB의 내용 * DW의 목표 * ETL Rule * ETL 이력 * 소스 데이터 작성 주체 * 누가 사용하는가? * 누가 어떤 방법으로 사용하는가? * 사용자를 위한 메타데이터 * 데이터의 출처 * DW로 옮기면서 어떻게 변형되었는가? * 데이터 생성시의 사업 정책 및 시행 * DW에 대한 설명 * 차원에 대한 통합 계층 정보 ==== DW관리 ==== 관리는 아래의 2가지 작업으로 나뉜다. * 데이터 관리 * 용량계획(CPU, Memory, HDD, Network 등) * 삭제규칙수립 * 보안 * 누가 데이터를 이용하는가 추적 * 어떻게 이용하는가 추적 * 처리 관리 * 최신 내용으로 유지하기 위한 모든 일 * 소스DB의 변경사항에 대한 갱신 * 새로운 데이터에 대한 데이터 품질 확인 * DW손상여부 확인 * DM으로 세분화 ==== DW구축 반복-점진 모델 ==== 요구분석 -> 구축 -> 배포 -> 사용 -> 적격여부판단 -> 적용 -> 처음으로 1. 요구분석 1.1 준비단계 1.1.1 프로젝트 조직구성 1.1.2 인원배치 1.1.3 전체적인 프로젝트 계획서(전체관점) 1.2 사용자요구분석 1.2.1 BQ(Business Question) 수집 1.2.2 KPI수집 1.3 소스시스템분석 1.3.1 주제영역 분석 1.3.2 개념적 ERD의 분석(Attribute 위주) 1.3.3 코드분석 1.4 계획서작성 1.4.1 DW프로젝트 설계일정 및 진행방향 설정 1.4.2 업무분석시 미협의 사항 및 쟁점사항 도출/문서화 1.5 분석보고서 작성 1.5.1 분석보고서 작성 1.5.2 업무분석시 미협의 사항 및 쟁점사항 도출/문서화 2. 구축(설계:구현:테스트 = 1:1:1 시간투입) 2.1 다차원 모델링 2.2 ETL 2.2 테스트 3. 배포 4. 사용 5. 적격여부판단 6. 적용 ==== BI 성공의 가장 큰 장애 요인 순위 ==== 1. BI 툴과 인터페이스의 복잡성 2. BI 소프트웨어와 사용자 라이선스 요금 3. 관련 데이터에 시의 적절히 접근하기가 어려움 4. IT 지원에 대한 과도한 소프트웨어 요구 사항과 부족한 IT 인력 5. 애플리케이션 규명의 어려움 6. 적절한 BI 기술 인력의 부족 7. 경영진이나 비즈니스 관리자의 지원 부족 8. BI 프로그램의 기획이나 관리의 부족 9. BI 기술 표준 부족 10. 엔드 유저에 대한 교육 부족 ==== 참고할 만한 자료 ==== * http://cs.sungshin.ac.kr/~jpark/IEST/ * http://www.itdaily.kr/news/articleView.html?idxno=16676