#title 차원의 선택과 팩트 변환 [[TableOfContents]] 사실.. 누구도 결정하기 힘들다. 그래서 가끔씩 '과학적'인 방법을 사용해야 한다. 여기서 '과학적'이란 합리적이기 보다는 감에 의존한 것이 아님에 대한 힘(power)을 말한다. ==== 차원의 선택 ==== 팩트에 대한 필요없는 차원이 어떤 것인가? (아.. 이거 매번 회귀분석 때려봐야 하는건가?? 라고도 생각해 볼 수도 있나?) * 회귀분석(전진선택, 후진제거) * 주성분분석(참고: http://blog.naver.com/kwanseol?Redirect=Log&logNo=20057230822) --> 데이터 압축방법 * random forest로 변수의 중요도 파악 ==== 팩트 변환 ==== 걍.. 다른게 아니고.. 비교 대상끼리 서로 다른 단위나 상황때문에 비교가 힘든 경우가 있다. 단위에 구애받지 않게 변동계수(표준편차/평균)같은거랑 비슷하다. 보통은 z-스코어 정규화 쓴다. * z-스코어 정규화 참고: [기준치와 편차치] * 최소-최대 정규화 * 소수스케일링 attachment:차원의선택과팩트변환/fact_trans.jpg ==== 참고자료 ==== * http://blog.naver.com/asus1984?Redirect=Log&logNo=120057143791