확률은 사건이 일어날 가능성을 숫자로 표현한 것이다.
변수는 컨텍스트에 따라서 의미가 바뀐다.
- 컴퓨터 프로그래밍에서의 변수는 이름, 크기(byte), 메모리주소영역의 속성을 가지고 있고, 메모리주소영역에는 임의의 값을 임시로 저장하는 역할
- 통계 분석할 때는 1차원 vector
- 확률변수의 변수는 확률질량함수에 따라 확률이 결정되는 변수
확률변수 P(X=x) = f(x),
- X: 확률변수, 대문자로 표기하는 것이 관례
- x: 실현된 값, 소문자로 표기하는 것이 관례
- f()는 확률질량(or 밀도)함수: 확률값을 결정해주는 함수 --> 컴퓨터 세계는 이산적이므로 좀 생각하기 쉽다. 미분같은 것도 수치적인 미분을 하면 된다. d를 아주작은 값으로 하면 되는 것이지..
- P(X=x): 확률변수 X가 x일 확률
확률변수X와 확률질량함수 f()의 R 코드는 다음과 같다.
X <- function(x){
return (ifelse(x==0, 1/3, 2/3))
}
P <- X(x=1)
print(P)