Home | Print | Q/A | Guest | NewsLetter
Display context of search results Case-sensitive searching
FrontPage › 이항분포
Database System
Data Warehouse
Data Analysis
Operating System
Open Source
Enterprise Architecture
Software Engineering
Process
Working Smart

SQL Server
PostgreSQL
Oracle
DB2
Teradata
MySQL
Performance Tuning
Programming

Link
Philosophy
Tools
Misc
주인놈
_
_
SideBar Edit

Contents

1 베르누이의 시행
2 베르누이 시행에 대한 가정
3 이항분포의 정의
4 이항분포의 예
5 확률밀도함수
6 누적확률
7 사분위수
8 난수
9 2항분포의 적합도 검정
10 확률계산 예제1
11 확률계산 예제2


1 베르누이의 시행 #

  • 성공 또는 실패
  • 사고 또는 무사고
  • 양품 또는 불량품
  • 병에 감염 또는 비감염
  • 동전을 던져 앞면 나옴 또는 뒷면 나옴
  • 찬성 또는 반대

2 베르누이 시행에 대한 가정 #

  • 각 시행은 성공과 실패의 두 가지 사건만을 가진다.
  • 각 시행에서 성공할 확률은 p, 실패할 확률은 q = 1 - p를 가진다.
  • 각 시행은 서로 독립으로 각 시행의 결과가 다른 시행의 결과에 영향을 미치지 않는다.

3 이항분포의 정의 #

확률변수 X의 분포가 이항 분포를 따를 경우 X ~ Binomial(n,p)로 표기하며, 그 확률질량함수(PMF) 식은 다음과 같다.
이항분포.jpg
n: 베르누이 시행의 반복횟수
p: 각 시행에서 성공할 확률(0 < p < 1)
x: n번 시행중 성공의 횟수

4 이항분포의 예 #

  • 동전던지기를 10번 시행할 경우 앞면이 나온 횟수
  • 신약을 복용한 환자 중 병이 치유된 환자수
  • 출하된 제품 중 불량품의 수
  • 도루를 20번 시도할 경우 도루성공 횟수

5 확률밀도함수 #

plot(dbinom(0:100, size=100, prob=0.2))
dbinom01.jpg


plot(dbinom(0:100, size=100, prob=0.5))
dbinom02.jpg

6 누적확률 #

plot(pbinom(0:100, size=100, prob=0.5))
pbinom01.jpg

7 사분위수 #

plot(qbinom(c(0.2, 0.5, 0.8), size=10, prob=0.5))
qbinom01.jpg

8 난수 #

plot(rbinom(0:100, size=100, prob=0.5))
rbinom01.jpg

9 2항분포의 적합도 검정 #

> # 100명 중 후보 A 지지:67명, 후보 B지지:33명 이항검증 Exact binomial test
> binom.test(67, 100, p = 1/2, alternative = "two.sided")

        Exact binomial test

data:  67 and 100 
number of successes = 67, number of trials = 100, p-value =
0.0008737
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.5688272 0.7608015 
sample estimates:
probability of success 
                  0.67 

> 

10 확률계산 예제1 #

1. 주사위를 두 번 던져 모두 1이 나올 확률은?
> #주사위 2회 던짐. size=2
> #1이 나올 확률 = 1/6
> dbinom(1:2, size=2, prob=1/6)
[1] 0.27777778 0.02777778
> 
주사위를 1회 던져 1이 나올 확률은 0.27777778이며, 2회 던져 모두 1이 나올 확률은 0.02777778(약 3%)로 확률이 낮은 것을 알 수 있다.

2. A전염병에 걸려 회복될 수 있는 확률이 0.4일 때, 15명이 병에 걸린 경우

- 확률변수 X의 평균과 분산?

  • 평균 = 15 * 0.4 = 6 (기대값)
  • 분산 = 15 * 0.4 * 0.6 = 3.6 (평균과 얼만큼 떨어져 있는가? SUM((값 - 평균)2) / 개수
  • 표준편차 = SQRT(3.6)

<평균을 구하는 다른 방법1: 그래프를 이용한 방법>
대충 6이 가장 높은 꼭지점이라는 것을 알 수 있다.
problem02.jpg

<평균을 구하는 다른 방법1: 난수활용>
난수를 활용해도 평균이 대충 6과 근사한다는 것을 알 수 있다.
> mean(rbinom(1:10000, size=15, prob=0.4))
[1] 6.0037
> mean(rbinom(1:10000, size=15, prob=0.4))
[1] 5.9804
> mean(rbinom(1:10000, size=15, prob=0.4))
[1] 6.0008
> mean(rbinom(1:10000, size=15, prob=0.4))
[1] 6.0188
> mean(rbinom(1:10000, size=15, prob=0.4))
[1] 5.9974
> 

- 5명이 회복될 확률
> #15명이 병에 걸림 size=15
> #5명이 회복될 확률 
> dbinom(1:5, size=15, prob=0.4)
[1] 0.00470185 0.02194197 0.06338790 0.12677580 0.18593784
> max(dbinom(1:5, size=15, prob=0.4))
[1] 0.1859378
> 

- 적어도 10명이 회복될 확률
> 1 - max(pbinom(1:9, size=15, prob=0.4))
[1] 0.0338333
> 

- 3명에서 8명이 회복될 확률
> bin <- pbinom(1:8, size=15, prob=0.4)
> 3명이상이므로 2까지 빼면 된다.
> bin[8] - bin[2]
[1] 0.8778386
> 
problem01.jpg

3. 4지선다형 10문제를 임의로 찍어 3개 이하의 정답을 맞출 확률은?
> pbinom(1:3, size=10, prob=1/4)
[1] 0.2440252 0.5255928 0.7758751
> 
0.7758751. 약 78% 확률이다.

4. 주사위 3개를 동시에 던질 때의 확률
> dbinom(1:3, size=3, prob=1/6)
[1] 0.34722222 0.06944444 0.00462963
> 
주사위 1개만 1이 나올 확률은 0.34722222 이고, 2개만 1이 나올 확률은 0.06944444 이고, 3개가 1이 나올 확률은 0.00462963이다.


11 확률계산 예제2 #


5. 총 10문제, 5지선다형(5개의 답 가운데 1개만 정답) 찍을 때 9개를 맞출 확률은?
> dbinom(1:9, size=10, prob=1/5)[9]
[1] 4.096e-06

6. 동전을 던져서 앞면이 나오면 오른쪽으로 1단위 이동하고, 뒷면이 나오면 왼쪽으로 1단위 이동할 때

- 처음에 원점에서 오른쪽 2단위 거리에 있다 할 때, 원점으로 돌아올 확률
> pbinom(1:10, size=10, prob=1/2)
 [1] 0.01074219 0.05468750 0.17187500 0.37695313 0.62304687 0.82812500
 [7] 0.94531250 0.98925781 0.99902344 1.00000000
> bin <- pbinom(1:10, size=10, prob=1/2)
> #오른쪽으로 4단위, 왼쪽으로 6단위 움직이면 원점
> bin[6] - bin[5]
[1] 0.2050781
> #또는
> bin <- dbinom(1:10, size=10, prob=1/2)
> bin
 [1] 0.0097656250 0.0439453125 0.1171875000 0.2050781250 0.2460937500
 [6] 0.2050781250 0.1171875000 0.0439453125 0.0097656250 0.0009765625
> #왼쪽 4단위 이동 확률 또는 오른쪽 6단위 이동할 확률만 구하면 된다.
> bin[4]
[1] 0.2050781
> bin[6]
[1] 0.2050781

- 처음에 원점에 있을 때, 이 시행으로 원점에서 2단위 이내에 있을 확률
> #원점에서 2단위 이내에 있는 경우
> #왼쪽:5, 오른쪽:5
> #왼쪽:4, 오른쪽:6
> #왼쪽:6, 오른쪽:4
> bin <- dbinom(1:10, size=10, prob=1/2)
> sum(bin[4:6])
[1] 0.65625

8. 화투는 총 48장이다. 12종이며, 각 4장씩 짝을 이룬다. 1매씩 4번 뽑을 때에 송학(일)을 3장 뽑을 확률
> dbinom(1:3, size=4, prob=4/48)[3]
[1] 0.002121914
조낸 낮은 확률이다. 이런 도박은 절대 하지 말아야겠구먼..

EditText|Print|FindPage|DeletePage|LikePages|http://www.databaser.net|last modified 2010-03-08 17:28:18