본문 바로가기
Statistics

Goodness-of-fit test

by wycho 2020. 5. 19.

Goodness-of-fit test라 하면 비교하고 싶은 모델에 관측된 데이터가 얼마나 잘 맞는지 확인하는 작업이다.

 

Poisson distribution

: 포아송 분포는 확률론에서 단위 시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 이산 확률 분포이다.

: 정해진 시간 안에 어떤 사건이 일어날 횟수에 대한 기댓값을 λ 라고 했을 때, 그 사건이 n회 일어날 확률은 다음과 같다. (λ=np) [WIKIPEDIA]

[ Poisson distribution ]

정해진 시간 안에 발생한 event가 poisson distribution을 따른다고 가정했을 때, expectation value를 구할 수 있고 observed value와 expected value를 chi-square goodness-of-fit test를 통해 observed value가 poisson distribution을 따르는지 확인 할 수 있다.

 

chi-square test 값과 dof, degrees of freedom,으로 p-value를 구할 수 있고, alpha(significant level)를 얼마로 정하느냐에 따라 observed value는 poisson distribution을 따르는지 아닌지 이야기할 수 있다.

 

chi-square distribution은 낮은 dof에서는 left skewed distribution을 보이며, 주로 right tail test가 이루어진다. observed value와 expected value의 차이가 크면 chi-square 값은 큰 값을 가질 수 있는 가능성이 크며, distribution의 오른쪽에 위치하게 되고 작은 p-value값을 가지게 된다. p-value가 alpha값보다 작게되면 null hypothesis로 설정한 'observed value는 poisson distribution을 따른다'는 가정은 rule out이 된다. 다시말해, alpha를 기준으로 확률이 작으면 poisson distribution을 따른다고 볼 수 있다는 가설이 rule out된다.

 

위와 같은 방법을 통해 observed value의 goodness-of-fit test를 진행할 수 있다.

'Statistics' 카테고리의 다른 글

Effect  (0) 2020.05.26
Confidence Interval  (0) 2020.05.25
Sampling error  (0) 2020.05.19
Systematic and Chance factor  (0) 2020.05.19
Chances and Probability  (0) 2020.05.19

댓글