이번에는 t분포 (t distribution)자유도 (degree of freedom)에 대해서 정리하도록 하겠습니다.




일단 모평균 의 점추정량은 표본평균 입니다.


※ 점추정량 : 표본에서 얻어지는 정보를 이용하여 미지인 모수(parameter)의 참값으로 생각되는 하나의 값

모수 : 모집단의 특성을 수치로 나타낸 것




만일 모집단이 정규분포를 한다면 의 확률분포는 표준정규분포를 하게 됩니다.


따라서 이러한 확률분포로부터 표본평균에 대한 확률구간을 구하면 다음과 같습니다.


이 구간을 표본이 얻어진 후 표본평균값으로 대체한 것이 모평균 에 대한 신뢰구간이 됩니다.







또한 모분산을 모르는 경우 (는 표본의 표준편차)는와 달리

표준정규분포와 조금 다른 형태의 분표인 분포(distribution)를 하는데,

이 분포는 표본수에 따라 분포 모양이 조금씩 달라지게 됩니다.


그 이유는 자유도(degree of freedom) 에 따라 

포의 모양이 결정되기 때문입니다.


이 분포는 표본수가 커짐에 따라 표준정규분포와 모양이 비슷해지므로,

표본수가 어느 정도 큰 경우에는 표준정규분포를 이용해 확률을 구하여도 큰 차이를 보이지 않습니다.


(출처 : http://slideplayer.com/slide/6930591/)


그림에서 확인할 수 있듯이 분포는 표준정규분포와 전체적인 형태는 같으나

옆으로 넓게 퍼진 형태를 취하고 있습니다.


또한 값이 커질수록 점점 정규분포와 비슷해짐을 알 수 있습니다.


즉, 분포는 자유도가 클수록 점점 퍼짐의 정도가 작아져 자유도가 가 되면 정규분포와 같아집니다.





정리하자면, 정규분포 모집단에서 추출한 표본평균을 표본 표준편차로 표준화하면 자유도 인 분포를 하게 됩니다.






계속 자유도에 대해서 언급을 하였는데 자유도가 무엇인지를 다루지는 않았으므로 정리를 하고 넘어가도록 하겠습니다.


자유도(degree of freedom) 말 그대로 '자유스러운 정도'입니다.


표본수가 인 표본에서 표본평균가 정해져 있다면 표본값 중 '자유롭게 변할 수 있는' 것은 개의 표본입니다.


예를 들어, 3개의 시험을 봤는데 평균이 80점이라고 합시다.

이때 2개의 시험에서 각각 70점, 90점의 성적을 받았다면

나머지 1개의 시험 성적은 평균에 의하여 반드시 80점이어야 합니다.


따라서 이 경우에는 표본수가 3이지만 자유롭게 변할 수 있는 것은 2(3-1)개입니다.



모평균을 알고 있다면


를 사용하는 것이 더욱 좋을 것이고 

이러한 경우  모두가 아무 값이나 자유롭게 들어가 계산이 됩니다.




하지만 를 알지 못하므로 로 대체하여 사용합니다.

이때는 주어진 를 맞추어 주여야 하므로 중 어느 하나는 자유롭게 들어갈 수 없으므로

자유도는 이고


를 사용합니다.




'Statistics > An Introduction to Statistics' 카테고리의 다른 글

베이즈 정리(Bayes' Theorem)  (0) 2018.03.25
확률  (0) 2018.03.25
수치 기술통계  (0) 2018.03.18