이번에는 t분포 (t distribution)과 자유도 (degree of freedom)에 대해서 정리하도록 하겠습니다.
일단 모평균 의 점추정량은 표본평균 입니다.
※ 점추정량 : 표본에서 얻어지는 정보를 이용하여 미지인 모수(parameter)의 참값으로 생각되는 하나의 값
모수 : 모집단의 특성을 수치로 나타낸 것
만일 모집단이 정규분포를 한다면 의 확률분포는 표준정규분포를 하게 됩니다.
따라서 이러한 확률분포로부터 표본평균에 대한 확률구간을 구하면 다음과 같습니다.
이 구간을 표본이 얻어진 후 표본평균값으로 대체한 것이 모평균 에 대한 신뢰구간이 됩니다.
또한 모분산을 모르는 경우 (는 표본의 표준편차)는와 달리
표준정규분포와 조금 다른 형태의 분표인 분포(distribution)를 하는데,
이 분포는 표본수에 따라 분포 모양이 조금씩 달라지게 됩니다.
그 이유는 자유도(degree of freedom) 에 따라 분
포의 모양이 결정되기 때문입니다.
이 분포는 표본수가 커짐에 따라 표준정규분포와 모양이 비슷해지므로,
표본수가 어느 정도 큰 경우에는 표준정규분포를 이용해 확률을 구하여도 큰 차이를 보이지 않습니다.
(출처 : http://slideplayer.com/slide/6930591/)
그림에서 확인할 수 있듯이 분포는 표준정규분포와 전체적인 형태는 같으나
옆으로 넓게 퍼진 형태를 취하고 있습니다.
또한 값이 커질수록 점점 정규분포와 비슷해짐을 알 수 있습니다.
즉, 분포는 자유도가 클수록 점점 퍼짐의 정도가 작아져 자유도가 가 되면 정규분포와 같아집니다.
정리하자면, 정규분포 모집단에서 추출한 표본평균을 표본 표준편차로 표준화하면 자유도 인 분포를 하게 됩니다.
계속 자유도에 대해서 언급을 하였는데 자유도가 무엇인지를 다루지는 않았으므로 정리를 하고 넘어가도록 하겠습니다.
자유도(degree of freedom)는 말 그대로 '자유스러운 정도'입니다.
표본수가 인 표본에서 표본평균가 정해져 있다면 표본값 중 '자유롭게 변할 수 있는' 것은 개의 표본입니다.
예를 들어, 3개의 시험을 봤는데 평균이 80점이라고 합시다.
이때 2개의 시험에서 각각 70점, 90점의 성적을 받았다면
나머지 1개의 시험 성적은 평균에 의하여 반드시 80점이어야 합니다.
따라서 이 경우에는 표본수가 3이지만 자유롭게 변할 수 있는 것은 2(3-1)개입니다.
모평균을 알고 있다면
를 사용하는 것이 더욱 좋을 것이고
이러한 경우 모두가 아무 값이나 자유롭게 들어가 계산이 됩니다.
하지만 를 알지 못하므로 로 대체하여 사용합니다.
이때는 주어진 를 맞추어 주여야 하므로 중 어느 하나는 자유롭게 들어갈 수 없으므로
자유도는 이고
를 사용합니다.
'Statistics > An Introduction to Statistics' 카테고리의 다른 글
베이즈 정리(Bayes' Theorem) (0) | 2018.03.25 |
---|---|
확률 (0) | 2018.03.25 |
수치 기술통계 (0) | 2018.03.18 |