Data Blog
모분산의 구간 추정 (1) 본문
이번 포스팅에서는 정규모집단이라는 것을 알고 있으며, 모평균도 알고 있을 때 모분산을 추정하는 방법에 대해 알아보고자 한다.
1. 카이제곱분포의 95% 예언적중구간
앞선 포스팅에서 카이제곱분포에 대해 설명했다. 이 분포를 활용하면 '95% 신뢰 구간'을 통해 예측할 수 있다는 점이 유용하며, 카이제곱 분포의 95% 예측 적중 구간은 자유도에 따라 달라진다.
예를 들어, 표준 정규 분포에서 3개의 데이터를 관측하고 이를 제곱한 후 모두 더한 통계량을 $V$라고 하면, $V$는 자유도 3인 카이제곱 분포를 따른다. 아래 도표에 따르면, $V \geq 0.22$일 때의 상대도수는 97.5%이고, $V \geq 9.35$일 때는 2.5%이다. 따라서 $0.22 \leq V < 9.35$인 구간의 상대도수는 95%가 된다.
9.35의 값은 범위에 포함되지 않지만 포함해도 확률적으로 큰 차이가 없으므로, 정규 분포의 예측 범위에 맞추기 위해 포함하는 것이 일반적이다. 즉, 도표에서 자유도 3에 해당하는 값을 보면, $0.22 \leq V \leq 9.35$가 95% 예측 적중 구간이 된다.
2. 정규모집단의 모분산을 추정
모평균 $\mu $, 모표준편차 $\sigma $인 정규모집단에서 n개의 표본 $x_{1}, x_{2}, \ldots ,x_{n}$을 관측하고, $V= (\frac{ x_{1}- \mu }{ \sigma } )^{2} +(\frac{ x_{2}- \mu }{ \sigma } )^{2} + \ldots (\frac{ x_{n}- \mu }{ \sigma } )^{2} $이라는 형태로 $V$를 계산하면 통계량 $V$는 자유도 n인 카이제곱분포를 한다.
따라서 일반적인 정규 모집단의 표본으로부터 카이제곱 분포를 따르는 통계량을 만들 수 있다면, '카이제곱 분포의 95% 예측 적중 구간'을 이용해 모분산을 구간 추정할 수 있게 된다.
3. 예제
어떤 식물 종의 잎 길이 모집단은 모평균이 15cm인 정규 모집단이라고 한다. 이때, 관측된 4개의 잎 길이가 각각 13cm, 17cm, 16cm, 14cm일 경우 모분산 $ \sigma ^{2} $의 95% 신뢰 구간을 구하시오.
해답 및 해설
우선, 관측된 4마리의 표본에서 통계량 $V$를 만든다. 주어진 표본은 $x_{1}=13, x_{2}=17, x_{3}=16, x_{4}=14$이며 모평균은 $\mu =15$이다. 이를 수식에 대입하면 다음과 같다.
$ V= (\frac{ x_{1}- \mu }{ \sigma } )^{2} +(\frac{ x_{2}- \mu }{ \sigma } )^{2} + \ldots (\frac{ x_{n}- \mu }{ \sigma } )^{2}$
즉, $V= (\frac{ 13- 15 }{ \sigma } )^{2} +(\frac{ 17- 15 }{ \sigma } )^{2} +(\frac{ 16- 15 }{ \sigma } )^{2}+(\frac{ 14- 15 }{ \sigma } )^{2} $
이를 계산하면, $ V= (\frac{ -2 }{ \sigma } )^{2} +(\frac{ 2 }{ \sigma } )^{2} +(\frac{ 1}{ \sigma } )^{2}+(\frac{ -1 }{ \sigma } )^{2}= \frac{10}{ \sigma ^{2} } $
따라서 통계량 $V$는 $ \frac{10}{ \sigma ^{2} } $로 표현된다.
$V$는 자유도 4인 카이제곱 분포를 따르는 데이터 중 하나라는 점을 고려할 때, 우리는 기본적으로 95% 예측 적중 구간 내의 수치를 검토할 필요가 있다. 즉, $\sigma $를 사전에 알고 있다면, 관측 값으로 계산한 $V$의 값이 95% 예측 적중 구간에 포함되지 않는 $\sigma $는 기각한다.
기각하지 않고 받아들이는 모집단의 모분산 $ \sigma ^{2} $는 위 표에 따라 $ 0.48\leq \frac{10}{ \sigma ^{2} } \leq 11.14$를 만족해야 한다. 이를 변형하면 다음과 같다. $ \frac{10}{11.14} \leq \sigma ^{2} \leq \frac{10}{0.48} \Longrightarrow 0.898 \leq \sigma ^{2} \leq 20.834$
따라서, 관측된 4개의 잎 길이로부터 모집단의 잎 길이 모분산은 0.898 이상 20.834 이하의 수치일 것이라고 추정할 수 있다.
'통계 > 통계학 Statistics' 카테고리의 다른 글
표본분산과 비례하는 통계량 W (0) | 2024.10.12 |
---|---|
카이제곱분포 (0) | 2024.10.09 |
모평균의 구간 추정 (1) (2) | 2024.10.09 |
샤프지수란? (3) | 2024.09.23 |