Notice
Recent Posts
Recent Comments
Link
«   2025/04   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30
Tags
more
Archives
관리 메뉴

Data Blog

모분산의 구간 추정 (1) 본문

통계/통계학 Statistics

모분산의 구간 추정 (1)

yuzln 2024. 10. 10. 21:29

이번 포스팅에서는 정규모집단이라는 것을 알고 있으며, 모평균도 알고 있을 때 모분산을 추정하는 방법에 대해 알아보고자 한다.

 

1. 카이제곱분포의 95% 예언적중구간

 

앞선 포스팅에서 카이제곱분포에 대해 설명했다. 이 분포를 활용하면 '95% 신뢰 구간'을 통해 예측할 수 있다는 점이 유용하며, 카이제곱 분포의 95% 예측 적중 구간은 자유도에 따라 달라진다.

 

예를 들어, 표준 정규 분포에서 3개의 데이터를 관측하고 이를 제곱한 후 모두 더한 통계량을 $V$라고 하면, $V$는 자유도 3인 카이제곱 분포를 따른다. 아래 도표에 따르면, $V \geq 0.22$일 때의 상대도수는 97.5%이고, $V \geq 9.35$일 때는 2.5%이다. 따라서 $0.22 \leq V < 9.35$인 구간의 상대도수는 95%가 된다.

 

9.35의 값은 범위에 포함되지 않지만 포함해도 확률적으로 큰 차이가 없으므로, 정규 분포의 예측 범위에 맞추기 위해 포함하는 것이 일반적이다. 즉, 도표에서 자유도 3에 해당하는 값을 보면, $0.22 \leq V \leq 9.35$가 95% 예측 적중 구간이 된다.

 

 

2. 정규모집단의 모분산을 추정

 

모평균 $\mu $, 모표준편차 $\sigma $인 정규모집단에서 n개의 표본 $x_{1},  x_{2}, \ldots ,x_{n}$을 관측하고, $V= (\frac{ x_{1}- \mu }{ \sigma } )^{2} +(\frac{ x_{2}- \mu }{ \sigma } )^{2} + \ldots (\frac{ x_{n}- \mu }{ \sigma } )^{2} $이라는 형태로 $V$를 계산하면 통계량 $V$는 자유도 n인 카이제곱분포를 한다.

 

따라서 일반적인 정규 모집단의 표본으로부터 카이제곱 분포를 따르는 통계량을 만들 수 있다면, '카이제곱 분포의 95% 예측 적중 구간'을 이용해 모분산을 구간 추정할 수 있게 된다.

 

 

3. 예제

 

어떤 식물 종의 잎 길이 모집단은 모평균이 15cm인 정규 모집단이라고 한다. 이때, 관측된 4개의 잎 길이가 각각 13cm, 17cm, 16cm, 14cm일 경우 모분산 $ \sigma ^{2} $의 95% 신뢰 구간을 구하시오.

 

해답 및 해설

 

우선, 관측된 4마리의 표본에서 통계량 $V$를 만든다. 주어진 표본은 $x_{1}=13, x_{2}=17, x_{3}=16, x_{4}=14$이며 모평균은 $\mu =15$이다. 이를 수식에 대입하면 다음과 같다.

 

$ V= (\frac{ x_{1}- \mu }{ \sigma } )^{2} +(\frac{ x_{2}- \mu }{ \sigma } )^{2} + \ldots (\frac{ x_{n}- \mu }{ \sigma } )^{2}$

 

 즉, $V= (\frac{ 13- 15 }{ \sigma } )^{2} +(\frac{ 17- 15 }{ \sigma } )^{2} +(\frac{ 16- 15 }{ \sigma } )^{2}+(\frac{ 14- 15 }{ \sigma } )^{2} $

 

이를 계산하면, $ V= (\frac{ -2 }{ \sigma } )^{2} +(\frac{ 2 }{ \sigma } )^{2} +(\frac{ 1}{ \sigma } )^{2}+(\frac{ -1 }{ \sigma } )^{2}= \frac{10}{  \sigma ^{2} } $

 

따라서 통계량 $V$는 $ \frac{10}{  \sigma ^{2} } $로 표현된다.

 

$V$는 자유도 4인 카이제곱 분포를 따르는 데이터 중 하나라는 점을 고려할 때, 우리는 기본적으로 95% 예측 적중 구간 내의 수치를 검토할 필요가 있다. 즉, $\sigma $를 사전에 알고 있다면, 관측 값으로 계산한 $V$의 값이 95% 예측 적중 구간에 포함되지 않는 $\sigma $는 기각한다.

 

기각하지 않고 받아들이는 모집단의 모분산 $ \sigma ^{2} $는 위 표에 따라 $ 0.48\leq \frac{10}{  \sigma ^{2} }  \leq 11.14$를 만족해야 한다. 이를 변형하면 다음과 같다. $ \frac{10}{11.14} \leq   \sigma ^{2}   \leq  \frac{10}{0.48}  \Longrightarrow 0.898  \leq \sigma ^{2} \leq 20.834$

 

따라서, 관측된 4개의 잎 길이로부터 모집단의 잎 길이 모분산은 0.898 이상 20.834 이하의 수치일 것이라고 추정할 수 있다.

 

반응형

'통계 > 통계학 Statistics' 카테고리의 다른 글

표본분산과 비례하는 통계량 W  (0) 2024.10.12
카이제곱분포  (0) 2024.10.09
모평균의 구간 추정 (1)  (2) 2024.10.09
샤프지수란?  (3) 2024.09.23