목록통계 (6)
Data Blog
1. 표본분산과 비례하는 통계량 W 통계량 $V$는 데이터에서 모평균 $\mu $를 뺀 값을 이용하지만, 표본분산 $s^{2} $은 데이터에서 표본평균 $\overline{x} $를 빼 편차를 계산한다. 그러면 $V$는 카이제곱분포를 하는 통계량이 되는데, 여기서 모평균 $\mu $ 대신 표본평균 $\overline{x}$를 사용하여 제곱한 값들을 더하면, 카이제곱 분포를 따르는 성질이 완전히 사라질까? 결론적으로, 약간의 변경만으로도 카이제곱 분포의 성질은 유지된다. 모평균 $\mu $를 표본평균 $\overline{x} $로 대체하여 $W= (\frac{ x_{1}- \overline{x} }{ \sigma } )^{2} +(\frac{ x_{2}- \overline{x} }{ \sigma } )^..

이번 포스팅에서는 정규모집단이라는 것을 알고 있으며, 모평균도 알고 있을 때 모분산을 추정하는 방법에 대해 알아보고자 한다. 1. 카이제곱분포의 95% 예언적중구간 앞선 포스팅에서 카이제곱분포에 대해 설명했다. 이 분포를 활용하면 '95% 신뢰 구간'을 통해 예측할 수 있다는 점이 유용하며, 카이제곱 분포의 95% 예측 적중 구간은 자유도에 따라 달라진다. 예를 들어, 표준 정규 분포에서 3개의 데이터를 관측하고 이를 제곱한 후 모두 더한 통계량을 $V$라고 하면, $V$는 자유도 3인 카이제곱 분포를 따른다. 아래 도표에 따르면, $V \geq 0.22$일 때의 상대도수는 97.5%이고, $V \geq 9.35$일 때는 2.5%이다. 따라서 $0.22 \leq V 9.35의 값은 범위에 포함되지 않..

1. 표본분산 앞선 포스팅에서 '표본평균을 통해 정규 모집단의 모평균을 구간 추정할 수 있다'라는 점을 확인하며, 표본평균이 모평균을 반영한다고 할 수 있었다. 그렇다면, 정규 모집단에서 관측된 n개의 데이터로 계산한 표준편차는 모표준편차를 반영하는 것일까? 결론적으로, 표본분산 역시 모분산을 반영하는 분포를 따르지만, 이는 정규분포가 아니다. 그 이유는 표본분산이 편차의 제곱을 합한 값이기 때문에, 결코 음수가 될 수 없기 때문이다. (s^{2} = \frac{(편차1)^{2}+(편차2)^{2}+ \ldots +(편차n)^{2}}{n}) 따라서, 정규 모집단에서 계산된 표본분산은 정규분포를 따르지 않는다고 볼 수 있다. 2. 카이제곱분포란? 표본분산의 식에서 '제곱의 합'에 주목해 보자. 특히, ..
이번 포스팅에서는 정규모집단이라는 것을 알고 있으며, 모분산도 알고 있을 때 모평균을 추정하는 방법에 대해 알아보고자 한다. 1. 표본평균을 이용한 모평균의 구간추정 위 가정에 따라, 모집단이 정규분포를 따르고 있으며, 모표준편차 $\sigma$도 알고 있다고 가정한다. 이 모집단에서 n개의 데이터를 관측하여 표본평균 $\bar{x}$를 계산하는 과정을 반복하면, $\bar{x}$의 분포는 평균이 모평균 $\mu$와 같고, 표준편차는 $\frac{ \sigma }{ \sqrt{n}} $이 된다. 이때, 표본평균 $\bar{x}$의 범위를 예측하기 위해, 관측하기 전에 표본평균이 평균에서 표준편차의 1.96배 이하로 떨어져 있을 확률을 고려할 수 있다. 따라서 $-1.96 \leq \frac{ \over..

1. Machine Learning 머신러닝(Machine Learning)은 컴퓨터가 데이터를 분석하고 패턴을 학습하여 특정 작업을 수행할 수 있도록 만드는 인공지능의 한 분야입니다. 이는 명시적으로 프로그래밍하지 않아도, 컴퓨터가 데이터에서 패턴을 발견하고 학습을 통해 스스로 결정을 내릴 수 있게 합니다. AI 개발자들은 데이터로부터 인간 수준의 간단한 지능을 구현하기 위해, 데이터를 분석하고 정답(Label)을 제공한 뒤, 그 결과와 인간의 판단 사이의 차이를 줄여가는 방식으로 학습을 진행했습니다. 이 과정을 반복함으로써 컴퓨터는 점차 인간의 사고방식과 유사하게 문제를 해결하게 되며, 이를 '학습(Training)'이라 부르고 이렇게 학습된 지능을 실제 응용에 적용하는 것이 바로 머신러닝입니다. ..

1. 금융상품의 우열을 가리는 방법 평균 수익률이 높은 운용은 일반적으로 표준편차도 큰 편이다.즉, 하이 리스크, 하이 리턴 또는 로우 리스크, 로우 리턴이 한 쌍을 이루는 경향이 있다.이 두 조합 중 어느 쪽이 더 우수하거나 열등하다고 말하기는 어렵다.이는 단순히 투자자의 선호에 따른 문제일 뿐, 이러한 상품들의 상품성은 본질적으로 동일하다고 볼 수 있다. 같은 직선 위에 있는 금융상품들은 상품성 면에서 우열을 논할 수 없다.그러나 포트폴리오 A와 같이 상위에 있는 금융상품은 직선 아래의 다른 금융상품들보다 더 우수하며, 반대로 포트폴리오 C와 같이 하위에 있는 금융상품은 상대적으로 열등하다고 볼 수 있다. 2. 금융상품의 우열을 가리는 수치, 샤프지수 샤프지수는 투자 성과를 측정할 때 표준편차를 고..