확률과 통계 내가 직접 만들어 보는 확률과 통계

표본평균 표본평균의 분포

어떤 모집단에서 조사하고자 하는 특성을 나타내는 확률변수를 $X$라 할 때, $X$의 확률분포를 모집단의 분포라고 한다. 이때, 확률변수 $X$의 평균,분산,표준편차를 각각 모평균, 모분산, 모표준편차라 하고, 이를 각각 기호 $$ m, \sigma^2 ,\sigma$$ 로 나타낸다.

한편, 모집단에서 임의추출한 크기 $n$인 표본을 $X_1 ,X_2, \cdots , X_n$이라고 할 때, 표본평균,표본분산,표본표준편차를 각각 기호 $$ \color{red}{\overline{X} ,S^2 ,S} $$ 로 나타내고, 다음과 같이 정의한다. $$\begin{align*} \overline{X} &=\frac{X_1 +X_2 + \cdots + X_n}{n} = \frac{1}{n} \sum_{i=1}^{n} X_i \\ S^2 &= \frac{(X_1 - \overline{X})^2 + (X_2 - \overline{X})^2 + \cdots (X_n - \overline{X})^2}{n-1} = \frac{1}{n-1} \sum_{i=1}^{n} (X_i - \overline{X})^2\\ S&= \sqrt{S^2} \end{align*}$$

표본평균은 임의추출한 표본의 관측값에 따라 다른 값을 가지므로 확률변수이다.
일반적으로 어떤 모집단에서 복원 추출한 크기 $n$인 표본을 $X_1, X_2, \cdots , X_n$이라고 할 때, 이들의 확률분포는 모집단의 분포와 같으므로 $$ E(X_i ) =m, V(X_i )= \sigma^2 ~ (i=1,2, \cdots , n)$$ 이다.

이때, 매 시행은 독립이므로 표본평균 $\overline{X}$의 평균과 분산은 각각 $$\begin{align*} E(\overline{X})&= E \left( \frac{1}{n} \sum_{i=1}^{n} X_i \right ) =\frac{1}{n} \sum_{i=1}^{n} E(X_i)=m\\ V(\overline{X})&= V \left( \frac{1}{n} \sum_{i=1}^{n} X_i \right) =\frac{1}{n} \sum_{i=1}^{n} V(X_i)= \frac{\sigma ^2}{n} \end{align*}$$ 이다.

표본평균의 분포

평균이 $m$이고 분산이 $\sigma^2$인 모집단에서 크기 $n$인 임의표본을 복원 추출할 때, 표본평균$\overline{X}$에 대하여 다음이 성립한다.
  1. $E(\overline{X})=m, ~ V(\overline{X})=\frac{\sigma^2}{n},~ \sigma(\overline{X})=\frac{\sigma}{\sqrt n}$
  2. 모집단의 분포가 정규분포 $N(m,\sigma^2)$이면 $ \overline{X}$는 정규분포 $N(m, \frac{\sigma^2}{n})$을 따른다.
  3. 표본의 크기 $n$이 충분히 크면 모집단의 분포에 관계없이 $\overline{X}$의 분포는 근사적으로 정규분포 $N(m, \frac{\sigma^2}{n})$을 따른다.
고등학교 확률과 통계 p.176 (천재교육, 이준열외 9인)

문제풀어보기

모평균이 30이고 모표준편차가 9인 정규분포를 따르는 모집단에서 크기 36인 표본을 추출할때, 표본평균 $\overline{X}$의 확률분포에 대하여 설명하여라.

풀이(Click)

표본평균 $\overline{X}$의 평균과 표준편차는 각각 $$ E(\overline{X})=30,~ \sigma(\overline{X})= \frac{9}{\sqrt{36}} =1.5$$ 이다. 따라서 표본평균 $\overline{X}$는 정규분포 $N(30,1.5^2)$을 따른다.

정답 $\overline{X}$ ~ $N(30,1.5^2)$

고등학교 확률과 통계 p.176 (천재교육, 이준열외 9인)

실험해보기

$\overline{X}$ 의 분포의 실험값이 실제값과 비슷한지 실험해보자.$X$가 주사위를 한번 던질 때 나오는 눈의 확률분포라 하고 다음을 실험해보자.
  1. 주사위 $n$개를 던졌을 때 나오는 눈의 수의 평균을 $\overline{X}$라 할 때, $\overline{X}$의 확률분포의 평균과 분산에 대한 이론값을 구해보자.
  2. 이제 위에서 구한 이론값을 실제값과 비교하기 위하여 다음 파일을 열어 실험해보자. 실험파일(Click)
  3. 주사위 $n$개를 여러번 던지는 실험을 통해 이 평균의 분포를 관찰해보고 위에서 이론 값과 비교해보자.