10.6 단일집단의 모분산 $\sigma^{2}$에 대한 검정($\chi^{2}$ 검정)

   단일정규모집단의 모분산 $\sigma^{2}$에 대한 검정은 모분산 $\sigma^{2}$이 어떤 특정 값 $\sigma_{0}^{2}$과 같은가에 대한 검정이라 할 수 있다. 예를 들면 시중에 판매되는 저울은 동일한 무게의 추를 반복해서 측정할 때 발생되는 오차의 허용한계가 정해져 있다고 하자. 시중에 판매되는 저울이 합격품이 되기 위해서는 반복측정의 분산이 특정 값 $\sigma_{0}^{2}$보다 작아야 된다고 할 때, 반복측정의 결과에 의해 $\sigma_{2} = \sigma_{)}^{2}$에 대한 $\sigma^{2} < \sigma_{0}^{2}$의 검정을 실시할 수 있다. 이와 같은 단일집단의 모분산에 대한 검정에 있어서 검정통계량은 표본분산 $S^{2}$을 이용한다.


   1. 가설의 설정

      (a) 양측검정 : $H_{0} : \sigma^{2} = \sigma_{0}^{2}$, H_{1} : \sigma^{2} \neq \sigma_{0}^{2}$

      (b) 단측검정 : $H_{0} : \sigma^{2} = \sigma_{0}^{2}$, H_{1} : \sigma^{2} > \sigma_{0}^{2} (또는 \sigma^{2} < \sigma_{0}^{2})  $


   2. 검정통계량과 분포

      $T(X) = \frac{(n-1)S^{2}}{\sigma^{2}}$         $T(X) \sim \chi_{(n-1)}^{2}$

   3. 검정 $\chi_{(n-1)}^{2}$에서 검정의 종류(단측검정 또는 양측검정)와 유의수준 $\alpha$에 따라 기각역을 설정하고, $T(X)$ 기각역에 속하면 귀무가설을 기각한다.



그동안 아프고 바빠서 정리를 못했는데....다시 시작하도록 한다.


10.5 모비율 $P$에 대한 검정


   모집단의 특싱어 비율 $P$인 경우 이 비율에 대한 검정을 실시할 수 있다. 예를 들면 "광역의회 선거에서 투표율이 50% 이상이 될 것인가?" 또는 "가족법 개정안에 대해 남자와 여자의 찬성 비율이 동일한가?" 등 많은 경우에 있어서 모집단의 비율에 대한 검정을 생각할 수 있다. 이와 같이 모비율 $P$에 대한 검정에서 기본적으로 전제가 되는 확률분포는 이항분포이며, 검정의 과정은 모평균 $\mu$에 대한 검정과 동일하다.


10.5.1 단일모비율 $P$에 대한 검정

  

  하나의 모집단에서 모비율 $P$가 특정 값과 같은가에 대한 검정은 단일 모평균 $\mu$에 대한 검정과정과 동일하다고 할 수 있다. 차이점은 단일모평균 $\mu$에 대한 검정은 모분산 $\sigma^{2}$을 모를 때 표본의 크기 $n$에 의해 표준정규분포 $N(0,1)$ 또는 자유도가 $n-1$인 $t$분포를 이용해 검정한느데 비해 모비율 $P$에 대한 검정은 표본의 크기 $n$에 관계없이 항상 표준정규분포를 이용해 검정을 실시한다.

 

 단일 모집단의 특성의 비율 $P$에 대한 검정에서 $n$개의 표본을 관찰한 결과 모집단의 특성을 만족하는 경우가 $X$개라 할 때 모비율 $P$가 특정 값 $P_{0}$과 같은가에 대한 검정과정은 다음과 같다.


   1. 가설의 설정

      (a) 양측검정 : $H_{0} : P=P_{0},  H_{1} : P \neq P_{0}$

      (b) 단측검정 : $H_{0} : P=P_{0},  H_{1} : P > P_{0}(또는  P < P_{0}$


   2. 귀무가설 하에서의 검정통계량의 값과 분포

      $\hat{P} \ = \ \frac{X}{n}$ 라 할 때 귀무가설 하에서 검정통계량의 값은

      $T(X) = \frac{ \hat{P}-P_{0}} {\sqrt { \frac{P_{0}(1-P_{0})}{n} } } $

      이고, $T(X)$는 근사적으로 표준정규분포 $N(0,1)$을 따른다.

  

   3. 검정

      검정의 종류(단측검정 또는 양측검정)와 유의수준 $\alpha$에 따라 기각역을 구하고, $T(X)$가 기각역에 속하면 $H_{0}$를 기각하고 기각역에 속하지 않으면 $H_{0}$를 채택한다.


10.5.2 두 모비율의 동일성에 대한 검정


   1. 가설의 설정

      (a) 양측검정 : $H_{0} : P_{1}=P_{2},  H_{1} : P_{1} \neq P_{2}$

      (b) 단측검정 : $H_{0} : P_{1}=P_{2},  H_{1} : P_{1} > P_{2}(또는  P_{1} < P_{2})$


   2. 검정통계량과 분포

      $\hat{P_{1}} = \frac{X_{1}}{n_{1}}$, $\hat{P_{2}} = \frac{X_{2}}{n_{2}}$,  $\hat{P} = \frac{X_{1}+X_{2}}{n_{1}+n_{2}}$

      라 할 때 귀무가설 하에서의 검정통계량의 값 T(X)는

      $T(X) = \frac{ \hat{P_{1}} - \hat{P_{2}} }{ \sqrt { \hat{P}( 1-\hat{P} )( \frac{1}{n_{1}}+\frac{1}{n_{2}} )  } }$

      이고, $T(X) \sim N(0,1)$이다.


   3. 검정

      검정의 종류(단측검정 또는 양측검정)와 유의수준 $\alpha$에 따라 $N(0,1)$에서 기각역을 구하고, $T(X)$가 기각역에 속하면 $H_{0}$를 기각하고 기각역에 속하지 않으면 $H_{0}$를 채택한다.


10.4 짝진표본의 모평균에 대한 검정


   $n$개의 쌍 $(x_{1}, y_{1}), (x_{2}, y_{2}), \cdots, (x_{n}, y_{n})$으로 관측된 표본에서 $d_{i} = x_{i} -y_{i}, \ i = 1, 2, \cdots, n$이라 할 때 두 집단 평균 $\mu_{X}, \mu_{Y}$의 동일성에 대한 검정은 $\mu_{D} = \mu_{X} -\mu_{Y}$이므로 다음과 같이 실시한다.


1. 가설의 설정 

(a) 양측검정 : $H_{0} : \mu_{D} = 0, \ H_{1} : \mu_{D} \neq 0$

(b) 단측검정 : $H_{0} : \mu_{D} = 0, \ H_{1} : \mu_{D} > 0(또는 \mu_{D} < 0)$


2. 검정통계량과 분포


$\overline d = \frac{1}{n}\sum_{i=1}^{n}d_{i}$

$S_{d}^{2} = \frac{1}{n-1}\sum_{i=1}^{n}(d_{i} -\overline d)^{2}$


이라고 할 때, 귀무가설 하에서 검정통계량의 값은


$T(X) = \frac{\overline d}{S_{d}/\sqrt{n}}$

이고, $T(X)의 분포는

$T(X) \sim N(0,1), \ n > 30 인 경우,$

$T(X) \sim t_{n-1}, \ n \leq 30 인 경우$

이다.


3. 검정

검정통계량 $T(X)$의 분포에서 가설의 종류(단측검정 또는 양측검정)와 유의수준 $\alpha$에 의해 기각역을 설정한다. 귀무가설 하에서의 검정통계량의 값 $T(X)$가 기각역에 속하면 귀무가설을 기각하고, 기각역에 속하지 않으면 귀무가설을 채택한다.


10.3 두집단 모평균의 동일성에 대한 검정($t$ 검정)


자료분석에 있어서 '남학생과 여학생의 학력고사 성적이 동일한가에 대한 비교' 라든가 '서로 다른 두 회사에서 생산된 형광등의 평균수명 비교' 등 두 집단의 모평균의 동일성에 대한 검정을 실시하는 경우가 있다. 이러한 검정에 있어서의 전제조건은 '두 집단이 서로 독립이며, 두 집단 모두 정규분포를 따른다'는 ㄳ이다.


   일반적으로 두 집단이 서로 독립이며 각 집단의 평균과 분산이 각각 $(\mu_{1}, \sigma_{1}^{2})$과 $(\mu_{2}, \sigma_{2}^{2})$인 정규분포를 따를 때, 두 모평균의 동일성 $(\mu_{1}, \mu_{2})$에 대한 검정은 각 집단에서 '랜덤하게' $n_{1}$과 $n_{2}$개의 표본을 추출해 실시한다. 

   즉, 각 집단에서 '랜덤하게' $n_{1}$과 $n_{2}$개의 표본을 추출했을 때 각 표본의 평균과 분산을 각각 $(\overline X_{1}, S_{1}^{2})$과 $(\overline X_{2}, S_{2}^{2})$으로 표현하면 두 집단의 모수와 통계량은 다음과 같다.


 

 모수

표본의 크기 

통계량 

 

모평균 

모분산

 표본평균

표본분산 

 집단 1

$\mu_{1}$ 

$\sigma_{1}^{2}$ 

 $n_{1}$

$\overline X_{1}$ 

 $S_{1}^{2}$

집단 2

$\mu_{2}$  

$\sigma_{2}^{2}$ 

  $n_{2}$

 $\overline X_{2}$ 

  $S_{2}^{2}$



두 집단의 모평균의 동일성에 대한 검정


1. 가설의 설정 

(a) 양측검정 : $H_{0} : \mu_{1} = \mu_{2}, \ H_{1} : \mu_{1} \neq \mu_{2}$

(b) 단측검정 : $H_{0} : \mu_{1} = \mu_{2}, \ H_{1} : \mu_{1} > \mu_{2}(또는 \mu_{1} < \mu_{2})$


2. 귀무가설 하에서의 검정통계량의 값과 분포


(a) $\sigma_{1}$과 $\sigma_{2}$가 알려져 있는 경우


    $T(X) = \frac{\overline X_{1} - \overline X_{2}}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}} \sim N(0,1)$


(b) $\sigma_{1}$과 $\sigma_{2}$가 알려져 있지 않는 경우

(i) $\sigma_{1} = \sigma_{2}$인 경우


    $T(X) = \frac{\overline X_{1} - \overline X_{2}}{S_{p}\sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}}$, $S_{p} =$ $\sqrt{\frac{(n_{1}-1)S_{1}^{2} + (n_{2}-1)S_{2}^{2}}{n_{1}+n_{2}-2}}$


$T(X) \sim N(0,1), \ \ n_{1}+n_{2} > 30$인 경우

$T(X) \sim t_{n_{1}+n_{2}-2}, \ \ n_{1}+n_{2} \leq 30$인 경우



(ii) $\sigma_{1} \neq \sigma_{2}$인 경우

$T(X) = \frac{\overline X_{1} - \overline X_{2}}{\sqrt{\frac{S_{1}^{2}}{n_{1}}+\frac{S_{2}^{2}}{n_{2}}}}$

이며, $T(X)$의 분포는 $n_{1}+n_{2} >30$일 때 $T(X) \sim N(0,1)$이다.


+ Recent posts