최근 대학원 스터디에서 시계열분석에 대한 주제로 발표를 하게 되었다.

워낙 통계를 싫어하는 터라 부정적인 입장을 갖고 바라보곤 했는데...

일단 발표를 해야하니 공부를 했다.

처음에는 무슨말인지 하나도 모르겠었는데...

보다보니 또 무슨말인지 이해가 되는...ㅋㅋㅋㅋㅋ

시계열분석 책

구글에서 여타 다른 책들을 많이 찾아봤지만, 전공이 수학이라 그런지

수학적인 수식과 설명이 잘 되어있지 않은 책은 별로 눈에 잘 가지 않는다...

그나마 이 책이 눈에 잘 들어오는데(저자 이름이 더 눈에 띈다...더글라스 C. 몽고메리...그래서 선택했을수도...)

 

 

 

 

첫번째 책 이외에 주로 내가 보는 통계학 책이다.(이곳에 이렇게 올려도 저작권 침해는 안받겠지....?)

(가냘픈 대학원생을 용서해주세요 대가님들과 출판업계분들...)

암튼 책소개하려는건 아니고...(이미 다 소개했지만)

앞으로 올리는 글에 이 책의 내용들이 포함될 소지가 있어 사전에 미리 알리기 위해 직접 책을 스샷찍어서 올린다.

(부디 많이 많이 팔려 저 말고 출판업계 돈 많이 벌고 저자들도 돈 많이벌게 해주세요...저말고...저말고...)

 

암튼 기초통계는 대략 생략하고

시계열분석의 코드와 개념 위주로 글을 쓸 예정이니....

잘 정리해놓고 기억안날때 마다 자주 들어와서 좀 보고 복기해라...쓰니야...

 

Source

 

 

'수학 > Time Series Analysis' 카테고리의 다른 글

Chapter1 : 1.2 Some Time Series Data  (0) 2018.01.23

10.6 단일집단의 모분산 $\sigma^{2}$에 대한 검정($\chi^{2}$ 검정)

   단일정규모집단의 모분산 $\sigma^{2}$에 대한 검정은 모분산 $\sigma^{2}$이 어떤 특정 값 $\sigma_{0}^{2}$과 같은가에 대한 검정이라 할 수 있다. 예를 들면 시중에 판매되는 저울은 동일한 무게의 추를 반복해서 측정할 때 발생되는 오차의 허용한계가 정해져 있다고 하자. 시중에 판매되는 저울이 합격품이 되기 위해서는 반복측정의 분산이 특정 값 $\sigma_{0}^{2}$보다 작아야 된다고 할 때, 반복측정의 결과에 의해 $\sigma_{2} = \sigma_{)}^{2}$에 대한 $\sigma^{2} < \sigma_{0}^{2}$의 검정을 실시할 수 있다. 이와 같은 단일집단의 모분산에 대한 검정에 있어서 검정통계량은 표본분산 $S^{2}$을 이용한다.


   1. 가설의 설정

      (a) 양측검정 : $H_{0} : \sigma^{2} = \sigma_{0}^{2}$, H_{1} : \sigma^{2} \neq \sigma_{0}^{2}$

      (b) 단측검정 : $H_{0} : \sigma^{2} = \sigma_{0}^{2}$, H_{1} : \sigma^{2} > \sigma_{0}^{2} (또는 \sigma^{2} < \sigma_{0}^{2})  $


   2. 검정통계량과 분포

      $T(X) = \frac{(n-1)S^{2}}{\sigma^{2}}$         $T(X) \sim \chi_{(n-1)}^{2}$

   3. 검정 $\chi_{(n-1)}^{2}$에서 검정의 종류(단측검정 또는 양측검정)와 유의수준 $\alpha$에 따라 기각역을 설정하고, $T(X)$ 기각역에 속하면 귀무가설을 기각한다.



그동안 아프고 바빠서 정리를 못했는데....다시 시작하도록 한다.


10.5 모비율 $P$에 대한 검정


   모집단의 특싱어 비율 $P$인 경우 이 비율에 대한 검정을 실시할 수 있다. 예를 들면 "광역의회 선거에서 투표율이 50% 이상이 될 것인가?" 또는 "가족법 개정안에 대해 남자와 여자의 찬성 비율이 동일한가?" 등 많은 경우에 있어서 모집단의 비율에 대한 검정을 생각할 수 있다. 이와 같이 모비율 $P$에 대한 검정에서 기본적으로 전제가 되는 확률분포는 이항분포이며, 검정의 과정은 모평균 $\mu$에 대한 검정과 동일하다.


10.5.1 단일모비율 $P$에 대한 검정

  

  하나의 모집단에서 모비율 $P$가 특정 값과 같은가에 대한 검정은 단일 모평균 $\mu$에 대한 검정과정과 동일하다고 할 수 있다. 차이점은 단일모평균 $\mu$에 대한 검정은 모분산 $\sigma^{2}$을 모를 때 표본의 크기 $n$에 의해 표준정규분포 $N(0,1)$ 또는 자유도가 $n-1$인 $t$분포를 이용해 검정한느데 비해 모비율 $P$에 대한 검정은 표본의 크기 $n$에 관계없이 항상 표준정규분포를 이용해 검정을 실시한다.

 

 단일 모집단의 특성의 비율 $P$에 대한 검정에서 $n$개의 표본을 관찰한 결과 모집단의 특성을 만족하는 경우가 $X$개라 할 때 모비율 $P$가 특정 값 $P_{0}$과 같은가에 대한 검정과정은 다음과 같다.


   1. 가설의 설정

      (a) 양측검정 : $H_{0} : P=P_{0},  H_{1} : P \neq P_{0}$

      (b) 단측검정 : $H_{0} : P=P_{0},  H_{1} : P > P_{0}(또는  P < P_{0}$


   2. 귀무가설 하에서의 검정통계량의 값과 분포

      $\hat{P} \ = \ \frac{X}{n}$ 라 할 때 귀무가설 하에서 검정통계량의 값은

      $T(X) = \frac{ \hat{P}-P_{0}} {\sqrt { \frac{P_{0}(1-P_{0})}{n} } } $

      이고, $T(X)$는 근사적으로 표준정규분포 $N(0,1)$을 따른다.

  

   3. 검정

      검정의 종류(단측검정 또는 양측검정)와 유의수준 $\alpha$에 따라 기각역을 구하고, $T(X)$가 기각역에 속하면 $H_{0}$를 기각하고 기각역에 속하지 않으면 $H_{0}$를 채택한다.


10.5.2 두 모비율의 동일성에 대한 검정


   1. 가설의 설정

      (a) 양측검정 : $H_{0} : P_{1}=P_{2},  H_{1} : P_{1} \neq P_{2}$

      (b) 단측검정 : $H_{0} : P_{1}=P_{2},  H_{1} : P_{1} > P_{2}(또는  P_{1} < P_{2})$


   2. 검정통계량과 분포

      $\hat{P_{1}} = \frac{X_{1}}{n_{1}}$, $\hat{P_{2}} = \frac{X_{2}}{n_{2}}$,  $\hat{P} = \frac{X_{1}+X_{2}}{n_{1}+n_{2}}$

      라 할 때 귀무가설 하에서의 검정통계량의 값 T(X)는

      $T(X) = \frac{ \hat{P_{1}} - \hat{P_{2}} }{ \sqrt { \hat{P}( 1-\hat{P} )( \frac{1}{n_{1}}+\frac{1}{n_{2}} )  } }$

      이고, $T(X) \sim N(0,1)$이다.


   3. 검정

      검정의 종류(단측검정 또는 양측검정)와 유의수준 $\alpha$에 따라 $N(0,1)$에서 기각역을 구하고, $T(X)$가 기각역에 속하면 $H_{0}$를 기각하고 기각역에 속하지 않으면 $H_{0}$를 채택한다.


10.4 짝진표본의 모평균에 대한 검정


   $n$개의 쌍 $(x_{1}, y_{1}), (x_{2}, y_{2}), \cdots, (x_{n}, y_{n})$으로 관측된 표본에서 $d_{i} = x_{i} -y_{i}, \ i = 1, 2, \cdots, n$이라 할 때 두 집단 평균 $\mu_{X}, \mu_{Y}$의 동일성에 대한 검정은 $\mu_{D} = \mu_{X} -\mu_{Y}$이므로 다음과 같이 실시한다.


1. 가설의 설정 

(a) 양측검정 : $H_{0} : \mu_{D} = 0, \ H_{1} : \mu_{D} \neq 0$

(b) 단측검정 : $H_{0} : \mu_{D} = 0, \ H_{1} : \mu_{D} > 0(또는 \mu_{D} < 0)$


2. 검정통계량과 분포


$\overline d = \frac{1}{n}\sum_{i=1}^{n}d_{i}$

$S_{d}^{2} = \frac{1}{n-1}\sum_{i=1}^{n}(d_{i} -\overline d)^{2}$


이라고 할 때, 귀무가설 하에서 검정통계량의 값은


$T(X) = \frac{\overline d}{S_{d}/\sqrt{n}}$

이고, $T(X)의 분포는

$T(X) \sim N(0,1), \ n > 30 인 경우,$

$T(X) \sim t_{n-1}, \ n \leq 30 인 경우$

이다.


3. 검정

검정통계량 $T(X)$의 분포에서 가설의 종류(단측검정 또는 양측검정)와 유의수준 $\alpha$에 의해 기각역을 설정한다. 귀무가설 하에서의 검정통계량의 값 $T(X)$가 기각역에 속하면 귀무가설을 기각하고, 기각역에 속하지 않으면 귀무가설을 채택한다.


+ Recent posts