본문 바로가기

AI/Machine Learning

[Practical Time Series Analysis (실전 시계열 분석)] Chapter 06 시계열의 통계 모델

728x90

Chapter06 시계열의 통계 모델

 

들어가며

  • 6장에서 다루게 될 모델
    • 자기회귀(AR) 모델, 이동평균(MA) 모델, 자기회귀누적이동평균(ARIMA) 모델
    • 벡터자기회귀(VAR)
    • 계층형 모델

 


 

6.1 선형회귀를 사용하지 않는 이유

  • 선형회귀 분석은 독립 항등 분호 데이터가 있다는 것을 가정한다.
  • 하지만 시계열 데이터는 해당되지 않는다.

 


 

6.2 시계열을 위해 개발된 통계 모델

 

6.2.1 자기회귀 모델

  • 자기회귀(AR) 모델은 과거가 미래를 예측한다는 직관적인 사실에 의존한다.

 

6.2.2 이동평균 모델

  • 이동평균 (MA) 모델은 각 시점의 데이터가 푀근의 과거 값에 대한 '오차' 항으로 구성된 함수로 표현된 과정에 의존한다.
  • 이때 각 오차항은 서로 독립적이다.

 

6.2.3 자기회귀누적이동평균 모델

  • 시계열이 AR 및 MA 모델의 역동성을 모두 동시에 표괄하는 자기회귀누적이동평균(ARIMA) 모델
  • 추세의 제거 및 시계열을 정상화하는 차분까지 고려하는 확장된 ARIMA 모델

 

6.2.4 벡터자기회귀

  • 여러 변수에 대한 AR 모델을 생성할 수 있다.
  • 이러한 보델은 변수들에게 서로 영향을 주고 받는 상황을 제공한다.

 

6.2.5 통계 모델의 변형

  • 계절성 ARIMA
  • ARCH, GARCH 및 그 외의 유사 종류
  • 계층적 시계열 모델

 


 

6.3 시계열 통계 모델의 장단점

  • 장점
    • 통계 모델은 간단하고 투명해서 모델의 파라미터 측면을 보면 명확하게 이해할 수 있다.
    • 통계 모델을 정의하는 간단한 수학적 표현 덕분에 철저히 통계적인 방식으로 관심 속성을 도출하는 것이 가능하다.
    • 어느 정도 작은 데이터셋에 적용해도 여전히 좋은 결과를 얻을 수 있다.
    • 다뤄진 간단한 통계 모델 및 이를 변형된 모델은 상당히 좋은 성능을 보이며, 매우 복잡한 머신러닝 모델과 비교해도 손색이 없다. 따라서 과적합이라는 위험성 없이도 좋은 성능을 얻을 수 있다.
    • 모델의 차수 선택 및 파라미터 추정에 대해 잘 개발된 자동화 방법론은 예측을 간단하게 만든다.
  • 단점
    • 통계 모델은 매우 간단해서 데이터셋이 커지더라도 항상 성능 향상을 보장하지 않는다. 대규모 데이터셋으로 작업한다면 복잡한 머신러닝 모델 및 신경망 방법을 사용하는 것이 더 좋다.
    • 통계모델은 분포보다는 분포의 평균값 추정에 집중한다.
    • 정의에 따르면, 통계 모델은 비선혀적 행동을 다루기 위해 구축된 것이 아니라서 비선형 관계가 많은 데이터를 설명하는 데 적합하지 않다.

 


 

위 내용은 경희대학교 교내 동아리 KHUDA 에서 공부한 내용을 바탕으로 작성했습니다. 😜

공부한 책은 아래의 링크를 참고해주세요 !

https://link.coupang.com/re/CSHARESDP?lptag=CFM99774036&pageKey=5237489681&itemId=7390665092&vendorItemId=74681873862

 

실전 시계열 분석:통계와 머신러닝을 활용한 예측 기법

COUPANG

www.coupang.com