728x90
Chapter06 시계열의 통계 모델
들어가며
- 6장에서 다루게 될 모델
- 자기회귀(AR) 모델, 이동평균(MA) 모델, 자기회귀누적이동평균(ARIMA) 모델
- 벡터자기회귀(VAR)
- 계층형 모델
6.1 선형회귀를 사용하지 않는 이유
- 선형회귀 분석은 독립 항등 분호 데이터가 있다는 것을 가정한다.
- 하지만 시계열 데이터는 해당되지 않는다.
6.2 시계열을 위해 개발된 통계 모델
6.2.1 자기회귀 모델
- 자기회귀(AR) 모델은 과거가 미래를 예측한다는 직관적인 사실에 의존한다.
6.2.2 이동평균 모델
- 이동평균 (MA) 모델은 각 시점의 데이터가 푀근의 과거 값에 대한 '오차' 항으로 구성된 함수로 표현된 과정에 의존한다.
- 이때 각 오차항은 서로 독립적이다.
6.2.3 자기회귀누적이동평균 모델
- 시계열이 AR 및 MA 모델의 역동성을 모두 동시에 표괄하는 자기회귀누적이동평균(ARIMA) 모델
- 추세의 제거 및 시계열을 정상화하는 차분까지 고려하는 확장된 ARIMA 모델
6.2.4 벡터자기회귀
- 여러 변수에 대한 AR 모델을 생성할 수 있다.
- 이러한 보델은 변수들에게 서로 영향을 주고 받는 상황을 제공한다.
6.2.5 통계 모델의 변형
- 계절성 ARIMA
- ARCH, GARCH 및 그 외의 유사 종류
- 계층적 시계열 모델
6.3 시계열 통계 모델의 장단점
- 장점
- 통계 모델은 간단하고 투명해서 모델의 파라미터 측면을 보면 명확하게 이해할 수 있다.
- 통계 모델을 정의하는 간단한 수학적 표현 덕분에 철저히 통계적인 방식으로 관심 속성을 도출하는 것이 가능하다.
- 어느 정도 작은 데이터셋에 적용해도 여전히 좋은 결과를 얻을 수 있다.
- 다뤄진 간단한 통계 모델 및 이를 변형된 모델은 상당히 좋은 성능을 보이며, 매우 복잡한 머신러닝 모델과 비교해도 손색이 없다. 따라서 과적합이라는 위험성 없이도 좋은 성능을 얻을 수 있다.
- 모델의 차수 선택 및 파라미터 추정에 대해 잘 개발된 자동화 방법론은 예측을 간단하게 만든다.
- 단점
- 통계 모델은 매우 간단해서 데이터셋이 커지더라도 항상 성능 향상을 보장하지 않는다. 대규모 데이터셋으로 작업한다면 복잡한 머신러닝 모델 및 신경망 방법을 사용하는 것이 더 좋다.
- 통계모델은 분포보다는 분포의 평균값 추정에 집중한다.
- 정의에 따르면, 통계 모델은 비선혀적 행동을 다루기 위해 구축된 것이 아니라서 비선형 관계가 많은 데이터를 설명하는 데 적합하지 않다.
위 내용은 경희대학교 교내 동아리 KHUDA 에서 공부한 내용을 바탕으로 작성했습니다. 😜
공부한 책은 아래의 링크를 참고해주세요 !
'AI > Machine Learning' 카테고리의 다른 글
FM (Factorization Machine) (0) | 2023.03.05 |
---|---|
MF (Matrix Factorization) with SGD (0) | 2023.03.05 |
[Practical Time Series Analysis (실전 시계열 분석)] Chapter 05 시간 데이터 저장 (0) | 2022.03.23 |
[Practical Time Series Analysis (실전 시계열 분석)] Chapter 04 시계열 데이터의 시뮬레이션 (0) | 2022.03.22 |
[Practical Time Series Analysis (실전 시계열 분석)] Chapter 03 시계열의 탐색적 자료 분석 (0) | 2022.03.20 |