본문 바로가기
정보

시계열 분석

by Sunnyspotho 2024. 9. 27.

- 시계열 자료

시간의 흐름에 따라 관찰된 값들을 시계열 자료라 하며 시계열 데이터 분석을 통해 미래의 값을 예측하고 경향, 주기, 계절성 등을 파악하여 활용한다.

시계열 자료의 종류에는 두 가지가 있다. 먼저 비정상성 시계열 자료. 시계열 분석을 실시할 때 다루기 어려운 자료로 대부분의 시계열 자료가 비정상성 시계열 자료이다. 다음으로 정상성 시계열 자료는 비정상성 시계열을 핸들링해 다루기 쉬운 시계열 자료로 변환한 것이다.

- 정상성

먼저 평균이 일정할 경우, 모든 시점에 대해 일정한 평균을 가진다. 또한 평균이 일정하지 않은 시계열은 '차분'을 통해 정상화할 수 있다.  
분산이 일정할 경우, 분산 역시 평균처럼 모든 시점에 대해 일정한 평균을 가진다. 또한 분산이 일정하지 않을 경우 변환을 통해 정상화할 수 있다.  공분산도 시차에만 의존하고 시점에는 의존하지 않는다.

즉, 정상성은 평균이 일정할 때, 분산이 일정할 때, 공분산도 시차에만 의존하고 실제 특정 시점 t, 에는 의존하지 않을 때 만족한다.

 

여기서 차분이란?  현시점 자료에서 전 시점 자료를 빼는 것이다.
• 일반 차분(Regular Difference) 바로 전 시점의 자료를 빼는 방법이다 
• 계절 차분 (Seasonal Difference) 여러 시점 전의 자료를 빼는 방법이며 주로 계절성을 갖는 자료를 정상화하는 데 사용한다.

 

평균이 일정하지 않은 경우 원계열에 차분을 하며 분산이 일정하지 않을 경우 원계열에 로그변환을 한다.

 

그렇다면 정상 시계열이 가지는 특징은?

어떤 시점에서 평균과 분산 그리고 특정한 시차의 길이를 갖는 자기 공분산을 측정하더라도 통일한 값을 갖는다. 
항상 그 평균값으로 회귀하려는 경향이 있으며 그 평균값 주변에서의 변동은 대체로 일정한 폭을 갖는다. 정상 시계열이 아닌 경우 특정 기간의 시계열 자료로부터 얻은 정보를 다른 시기로 일반화할 수 없다. 

 

-시계열자료 분석방법

대표적으로 회귀분석 (계량경제) 방법,  Box-J enkins 방법, 지수평활법, 시계열 분해법 등이 있다. 

수학적 이론 모형에는 회귀분석 (계량경제) 방법,  Box-J enkins 방법 

직관적 방법에는 지수평활법, 시계열 분해법

장기 예측에는 회귀분석방법 활용, 단기 예측에는 Box-J enkins 방법, 지수평활법, 시계열 분해법을 주로 사용한다.

 

-시계열 모형

시계열의 모형은 자기 회귀 모형 (AR 모형), 이동평균 모형 (MA 모형), 자기회귀누적이동평균 모형 (ARIMA 모형) 세가지가 있다.

 

먼저 자기회귀 모형 (AR 모형)이 있다. p 시점 전의 자료가 현재 자료에 영향을 주는 모형이다. 즉 현시점의 모형이 과거와 관련성을 가진다. 여기서 수식 마지막에 더하는 것은 백색잡음 과정으로 여기선 오 차 항이라고 볼 수 있다.

그럼 백색잡음은 무엇일까?

 

'백색잡음'은 시계열 자료 중 자기 상관이 전혀 없는 특별한 경우 또는 시계열의 평균이 0, 분산이 일정한 값, 자기 공분산이 0인 경우 또는 현재 값이 미래 예측에 도움이 되지 않는 회귀분석의 오차항을 의미한다.

 

다음으로 이동평균 모형이 있다. 이는 유한한 개수의 백색 잡음의 결합이므로 언제나 정상성을 만족한다. 특히 1차 이동평균모형은 이동평균모형 중 가장 간단한 모형으로 시계열이 같은 시점의 백색잡음과 바로 전 시점의 백색잡음의 결합으로 이루어졌다. 2차 이동평균모형은 바로 전 시점의 백색잡음과 시차가 2인 백색잡음의 결합으로 이뤄진 모형이다.

 

*참고

자기 회귀(AR), 자기 상관함수: 지수적 감소, 0에 접근

이동평균(MA), 자기상관함수: q+1차 항부터 절단모양

자기 회귀(AR), 부분 자기 상관함수: p+1 차항부터 절단모양

이동평균(MA), 부분자기상관함수: 지수적 감소, 0에 접근

 

또한 분해시계열이 있다. 분해시계열은 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법으로 주로 회귀분석적인 방법에서 이용한다.

 

분해시계열에서 쓰는 용어들을 알아보자.

 

경향(추세) 요인: 자료가 오르거나 내리는 추세, 선형, 이차식 형태, 지수적 형태 등

계절요인: 요일, 월, 사계절 각 분기에 의한 변화 등 고정된 주기에 따라 자료가 변하는 경우

순환요인: 경제적이나 자연적인 이유 없이 알려지지 않은 주기를 가지고 변화하는 자료

불규칙요인: 위의 세 가지 요인으로 설명할 수 없는 오차에 해당하는 요인