32. 다음 시계열 분석의 기초가 되는 개념인 정상성(Stationarity)의 특징에 관한 설명이 옳지 않은 것은?
① 평균이 일정하고, 즉 모든 시점에 대한 일정한 평균을 가진다.
② 시계열 분석에서 비정상 시계열 자료는 시계열 분석을 할 수 없다.
③ 분산도 시점에 의존하지 않는다.
④ 공분산은 단지 시차에만 의존하고 실제 어느 시차 t, s에 의존하지 않는다.
정답: 2
출처: [[01 데이터분석준전문가모의고사(ADsP) 1회.pdf]]
**정상성(Stationarity)**은 시계열 분석에서 매우 중요한 개념으로, 시계열 데이터의 통계적 성질이 시간에 따라 변하지 않는다는 특성을 말합니다. 정상성을 가지는 시계열 데이터는 분석과 모델링에 있어 예측 가능성이 높아지며, 많은 시계열 모델은 데이터가 정상성을 가질 때 더 잘 작동합니다.
### 정상성의 특징
1. **평균이 일정**:
- 정상적인 시계열 데이터는 시간에 따라 평균이 변하지 않습니다. 즉, 데이터의 중앙값(평균)이 일정하게 유지됩니다.
E[Xt]=μ(for all t)E[X_t] = \mu \quad \text{(for all t)}E[Xt]=μ(for all t)
여기서 E[Xt]E[X_t]E[Xt]는 시간 ttt에서의 기대값(평균)이고, μ\muμ는 일정한 평균값입니다.
2. **분산이 일정**:
- 데이터의 분산도 시간에 따라 변하지 않습니다. 이는 데이터의 변동 폭이 일정하게 유지된다는 의미입니다.
Var(Xt)=σ2(for all t)\text{Var}(X_t) = \sigma^2 \quad \text{(for all t)}Var(Xt)=σ2(for all t)
여기서 σ2\sigma^2σ2는 일정한 분산값입니다.
3. **자기공분산이 시간 차이에만 의존**:
- 자기공분산(autocovariance)은 두 시점 간의 데이터의 관계를 나타내는 값으로, 이 값이 시간의 흐름과 무관하게 시차(lag)에 대해서만 일정하게 유지됩니다.
Cov(Xt,Xt+h)=γ(h)(for all t)\text{Cov}(X_t, X_{t+h}) = \gamma(h) \quad \text{(for all t)}Cov(Xt,Xt+h)=γ(h)(for all t)
여기서 γ(h)\gamma(h)γ(h)는 시차 hhh에 대한 자기공분산입니다.
### 정상성과 비정상성
- **정상 시계열**:
- 시계열 데이터가 위의 조건들을 만족하면, 이 시계열은 **정상적(Stationary)**이라고 합니다. 정상 시계열은 예측 가능성이 높아지고, 단순한 모델로도 분석이 용이합니다.
- **비정상 시계열**:
- 시간에 따라 평균, 분산, 자기공분산 등이 변하면, 이 시계열은 **비정상적(Non-stationary)**이라고 합니다. 비정상 시계열의 경우, 분석과 예측이 어려워지며, 이를 정상화하기 위해 데이터 변환(차분, 로그 변환 등)이 필요합니다.
### 정상화 방법
비정상 시계열 데이터를 정상 시계열로 변환하기 위한 몇 가지 일반적인 방법은 다음과 같습니다:
1. **차분(Differencing)**:
- 비정상 시계열의 경우, 데이터 간의 차이를 계산하여 정상성을 확보할 수 있습니다. 예를 들어, 첫 번째 차분을 사용하면 시계열의 각 값에서 이전 값을 빼서 새로운 시계열을 만듭니다.
Yt=Xt−Xt−1Y_t = X_t - X_{t-1}Yt=Xt−Xt−1
2. **로그 변환(Log Transformation)**:
- 시계열의 분산이 시간에 따라 증가하거나 감소하는 경우, 로그 변환을 사용하여 변동성을 줄이고 정상성을 확보할 수 있습니다.
Yt=log(Xt)Y_t = \log(X_t)Yt=log(Xt)
3. **계절성 제거**:
- 계절성이 있는 시계열 데이터의 경우, 계절성 성분을 제거하거나 모델에 계절성 성분을 포함시켜 정상성을 확보할 수 있습니다.
### 정상성과 시계열 모델링
- **ARIMA 모델**: ARIMA 모델은 정상 시계열을 대상으로 하는 대표적인 시계열 모델입니다. ARIMA의 "I"는 차분을 통해 비정상 시계열을 정상 시계열로 변환하는 과정을 포함합니다.
- **평활법**: 평활법은 비정상 시계열의 평균을 제거하거나 감소시키기 위해 사용되며, 이를 통해 시계열을 정상적으로 만듭니다.
### 결론
**정상성**은 시계열 분석에서 매우 중요한 개념으로, 데이터의 평균, 분산, 자기공분산이 시간에 따라 일정하게 유지되는 특성을 말합니다. 정상성을 갖춘 시계열 데이터는 예측과 분석이 용이하며, 이를 위한 다양한 모델들이 존재합니다. 비정상 시계열 데이터를 정상화하여 분석하는 것이 시계열 모델링의 중요한 단계 중 하나입니다.
---
33. 시계열에 관한 설명 중 틀린 것은?
① 대부분의 시계열은 비정상 자료이다. 그러므로 비정상 자료를 정상성 조건에 만족시키기 정상 시계열로 만든 후 시계열 분석을 한다.
② 시계열의 정상 시계열인지 비정상 시계열인지 판단하기 위해 폭발적인 추세를 보이거나 시간에 따라 분산이 변하는지 관찰해야 한다.
③ 비정상 시계열은 정상 시계열로 변형하고자 할 때 변환과 차분의 방법을 사용한다.
④ 일반적으로 평균이 일정하지 않은 비정상 시계열은 변환을 통해, 분산이 일정하지 않은 비정상 시계열은 차분을 통해 정상 시계열로 바꾼다.
정답: 4
출처: [[01 데이터분석준전문가모의고사(ADsP) 1회.pdf]]
풀 수 있는 문제
---
48. 시계열의 요소분해법은 시계열 자료가 몇 가지 변동들의 결합으로 이루어져 있다고 보고 변동요소별로 분해하여 쉽게 분석하기 위한 것이다. 다음 중 변이 요소에 대한 설명이 부적절한 것은?
① 추세변동은 장기적으로 변화하는 큰 흐름을 나타내는 것으로 자료가 장기적으로 커지거나 작아지는 변화를 나타내는 요소이다.
② 계절변동은 일정한 주기를 가지고 반복적으로 같은 패턴을 보이는 변화를 나타내는 요소이다.
③ 순환변동은 경제 전반이나 특정 산업의 부침을 나타내 주는 것을 말한다.
④ 불규칙변동은 불규칙하게 변동하는 급격한 환경변화, 천재지변 같은 것으로 발생하는 변동을 말한다.
정답: 3
출처: [[01 데이터분석준전문가모의고사(ADsP) 1회.pdf]]
시계열 요소분해법에서 시계열 데이터를 구성하는 변동 요소는 일반적으로 다음 네 가지로 나뉩니다: **추세변동(Trend), 계절변동(Seasonal), 순환변동(Cyclical), 불규칙변동(Irregular)**. 각 요소의 설명을 통해 올바른 설명이 무엇인지 확인해 보겠습니다.
### 각 변동 요소에 대한 설명
#### ① "추세변동은 장기적으로 변화하는 큰 흐름을 나타내는 것으로 자료가 장기적으로 커지거나 작아지는 변화를 나타내는 요소이다."
- **적절한 설명입니다.** 추세변동(Trend)은 시계열 데이터가 장기적으로 나타내는 일관된 방향성을 나타냅니다. 이 방향성은 시간에 따라 데이터가 점진적으로 증가하거나 감소하는 패턴을 의미합니다.
#### ② "계절변동은 일정한 주기를 가지고 반복적으로 같은 패턴을 보이는 변화를 나타내는 요소이다."
- **적절한 설명입니다.** 계절변동(Seasonal)은 시계열 데이터에서 매년, 매 분기, 매 월 등 일정한 주기로 반복되는 패턴을 의미합니다. 예를 들어, 월별 판매량이 계절에 따라 변동하는 경우가 해당됩니다.
#### ③ "순환변동은 경제 전반이나 특정 산업의 부침을 나타내 주는 것을 말한다."
- **부적절한 설명입니다.** 순환변동(Cyclical)은 경제적이나 자연적인 이유가 없이 알려지지 않은 주기를 가지고 변화하는 자료 형태이다.
#### ④ "불규칙변동은 불규칙하게 변동하는 급격한 환경변화, 천재지변 같은 것으로 발생하는 변동을 말한다."
- **적절한 설명입니다.** 불규칙변동(Irregular)은 예측할 수 없는 급격한 변화로 인해 발생하는 변동을 의미합니다. 이 요소는 예측이 불가능하며, 데이터 분석 시 일반적으로 노이즈로 간주됩니다.
---
30. 분해시계열에 대한 설명 중 잘못된 것은?
① 분해시계열이란 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법을 말한다.
② 분해시계열의 분해 요소는 추세요인, 계절요인, 순환요인, 회귀요인으로 크게 4가지로 이루어진다.
③ 추세요인은 자료의 형태가 오르거나 내리는 추세를 따르는 경우로 선형적 형태, 지수형태 등이 있다.
④ 순환요인은 경제적이나 자연적인 이유가 없이 알려지지 않은 주기를 가지고 변화하는 자료 형태이다.
정답: 2
출처: [[02 데이터분석준전문가모의고사(ADsP) 2회.pdf]]
주어진 선택지에서 잘못된 설명은 **②번**입니다.
### 각 선택지 분석
#### ① "분해시계열이란 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법을 말한다."
- **적절한 설명**입니다. 분해시계열은 시계열 데이터를 구성하는 여러 요인(추세, 계절성, 순환성, 불규칙성 등)을 분리하여 각각을 분석하는 방법입니다.
#### ② "분해시계열의 분해 요소는 추세요인, 계절요인, 순환요인, 회귀요인으로 크게 4가지로 이루어진다."
- **잘못된 설명**입니다. 분해시계열의 주요 요소는 **추세요인(Trend), 계절요인(Seasonal), 순환요인(Cyclical), 불규칙요인(Irregular)**으로 구성됩니다. "회귀요인"은 시계열 분해 요소에 포함되지 않습니다.
#### ③ "추세요인은 자료의 형태가 오르거나 내리는 추세를 따르는 경우로 선형적 형태, 지수형태 등이 있다."
- **적절한 설명**입니다. 추세요인은 시계열 데이터가 시간에 따라 나타내는 장기적인 증가 또는 감소 경향을 말하며, 이 경향은 선형적일 수도 있고, 비선형적(예: 지수형태)일 수도 있습니다.
#### ④ "순환요인은 경제적이나 자연적인 이유가 없이 알려지지 않은 주기를 가지고 변화하는 자료 형태이다."
- **적절한 설명입니다.** 순환요인은 주기적으로 변동하는 요소로, 경제적, 사회적 또는 자연적인 주기에 따라 발생합니다. 이 요인은 알려진 주기를 가지고 있으나, 특정 사건에 대한 명확한 설명이 없는 경우도 포함될 수 있습니다.
---
46. 다음 중 시계열 데이터를 조정하여 예측하는 평활법(Smoothing method)에 대한 설명으로 적절하지 않은 것은?
① 이동평균법이란 시계열 데이터가 일정한 주기를 갖고 비슷한 패턴으로 움직이고 있는 경우에 적용시킬 수 있는 방법이다.
② 이동평균법은 시계열자료에서 계절변동과 추세변동을 제거하여 순환변동만 가진 시계열자료로 변환하는 방법이다.
③ 단순지수평활법은 추세나 계절성이 없이 평균이 변화하는 시계열에 사용하는 방법이다.
④ 이중지수평활법은 평균을 평활하는 모수와 함께 추세를 나타내는 식을 다른 모수로 평활하는 방법이다.
정답: 2
출처: [[02 데이터분석준전문가모의고사(ADsP) 2회.pdf]]
주어진 선택지에서 평활법(Smoothing method)에 대한 설명 중 **적절하지 않은 설명**은 **②번**입니다.
### 각 선택지 분석
#### ① "이동평균법이란 시계열 데이터가 일정한 주기를 갖고 비슷한 패턴으로 움직이고 있는 경우에 적용시킬 수 있는 방법이다."
- **적절한 설명**입니다. 이동평균법은 시계열 데이터가 주기적이거나 비슷한 패턴을 가지고 있을 때, 데이터의 노이즈를 줄이고 기본적인 추세를 파악하기 위해 사용됩니다.
#### ② "이동평균법은 시계열자료에서 계절변동과 추세변동을 제거하여 순환변동만 가진 시계열자료로 변환하는 방법이다."
- **적절하지 않은 설명**입니다. 이동평균법은 주로 시계열 데이터에서 노이즈를 줄여 기본적인 **추세**를 파악하는 방법입니다. 이동평균법 자체는 계절변동과 추세변동을 제거하여 순환변동만을 남기는 것이 아니라, 데이터의 **단기적인 변동(노이즈)**을 제거하고 **추세를 부드럽게** 나타내기 위해 사용됩니다. 계절성이나 추세를 완전히 제거하는 것은 이동평균법의 주요 목적이 아닙니다.
#### ③ "단순지수평활법은 추세나 계절성이 없이 평균이 변화하는 시계열에 사용하는 방법이다."
- **적절한 설명**입니다. 단순지수평활법은 시계열 데이터에서 평균이 시간에 따라 변화하더라도, 명확한 추세나 계절성이 없는 경우에 사용됩니다. 이 방법은 최근의 관측값에 더 높은 가중치를 부여하여 평활화된 데이터를 생성합니다.
#### ④ "이중지수평활법은 평균을 평활하는 모수와 함께 추세를 나타내는 식을 다른 모수로 평활하는 방법이다."
- **적절한 설명**입니다. 이중지수평활법은 추세가 존재하는 시계열 데이터를 처리하기 위해 고안된 방법으로, 두 개의 평활 모수를 사용하여 데이터의 평균과 추세를 각각 평활화합니다.
### 결론
**정답은 ②번**입니다. 이동평균법은 시계열 데이터의 노이즈를 줄이고 추세를 파악하는 데 사용되는 방법으로, 계절변동과 추세변동을 제거하여 순환변동만을 남기는 방법이 아닙니다.
---
19. 다음 중 시계열 모형에 대한 설명 중 옳은 것은?
① ARIMA의 약어는 AutoRegressive Improved Moving Average이다.
② 분해시계열은 일반적인 요인을 분리하여 분석하는 방법으로 회귀분석적인 방법과는 다르게 사용한다.
③ ARIMA 모형에서는 정상성을 확인할 필요가 없다.
④ ARIMA 모형에서 p=0일 때, IMA(d,q) 모형이라고 부르고, d변 차분하면 MA(q)모형을 따른다.
정답: 4
출처: [[03 제34회데이터분석준전문가자격검정시험복원문제.pdf]]
풀 수 있는 문제
![[Screenshot 2024-08-09 at 11.27.12.png]]
---
30. 시계열 분석에 관한 설명 중 틀린 것은?
① AR모형은 과거의 값이 현재의 값에 영향을 줄 때 사용하며, MA모형은 오차를 이용해 회귀식을 만든 방법이다.
② ARMA모형은 약한 정상성을 가진 확률적 시계열을 표현하는데 사용한다.
③ 대부분의 시계열은 비정상 자료이므로 비정상 자료로 정상성 시계열로 만든 후 시계열 분석을 한다.
④ 지수가중평활법은 특정 기간 안에 속하는 시계열에 대해서는 동일한 가중치를 부여한다.
정답: 4
출처: [[03 제34회데이터분석준전문가자격검정시험복원문제.pdf]]
주어진 선택지에서 시계열 분석에 관한 설명 중 틀린 것은 **④번**입니다.
### 각 선택지 분석
#### ① "AR모형은 과거의 값이 현재의 값에 영향을 줄 때 사용하며, MA모형은 오차를 이용해 회귀식을 만든 방법이다."
- **적절한 설명입니다.** AR(자기회귀) 모형은 과거의 값들이 현재의 값에 영향을 미치는 경우에 사용됩니다. 반면, MA(이동평균) 모형은 과거의 오차(예측오차)를 이용하여 현재의 값을 설명합니다.
#### ② "ARMA모형은 약한 정상성을 가진 확률적 시계열을 표현하는데 사용한다."
- **적절한 설명입니다.** ARMA(자기회귀-이동평균) 모형은 정상 시계열(약한 정상성 시계열)을 모델링하기 위해 사용되며, 시계열이 정상성을 만족할 때 사용되는 대표적인 모형입니다.
#### ③ "대부분의 시계열은 비정상 자료이므로 비정상 자료로 정상성 시계열로 만든 후 시계열 분석을 한다."
- **적절한 설명입니다.** 많은 시계열 데이터는 비정상적이기 때문에, 분석을 하기 전에 차분이나 변환을 통해 정상성을 확보한 후에 시계열 분석을 수행합니다. 이는 특히 ARIMA 모델링에서 중요한 과정입니다.
#### ④ "지수가중평활법은 특정 기간 안에 속하는 시계열에 대해서는 동일한 가중치를 부여한다."
- **부적절한 설명입니다.** 지수가중평활법(Exponential Smoothing)은 **최근 데이터에 더 높은 가중치를 부여**하고, 과거 데이터에 낮은 가중치를 부여하는 방법입니다. 이는 시간에 따라 데이터의 중요도가 다르게 반영되도록 하기 위한 방법입니다. 반면, 동일한 가중치를 부여하는 것은 **이동평균법**에 해당합니다.
### 결론
**정답은 ④번**입니다. 지수가중평활법에서는 동일한 가중치를 부여하지 않고, 시간이 지남에 따라 가중치가 지수적으로 감소합니다.
---
40. 다음 중 시계열 데이터의 정상성(stationary)에 대한 설명으로 가장 적절하지 않은 것은?
① 비정상 시계열 자료는 정상성을 만족하도록 데이터를 정상 시계열로 만든 후에 시계열 분석을 수행한다.
② 정상 시계열은 어떤 일정한 값을 중심으로 일정한 변동 폭을 가진다.
③ 시계열 자료가 추세를 보이는 경우에는 차분(differencing)을 통해 비정상 시계열을 정상 시계열로 바꿀 수 있다.
④ 시계열 자료가 정상성을 만족하는지 판단하기 위해 시계열 자료 그림을 통해 자료의 이상점을 살핀다.
정답: 4
출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]]
주어진 선택지에서 시계열 데이터의 정상성(stationarity)에 대한 설명 중 적절하지 않은 것은 **④번**입니다.
### 각 선택지 분석
#### ① "비정상 시계열 자료는 정상성을 만족하도록 데이터를 정상 시계열로 만든 후에 시계열 분석을 수행한다."
- **적절한 설명입니다.** 비정상 시계열 데이터를 분석하기 위해서는 정상성을 확보해야 합니다. 이를 위해 차분(differencing)이나 로그 변환 등을 통해 데이터를 정상 시계열로 변환한 후 분석을 수행합니다.
#### ② "정상 시계열은 어떤 일정한 값을 중심으로 일정한 변동 폭을 가진다."
- **적절한 설명입니다.** 정상 시계열 데이터는 평균과 분산이 시간에 따라 일정하게 유지됩니다. 즉, 데이터가 일정한 평균값을 중심으로 일정한 변동성을 가지며 변화합니다.
#### ③ "시계열 자료가 추세를 보이는 경우에는 차분(differencing)을 통해 비정상 시계열을 정상 시계열로 바꿀 수 있다."
- **적절한 설명입니다.** 시계열 데이터에 추세가 있는 경우, 차분(differencing)을 통해 데이터를 정상 시계열로 변환할 수 있습니다. 이는 비정상성을 제거하고 데이터를 분석할 수 있도록 만드는 일반적인 방법입니다.
#### ④ "시계열 자료가 정상성을 만족하는지 판단하기 위해 시계열 자료 그림을 통해 자료의 이상점을 살핀다."
- **적절하지 않은 설명입니다.** 시계열 자료의 정상성을 판단하는 주요 방법은 **평균, 분산, 자기상관** 등의 통계적 특성이 시간에 따라 일정한지를 확인하는 것입니다. 시계열 그림을 통해 시각적으로 추세나 계절성 등을 파악할 수는 있지만, 정상성을 판단하기 위해서는 **시계열의 평균, 분산이 일정한지** 또는 **자기상관 함수**(ACF)나 **단위근 검정**(ADF 테스트)과 같은 통계적 검정을 사용합니다. 이상점(outliers)을 살피는 것은 정상성 판단과 직접적인 관련이 없습니다.
### 결론
**정답은 ④번**입니다. 정상성을 판단하기 위해서는 시계열 데이터의 평균, 분산, 자기상관 함수 등을 분석하는 것이 중요하며, 이상점(outliers)을 살피는 것은 정상성 판단의 주요 방법이 아닙니다.
---
05. 아래에서 설명하는 시계열 모형은?
- 시계열 모델 중 자기 자신의 과거 값을 사용하여 설명하는 모형임
- 백색 잡음의 현재값과 자리 자신의 과거값만의 선형 가중합으로 이루어진 정상성과 모형
- 모형에 사용하는 시계열 자료의 시점에 따라 1차, 2차, ..., p차 등을 사용하는 정상시계열 모형에서는 주로 1, 2차를 사용함
( )
정답: ar모형
출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]]
풀 수 있는 문제
---
25. 적합한 ARIMA 모델 결정 방법으로 가장 적절한 것은?
① AR(2)모형에서 추정해야하는 모수는 총 3개이다.
② 모델링의 기본은 모수들이 많을수록 이해하기 쉽다.
③ ACF 값은 이후로 절단점을 가지며 PACF 값은 급격하게 감소하는 경우, ARMA(3, 0) 모델로 정의할 수 있다.
④ ACF 값은 급격히 감소하고 PACF의 절단점이 3인 경우, ARMA(2, 0) 모델로 정의할 수 있다.
정답: 4
[[06 제37회데이터분석준전문가자격검정시험복원문제.pdf]]
버리는 문제. 어렵다.
---
34. 시계열 자료의 이동평균(MA) 모형에 대한 설명으로 가장 적절한 것은?
① 백색잡음의 비선형 결합이다.
② 시계열 데이터의 비선형 결합이다.
③ ACF, PACF 형태는 AR 모형의 ACF, PACF 형태와 반대이다.
④ 정상성(stationary)을 만족하기 위한 조건이 필요하다.
정답: 3
[[06 제37회데이터분석준전문가자격검정시험복원문제.pdf]]
이동평균(MA) 모형에 대한 설명 중 가장 적절한 것은 **③번**입니다. 이 선택지는 이동평균(MA) 모형과 자기회귀(AR) 모형의 ACF(자기상관 함수)와 PACF(부분 자기상관 함수) 패턴의 차이를 잘 설명하고 있습니다.
### 각 선택지 분석
#### ① "백색잡음의 비선형 결합이다."
- **부적절한 설명입니다.** 이동평균(MA) 모형은 과거의 백색잡음(오차 항)의 **선형 결합**으로 현재 값을 예측하는 모델입니다. 비선형 결합이 아니며, 선형 결합입니다.
#### ② "시계열 데이터의 비선형 결합이다."
- **부적절한 설명입니다.** MA 모형은 시계열 데이터의 과거 오차 항에 대한 **선형 결합**을 사용합니다. 비선형 결합이 아닙니다.
#### ③ "ACF, PACF 형태는 AR 모형의 ACF, PACF 형태와 반대이다."
- **적절한 설명입니다.** MA 모형에서는 ACF가 특정 지연 시점에서 급격히 절단되는 반면, PACF는 서서히 감소합니다. 반대로, AR 모형에서는 PACF가 특정 지연 시점에서 급격히 절단되고, ACF는 서서히 감소하는 패턴을 보입니다. 이 설명은 AR 모형과 MA 모형 간의 ACF와 PACF 패턴의 차이를 정확하게 설명하고 있습니다.
#### ④ "정상성(stationary)을 만족하기 위한 조건이 필요하다."
- **부적절한 설명입니다.** 이동평균(MA) 모형은 본질적으로 정상성을 만족하는 모델입니다. 따라서 특별한 정상성 조건을 따로 충족시킬 필요는 없습니다.
### 결론
**정답은 ③번**입니다. 이 선택지는 이동평균(MA) 모형과 자기회귀(AR) 모형의 ACF와 PACF의 특성을 비교하여 올바르게 설명하고 있습니다.