1. 데이터베이스의 특징으로 가장 부적절한 것은?
① 데이터베이스는 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용할 수 있도록 구성되어 있다.
② 데이터베이스는 통합된 데이터(Integrated Data)다.
③ 데이터베이스는 변화하는 데이터로 데이터의 삽입, 삭제, 갱신을 한다고 하더라도 항상 현재의 정확한 데이터를 유지해야 한다.
④ 데이터베이스는 검색 기능을 가지고 있으므로 다양한 방법으로 필요한 정보를 검색할 수 있다.
정답: 4
출처: [[01 데이터분석준전문가모의고사(ADsP) 1회.pdf]]
![[Screenshot 2024-08-03 at 10.30.06.png]]
### 문제의 출제 의도
이 문제는 데이터베이스의 정의와 기본적인 특징을 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터베이스는 데이터 관리 시스템의 핵심 요소로, 그 특징을 정확히 이해하는 것은 매우 중요합니다. 이 문제를 통해 수험생이 데이터베이스의 주요 특징과 그 역할을 제대로 파악하고 있는지 확인하고자 합니다.
### 주요 개념
1. **데이터베이스(Database)**: 데이터를 체계적으로 저장, 관리, 검색할 수 있는 시스템입니다. 데이터베이스는 여러 사용자와 응용 프로그램이 데이터를 효과적으로 공유하고 이용할 수 있도록 설계됩니다.
2. **통합된 데이터(Integrated Data)**: 데이터베이스는 중복을 최소화하고 일관성을 유지하기 위해 통합된 형태로 데이터를 저장합니다.
3. **변화하는 데이터(Dynamic Data)**: 데이터베이스는 데이터를 삽입, 삭제, 갱신하면서도 항상 현재의 정확한 데이터를 유지해야 합니다.
4. **공동 이용(Shared Data)**: 데이터베이스는 여러 사용자가 동시에 데이터를 접근하고 사용할 수 있도록 설계되어 있습니다.
5. **검색 기능**: 데이터베이스는 다양한 방법으로 데이터를 검색할 수 있는 강력한 검색 기능을 제공합니다.
### 보기 설명
1. **데이터베이스는 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용할 수 있도록 구성되어 있다.**
- 데이터베이스는 다중 사용자 환경을 지원하며, 여러 사용자가 다양한 목적을 위해 데이터를 공동으로 사용할 수 있습니다.
- **적절한 설명입니다.**
2. **데이터베이스는 통합된 데이터(Integrated Data)다.**
- 데이터베이스는 데이터를 중복 없이 통합하여 저장하는 것을 목표로 합니다.
- **적절한 설명입니다.**
3. **데이터베이스는 변화하는 데이터로 데이터의 삽입, 삭제, 갱신을 한다고 하더라도 항상 현재의 정확한 데이터를 유지해야 한다.**
- 데이터베이스는 데이터의 변경이 있을 때마다 항상 최신의 정확한 데이터를 유지하도록 설계되어 있습니다.
- **적절한 설명입니다.**
4. **데이터베이스는 검색 기능을 가지고 있으므로 다양한 방법으로 필요한 정보를 검색할 수 있다.**
- 데이터베이스는 강력한 검색 기능을 제공하지만, 검색 기능은 데이터베이스의 특징이라기보다는 데이터베이스 관리 시스템(DBMS)의 기능입니다. 데이터베이스 자체는 데이터를 저장하는 구조입니다.
- **부적절한 설명입니다.**
### 정답: 4
**데이터베이스는 검색 기능을 가지고 있으므로 다양한 방법으로 필요한 정보를 검색할 수 있다.**
검색 기능은 데이터베이스의 특징이라기보다는 데이터베이스 관리 시스템(DBMS)의 기능입니다. 데이터베이스는 데이터를 저장하고 관리하는 시스템이며, 검색 기능은 이를 활용하는 도구로서의 역할을 합니다. 따라서 ④번 설명이 부적절합니다.
---
03. 다음 중 DBMS(Database Management System)에 관한 설명 중 틀린 것은?
① 데이터베이스는 정의, 조작, 제어라는 3가지 필수 기능이 있다.
② 데이터베이스를 관리하고 운영하는 소프트웨어를 말한다.
③ 데이터베이스에 있는 모든 데이터는 분석이 가능하다.
④ 계층형(Hierarchical), 망형(Network), 관계형(Relational), 객체지향형(Object-Oriented), 객체관계형(Object-Relational) 등으로 분류된다.
정답: 3
출처: [[03 제34회데이터분석준전문가자격검정시험복원문제.pdf]]
### 문제의 출제 의도
이 문제는 데이터베이스 관리 시스템(DBMS)의 정의와 기능, 그리고 그 특징을 이해하고 있는지를 평가하기 위해 출제되었습니다. DBMS는 데이터베이스를 효율적으로 관리하고 운영하기 위해 필수적인 소프트웨어로, 그 역할과 특성을 정확히 이해하는 것이 중요합니다.
### 주요 개념
1. **DBMS (Database Management System)**: 데이터베이스를 정의하고, 조작하며, 제어하는 소프트웨어 시스템입니다. DBMS는 데이터의 저장, 관리, 검색, 업데이트, 보안, 백업 등의 기능을 제공합니다.
2. **데이터베이스의 필수 기능**: DBMS는 데이터베이스의 정의, 조작, 제어라는 세 가지 필수 기능을 가지고 있습니다.
- **정의(Definition)**: 데이터베이스 구조를 정의하는 기능입니다. 데이터 모델링과 스키마 설계를 포함합니다.
- **조작(Manipulation)**: 데이터를 삽입, 삭제, 수정, 검색하는 기능입니다.
- **제어(Control)**: 데이터베이스의 접근 제어, 무결성, 보안, 회복 기능을 제공합니다.
3. **데이터베이스의 관리 및 운영**: DBMS는 데이터베이스를 효율적으로 관리하고 운영하기 위한 소프트웨어입니다. 이는 데이터베이스의 성능 최적화, 사용자 관리, 백업 및 복구 등을 포함합니다.
4. **데이터베이스의 분류**: 데이터베이스는 다양한 데이터 모델에 따라 분류됩니다. 주요 분류는 계층형, 망형, 관계형, 객체지향형, 객체관계형 등이 있습니다.
5. **데이터 분석 가능성**: 데이터베이스에 저장된 모든 데이터가 분석 가능한 것은 아니며, 데이터의 분석 가능 여부는 데이터의 구조, 데이터 품질, 접근 권한 등에 따라 달라집니다.
### 보기 설명
1. **데이터베이스는 정의, 조작, 제어라는 3가지 필수 기능이 있다.**
- DBMS의 핵심 기능으로, 데이터베이스 구조의 정의, 데이터의 조작, 데이터 접근 및 보안의 제어가 포함됩니다.
- **적절한 설명입니다.**
2. **데이터베이스를 관리하고 운영하는 소프트웨어를 말한다.**
- DBMS는 데이터베이스의 관리 및 운영을 담당하는 소프트웨어입니다.
- **적절한 설명입니다.**
3. **데이터베이스에 있는 모든 데이터는 분석이 가능하다.**
- 모든 데이터가 분석 가능한 것은 아닙니다. 데이터의 구조, 품질, 형식, 접근 권한 등에 따라 분석 가능 여부가 달라집니다.
- **부적절한 설명입니다.**
4. **계층형(Hierarchical), 망형(Network), 관계형(Relational), 객체지향형(Object-Oriented), 객체관계형(Object-Relational) 등으로 분류된다.**
- 데이터베이스는 다양한 데이터 모델에 따라 이러한 방식으로 분류됩니다.
- **적절한 설명입니다.**
### 정답: 3
**데이터베이스에 있는 모든 데이터는 분석이 가능하다.**
모든 데이터가 분석 가능한 것은 아닙니다. 데이터의 분석 가능 여부는 데이터의 구조, 품질, 접근 권한, 저장 형식 등에 따라 달라집니다. 따라서 ③번 설명이 틀렸습니다.
---
03. 아래에서 설명하는 (가)는 무엇인가?
(가)는 식별된 비즈니스 문제를 데이터의 문제로 변환하여 정의하는 단계
( )
정답: 문제정의
출처: [[03 제34회데이터분석준전문가자격검정시험복원문제.pdf]]
### 문제의 출제 의도
이 문제는 데이터 분석 프로젝트의 단계 중 비즈니스 문제를 데이터 문제로 변환하는 특정 단계를 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터 분석 프로젝트는 여러 단계로 이루어지며, 각 단계는 프로젝트의 성공에 중요한 역할을 합니다.
### 주요 개념
1. **비즈니스 문제**: 조직에서 해결해야 할 실제 문제로, 데이터 분석을 통해 해결할 수 있습니다.
2. **데이터 문제**: 비즈니스 문제를 해결하기 위해 필요한 데이터 분석의 관점에서 정의된 문제입니다.
3. **문제 정의 단계**: 데이터 분석 프로젝트의 초기 단계로, 비즈니스 문제를 명확히 이해하고 이를 데이터 문제로 변환하여 정의하는 과정입니다. 이는 프로젝트의 방향을 설정하는 중요한 단계입니다.
### (가)에 해당하는 단계
**(가)**는 데이터 분석 프로젝트에서 비즈니스 문제를 데이터의 문제로 변환하여 정의하는 단계로, 이는 데이터 분석 프로젝트의 초기 단계입니다. 이 단계는 문제를 명확히 이해하고, 분석 목표를 설정하며, 필요한 데이터를 식별하는 과정입니다.
이 단계는 다음과 같은 과정을 포함합니다:
- 비즈니스 문제 이해
- 분석 목표 설정
- 데이터 요구사항 정의
- 데이터 수집 계획 수립
이 단계를 통해 비즈니스 문제를 데이터 분석의 관점에서 명확하게 정의하고, 이를 해결하기 위한 데이터 분석 계획을 수립합니다.
### 답: 문제 정의 단계
**문제 정의 단계**는 비즈니스 문제를 데이터 문제로 변환하여 정의하는 단계입니다. 이는 데이터 분석 프로젝트의 성공을 위한 중요한 첫 단계로, 명확한 문제 정의가 없으면 이후의 데이터 수집, 분석, 모델링 등의 단계가 방향을 잃을 수 있습니다.
**정답**: 문제 정의 단계
---
04. 다음 중 빈칸에 공통으로 들어갈 알맞은 단어를 적으시오.
( )란 전사차원의 모든 데이터에 대하여 정책 및 지침, 표준화, 운영조직 및 책임등의 표준화된 관리체계를 수립하고 운영을 위한 프레임워크(Framework) 및 저장소(Repository)를 구축하는 것을 말한다. 특히 마스터 데이터(Master Data), 메타 데이터(Meta Data), 데이터 사전(Data Dictionary)은 ( )의 중요한 관리 대상이다.
( )
정답: 데이터 거버넌스
출처: [[03 제34회데이터분석준전문가자격검정시험복원문제.pdf]]
### 문제의 출제 의도
이 문제는 데이터 관리 체계의 한 부분으로서 데이터 거버넌스의 개념을 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터 거버넌스는 조직 내 모든 데이터에 대한 관리 정책, 절차 및 책임을 정의하고 운영하는 체계를 의미합니다.
### 주요 개념
1. **데이터 거버넌스 (Data Governance)**: 전사적 데이터 관리 체계로, 데이터의 품질, 보안, 개인정보 보호, 데이터 사용의 표준화 등을 포함한 데이터 관리 정책과 절차를 정의하고 운영하는 것입니다. 데이터 거버넌스는 조직 내 데이터의 효율적이고 일관된 관리와 사용을 보장합니다.
2. **마스터 데이터 (Master Data)**: 조직의 주요 엔티티(고객, 제품, 공급업체 등)에 관한 핵심 데이터로, 다양한 시스템과 프로세스에서 일관되게 사용되는 데이터입니다.
3. **메타 데이터 (Meta Data)**: 데이터에 대한 데이터로, 데이터의 정의, 구조, 관계, 사용 방법 등을 설명합니다. 메타 데이터는 데이터 관리와 검색을 용이하게 합니다.
4. **데이터 사전 (Data Dictionary)**: 데이터베이스나 데이터 웨어하우스에서 사용되는 데이터 요소에 대한 정의와 설명을 제공하는 도구로, 데이터의 구조와 의미를 이해하는 데 도움을 줍니다.
### 빈칸에 들어갈 단어
데이터 거버넌스 (Data Governance) 란 전사차원의 모든 데이터에 대하여 정책 및 지침, 표준화, 운영조직 및 책임 등의 표준화된 관리체계를 수립하고 운영을 위한 프레임워크(Framework) 및 저장소(Repository)를 구축하는 것을 말합니다. 특히 마스터 데이터(Master Data), 메타 데이터(Meta Data), 데이터 사전(Data Dictionary)은 데이터 거버넌스의 중요한 관리 대상입니다.
**정답**: 데이터 거버넌스
---
05. 다음 내용이 설명하고 있는 단어를 적으시오.
이것은 배깅에 랜덤과정을 추가한 방법이다. 원 자료로부터 부스트랩 샘플을 추출하고, 각 부스트랩 샘플에 대해 트리를 형성해 나가는 과정은 배깅과 유사하나, 각 노드마다 모두 예측변수 안에서 최적의 분할을 선택하는 방법 대신 예측변수를 임의로 추출하고 추출된 변수 내에서 최적의 분할을 만들어 나가는 방법을 사용한다.
( )
정답: 랜덤 포레스트
출처: [[03 제34회데이터분석준전문가자격검정시험복원문제.pdf]]
### 문제의 출제 의도
이 문제는 머신러닝 알고리즘 중 하나인 랜덤 포레스트(Random Forest)의 개념과 특징을 이해하고 있는지를 평가하기 위해 출제되었습니다. 랜덤 포레스트는 앙상블 학습 방법 중 하나로, 다수의 결정 트리를 통해 예측 성능을 향상시키는 기법입니다.
### 주요 개념
1. **부스트랩 샘플링 (Bootstrap Sampling)**: 원본 데이터에서 여러 번의 복원 추출을 통해 새로운 샘플을 생성하는 방법입니다. 각 샘플은 원본 데이터와 동일한 크기를 가지며, 일부 데이터는 여러 번 추출될 수 있습니다.
2. **배깅 (Bagging, Bootstrap Aggregating)**: 여러 부스트랩 샘플을 사용해 각각의 모델을 학습시키고, 그 예측 결과를 평균 내거나 다수결 투표를 통해 최종 예측을 만드는 앙상블 학습 방법입니다. 배깅은 모델의 분산을 줄여 성능을 향상시킵니다.
3. **랜덤 포레스트 (Random Forest)**: 배깅의 확장으로, 각 결정 트리를 학습할 때 모든 예측변수를 고려하는 대신, 각 노드에서 임의로 선택된 예측변수들 중 최적의 분할을 선택합니다. 이는 트리 간의 상관성을 줄이고, 예측 성능과 일반화 능력을 향상시킵니다.
### 빈칸에 들어갈 단어
**랜덤 포레스트 (Random Forest)** 는 배경에 랜덤과정을 추가한 방법으로, 원 자료로부터 부스트랩 샘플을 추출하고, 각 부스트랩 샘플에 대해 트리를 형성해 나가는 과정은 배깅과 유사하지만, 각 노드마다 모두 예측변수 안에서 최적의 분할을 선택하는 방법 대신 예측변수를 임의로 추출하고 추출된 변수 내에서 최적의 분할을 만들어 나가는 방법을 사용합니다.
**정답**: 랜덤 포레스트
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, confusion_matrix, ConfusionMatrixDisplay
# 샘플 데이터셋 생성
data = {
'Feature 1': [5, 7, 4, 6, 8, 9],
'Feature 2': [2, 3, 4, 5, 6, 1],
'Target': ['Yes', 'No', 'Yes', 'No', 'Yes', 'No']
}
# 데이터프레임으로 변환
df = pd.DataFrame(data)
# 특성과 타겟 분리
X = df[['Feature 1', 'Feature 2']]
y = df['Target']
# 학습용 데이터와 테스트용 데이터로 분리
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 랜덤 포레스트 모델 생성
clf = RandomForestClassifier(n_estimators=100, random_state=42)
# 모델 학습
clf.fit(X_train, y_train)
# 예측
y_pred = clf.predict(X_test)
# 정확도 평가
accuracy = accuracy_score(y_test, y_pred)
print(f'Accuracy: {accuracy:.2f}')
# 혼동 행렬 시각화
cm = confusion_matrix(y_test, y_pred, labels=clf.classes_)
disp = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=clf.classes_)
disp.plot()
plt.title('Confusion Matrix')
plt.show()
# 데이터 시각화
plt.figure(figsize=(10, 5))
# 학습 데이터 시각화
plt.subplot(1, 2, 1)
plt.scatter(X_train['Feature 1'], X_train['Feature 2'], c=[{'Yes': 'blue', 'No': 'red'}[label] for label in y_train], marker='o')
plt.title('Training Data')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.grid(True)
# 테스트 데이터와 예측 결과 시각화
plt.subplot(1, 2, 2)
plt.scatter(X_test['Feature 1'], X_test['Feature 2'], c=[{'Yes': 'blue', 'No': 'red'}[label] for label in y_test], marker='o', label='Actual')
plt.scatter(X_test['Feature 1'], X_test['Feature 2'], c=[{'Yes': 'lightblue', 'No': 'lightcoral'}[label] for label in y_pred], marker='x', label='Predicted')
plt.title('Test Data and Predictions')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.show()
```
---
8. 다음 중 사용자와 데이터베이스 사이에서 사용자의 요구에 따라 정보를 처리해주고 데이터베이스를 관리해 주는 소프트웨어는 무엇인가?
① SQL
② ERD
③ Data Dictionary
④ DBMS
정답: 4
출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]]
9. 다음 중 아래의 데이터 거버넌스 체계가 설명하는 항목은?
메타데이터 관리, 데이터 사전 관리, 데이터 생명주기 관리
① 데이터 표준화
② 데이터 관리 체계
③ 데이터 저장소 관리
④ 표준화 활동
정답: 2
출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]]
### 문제의 출제 의도
이 문제는 데이터 거버넌스 체계에서의 주요 개념과 용어들을 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터 거버넌스는 데이터의 품질, 보안, 접근성 등을 보장하기 위한 조직의 정책, 절차 및 책임 체계를 말합니다. 이 문제를 통해 수험생이 데이터 거버넌스의 구성 요소와 그 역할을 정확히 이해하고 있는지 확인하려고 합니다.
### 주요 개념
1. **데이터 거버넌스 (Data Governance)**: 조직 내 데이터의 품질, 보안, 접근성 및 일관성을 보장하기 위해 정책, 절차, 표준 및 책임을 정의하고 실행하는 체계입니다.
2. **메타데이터 관리 (Metadata Management)**: 메타데이터는 데이터를 설명하는 데이터로, 데이터의 의미, 구조, 관리 규칙 등을 정의합니다. 메타데이터 관리는 이러한 정보를 체계적으로 관리하여 데이터의 사용성과 이해도를 높이는 역할을 합니다.
3. **데이터 사전 관리 (Data Dictionary Management)**: 데이터 사전은 데이터베이스에 있는 데이터 요소의 정의와 설명을 제공하는 도구입니다. 데이터 사전 관리는 데이터의 구조와 의미를 명확하게 정의하고 문서화하여 데이터의 일관성을 유지합니다.
4. **데이터 생명주기 관리 (Data Lifecycle Management)**: 데이터의 생성부터 폐기까지의 모든 단계를 관리하는 것을 의미합니다. 데이터 생명주기 관리는 데이터의 저장, 보호, 유지보수, 백업 및 삭제와 같은 활동을 포함합니다.
### 보기 설명
1. **데이터 표준화 (Data Standardization)**: 데이터의 일관성과 정확성을 보장하기 위해 데이터 형식, 정의, 값 등을 표준화하는 활동입니다. 이 보기와는 메타데이터 관리, 데이터 사전 관리, 데이터 생명주기 관리와는 직접적인 연관이 없습니다.
2. **데이터 관리 체계 (Data Management Framework)**: 데이터의 수집, 저장, 관리, 활용을 위한 전반적인 체계를 의미합니다. 메타데이터 관리, 데이터 사전 관리, 데이터 생명주기 관리 모두 데이터 관리 체계의 구성 요소입니다. 따라서 정답은 이 보기입니다.
3. **데이터 저장소 관리 (Data Repository Management)**: 데이터가 저장되는 물리적 또는 논리적 저장소를 관리하는 활동입니다. 이는 데이터 거버넌스 체계의 일부이지만, 문제에서 언급된 메타데이터 관리, 데이터 사전 관리, 데이터 생명주기 관리와는 다소 다른 범주에 속합니다.
4. **표준화 활동 (Standardization Activities)**: 데이터 표준화와 관련된 활동을 의미합니다. 데이터 형식, 정의, 값 등을 표준화하는 활동으로, 데이터 관리 체계와는 다소 다른 범주입니다.
### 정답: 2
**데이터 관리 체계 (Data Management Framework)** 란 메타데이터 관리, 데이터 사전 관리, 데이터 생명주기 관리를 포함하는 포괄적인 데이터 관리 시스템을 의미합니다. 이 체계는 데이터의 품질, 보안, 접근성 및 일관성을 보장하기 위해 필요한 모든 관리 활동을 포함합니다.
---
10. 다음 중 데이터 거버넌스의 구성 요소가 아닌 것은?
① 원칙(Principle)
② 조직(Organization)
③ 데이터 매니지먼트(Data Management)
④ 절차(Process)
정답: 3
출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]]
### 문제의 출제 의도
이 문제는 데이터 거버넌스의 구성 요소를 정확히 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터 거버넌스는 조직 내 데이터의 품질, 보안, 접근성 및 일관성을 보장하기 위한 포괄적인 체계입니다. 이 체계는 다양한 구성 요소로 이루어져 있으며, 각 구성 요소는 데이터 거버넌스의 효과적인 실행을 보장합니다.
### 주요 개념
1. **데이터 거버넌스 (Data Governance)**: 데이터의 품질, 보안, 접근성 및 일관성을 보장하기 위해 조직 내에서 데이터를 관리하고 통제하는 정책, 절차, 조직 및 표준의 체계입니다. 데이터 거버넌스의 주요 구성 요소는 원칙, 조직, 절차 등입니다.
2. **원칙 (Principle)**: 데이터 거버넌스의 근간이 되는 기본 규칙과 가이드라인을 의미합니다. 데이터 관리와 관련된 의사결정을 안내하는 역할을 합니다.
3. **조직 (Organization)**: 데이터 거버넌스를 실행하고 관리하기 위한 조직 구조를 의미합니다. 이는 데이터 관리 책임자, 데이터 소유자, 데이터 관리자 등의 역할과 책임을 포함합니다.
4. **절차 (Process)**: 데이터 관리와 관련된 일련의 절차와 프로세스를 의미합니다. 이는 데이터의 수집, 저장, 처리, 배포, 삭제와 같은 활동을 관리하는 방법을 정의합니다.
5. **데이터 매니지먼트 (Data Management)**: 데이터의 수집, 저장, 유지, 처리, 보호 등을 포함한 전반적인 데이터 관리 활동을 의미합니다. 데이터 거버넌스의 실행을 지원하는 중요한 활동이지만, 데이터 거버넌스의 구성 요소라기보다는 데이터 거버넌스가 지향하는 목표와 활동에 가깝습니다.
### 보기 설명
1. **원칙 (Principle)**: 데이터 거버넌스의 근간을 이루는 기본 규칙과 가이드라인입니다. 데이터 관리와 관련된 의사결정을 안내합니다.
- **적절한 구성 요소입니다.**
2. **조직 (Organization)**: 데이터 거버넌스를 실행하고 관리하기 위한 조직 구조입니다. 데이터 관리 책임자, 데이터 소유자, 데이터 관리자 등의 역할과 책임을 포함합니다.
- **적절한 구성 요소입니다.**
3. **데이터 매니지먼트 (Data Management)**: 데이터의 수집, 저장, 유지, 처리, 보호 등을 포함한 전반적인 데이터 관리 활동입니다. 이는 데이터 거버넌스의 구성 요소가 아니라 데이터 거버넌스의 실행을 지원하는 활동입니다.
- **부적절한 구성 요소입니다.**
4. **절차 (Process)**: 데이터 관리와 관련된 일련의 절차와 프로세스를 의미합니다. 데이터의 수집, 저장, 처리, 배포, 삭제와 같은 활동을 관리하는 방법을 정의합니다.
- **적절한 구성 요소입니다.**
### 정답: 3
**데이터 매니지먼트 (Data Management)**는 데이터 거버넌스의 구성 요소라기보다는 데이터 거버넌스의 실행을 지원하는 활동에 가깝습니다. 데이터 거버넌스의 구성 요소는 원칙, 조직, 절차와 같은 정책 및 구조적 요소들입니다. 따라서 데이터 매니지먼트는 데이터 거버넌스의 구성 요소가 아닙니다.
---
4. 데이터 웨어하우스에 대한 설명으로 가장 적절하지 않은 것은?
① 데이터 웨어하우스는 하나의 통합된 데이터 저장 공간으로 기업 내의 의사결정지원 애플리케이션을 위한 정보 기반을 제공한다.
② ETL을 주기적으로 비/정형 데이터베이스로부터 정보를 추출하고 정제된 규약에 따라 정보를 변환한 후에 데이터 웨어하우스에 정보를 저장한다.
③ 일반적으로 데이터 웨어하우스는 전사적 차원에서 접근하기보다는 제무, 생산, 운영과 같이 특정 조직의 특정 업무 분야에 초점을 맞추어 구축된다.
④ 데이터 웨어하우스에서 관리하는 데이터들은 시간이 흐르며 변하는 값을 유지한다.
정답: 3
출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]]
### 문제의 출제 의도
이 문제는 데이터 웨어하우스의 개념과 주요 특징을 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터 웨어하우스는 조직 내에서 데이터 분석과 의사결정을 지원하기 위해 중요한 역할을 하며, 이를 정확히 이해하는 것이 중요합니다.
### 주요 개념
1. **데이터 웨어하우스 (Data Warehouse)**: 데이터 웨어하우스는 여러 소스에서 데이터를 통합하여 저장하고, 기업 내의 의사결정 지원 애플리케이션을 위해 정보를 제공하는 시스템입니다. 데이터 웨어하우스는 대규모의 데이터를 장기적으로 저장하며, 데이터 분석과 보고를 위해 설계되었습니다.
2. **ETL (Extract, Transform, Load)**: ETL 과정은 데이터 웨어하우스로 데이터를 이동시키기 위해 사용하는 절차입니다. 데이터 소스로부터 데이터를 추출(Extract)하고, 이를 정제하고 변환(Transform)한 후, 데이터 웨어하우스에 적재(Load)합니다.
3. **전사적 차원**: 데이터 웨어하우스는 기업 전체의 데이터를 통합하여 저장하고 관리하는 것을 목표로 합니다. 이는 특정 부서나 업무 분야에 국한되지 않고, 전사적인 관점에서 데이터를 관리합니다.
4. **시간적 데이터**: 데이터 웨어하우스는 데이터를 장기적으로 저장하며, 시간의 흐름에 따라 변하는 데이터를 관리합니다. 이는 데이터 분석에서 과거 데이터를 참조하여 인사이트를 도출하는 데 중요합니다.
### 보기 설명
1. **데이터 웨어하우스는 하나의 통합된 데이터 저장 공간으로 기업 내의 의사결정지원 애플리케이션을 위한 정보 기반을 제공한다.**
- 데이터 웨어하우스의 기본 개념으로, 적절한 설명입니다.
2. **ETL을 주기적으로 비/정형 데이터베이스로부터 정보를 추출하고 정제된 규약에 따라 정보를 변환한 후에 데이터 웨어하우스에 정보를 저장한다.**
- 데이터 웨어하우스 구축에서 ETL 과정은 필수적입니다. 적절한 설명입니다.
3. **일반적으로 데이터 웨어하우스는 전사적 차원에서 접근하기보다는 제무, 생산, 운영과 같이 특정 조직의 특정 업무 분야에 초점을 맞추어 구축된다.**
- 데이터 웨어하우스는 전사적 차원에서 데이터를 통합하여 관리하는 시스템입니다. 특정 부서나 업무에 국한되지 않습니다. 부적절한 설명입니다.
4. **데이터 웨어하우스에서 관리하는 데이터들은 시간이 흐르며 변하는 값을 유지한다.**
- 데이터 웨어하우스는 데이터를 시간의 흐름에 따라 변하는 값으로 관리합니다. 적절한 설명입니다.
### 정답: 3
**일반적으로 데이터 웨어하우스는 전사적 차원에서 접근하기보다는 제무, 생산, 운영과 같이 특정 조직의 특정 업무 분야에 초점을 맞추어 구축된다.**
이 설명은 부적절합니다. 데이터 웨어하우스는 일반적으로 전사적 차원에서 데이터를 통합하여 관리하며, 특정 부서나 업무 분야에 국한되지 않습니다. 데이터 마트(Data Mart)가 특정 부서나 업무 분야에 초점을 맞추어 구축됩니다.
---
8. 다음 중 데이터베이스에 대한 설명으로 가장 적절하지 않은 것은?
① 법률적으로 데이터베이스는 기술을 기반으로 한 일정의 저작물로 인정된다.
② 데이터베이스 내의 모든 데이터는 2차 연관 데이터를 표현한다.
③ 한 조직의 다수 사용자가 공동으로 이용하고 유지하는 공용 데이터이다.
④ DBMS 소프트웨어를 사용하여 데이터베이스를 구축하고 유지한다.
정답: 2
출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]]
### 문제의 출제 의도
이 문제는 데이터베이스의 개념과 특성을 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터베이스는 데이터를 체계적으로 저장, 관리하고 여러 사용자가 공동으로 이용할 수 있도록 하는 중요한 시스템입니다. 이 문제를 통해 수험생이 데이터베이스의 법적 정의, 데이터 특성, 사용자 접근성, 그리고 데이터베이스 관리 시스템(DBMS)의 역할에 대한 이해를 평가하고자 합니다.
### 주요 개념
1. **데이터베이스 (Database)**: 여러 사용자와 애플리케이션이 데이터를 체계적으로 저장, 관리, 검색할 수 있는 시스템입니다. 데이터베이스는 다양한 분야에서 광범위하게 사용되며, 데이터의 일관성, 무결성, 보안을 유지하는 것이 중요합니다.
2. **법적 인정**: 법률적으로 데이터베이스는 기술을 기반으로 한 일정의 저작물로 인정됩니다. 데이터베이스 자체는 지식재산권의 보호를 받을 수 있습니다.
3. **2차 연관 데이터**: 데이터베이스 내의 데이터는 반드시 2차 연관 데이터를 표현하는 것이 아닙니다. 데이터베이스는 1차 데이터, 2차 데이터, 메타데이터 등 다양한 종류의 데이터를 포함할 수 있습니다.
4. **공용 데이터**: 데이터베이스는 한 조직의 여러 사용자가 공동으로 이용하고 유지하는 공용 데이터를 포함합니다. 여러 사용자가 동시에 접근하고 사용할 수 있도록 설계되어 있습니다.
5. **DBMS (Database Management System)**: DBMS는 데이터베이스를 구축하고 유지하기 위한 소프트웨어입니다. 데이터의 저장, 검색, 수정, 삭제 등의 작업을 효율적으로 관리합니다.
### 보기 설명
1. **법률적으로 데이터베이스는 기술을 기반으로 한 일정의 저작물로 인정된다.**
- 데이터베이스는 법률적으로 기술을 기반으로 한 저작물로 인정되며, 지식재산권의 보호를 받습니다.
- **적절한 설명입니다.**
2. **데이터베이스 내의 모든 데이터는 2차 연관 데이터를 표현한다.**
- 데이터베이스 내의 데이터는 반드시 2차 연관 데이터를 표현하는 것이 아닙니다. 데이터베이스에는 1차 데이터, 2차 데이터, 메타데이터 등 다양한 종류의 데이터가 포함될 수 있습니다.
- **부적절한 설명입니다.**
3. **한 조직의 다수 사용자가 공동으로 이용하고 유지하는 공용 데이터이다.**
- 데이터베이스는 여러 사용자가 공동으로 이용하고 유지하는 공용 데이터를 포함합니다.
- **적절한 설명입니다.**
4. **DBMS 소프트웨어를 사용하여 데이터베이스를 구축하고 유지한다.**
- DBMS는 데이터베이스를 구축하고 유지하는 데 필요한 소프트웨어입니다. 데이터를 효율적으로 관리하고 접근할 수 있도록 도와줍니다.
- **적절한 설명입니다.**
### 정답: 2
**데이터베이스 내의 모든 데이터는 2차 연관 데이터를 표현한다.**
이 설명은 부적절합니다. 데이터베이스 내의 데이터는 반드시 2차 연관 데이터를 표현하는 것이 아니며, 1차 데이터, 2차 데이터, 메타데이터 등 다양한 종류의 데이터를 포함할 수 있습니다.
---
4. 데이터베이스의 특징에 대한 설명으로 가장 적절하지 않은 것은?
① 통합된 데이터로 동일한 내용의 데이터가 중복되어 저장된다.
② 변화되는 데이터로 데이터의 삽입, 삭제, 갱신에도 항상 현재의 정확한 데이터를 유지한다.
③ 공용 데이터로 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다.
④ 저장된 데이터는 컴퓨터가 접근할 수 있는 저장매체에 저장된다.
정답: 1
[[06 제37회데이터분석준전문가자격검정시험복원문제.pdf]]
12. 아래에서 설명하는 데이터 거버넌스 체계는?
```
데이터 표준 용어 설정, 명명 규칙 수립, 메타 데이터 구축, 데이터 사전 구축 등의 업무로 구성
```
① 데이터 표준화
② 데이터 관리 체계
③ 데이터 저장소 관리
④ 표준화 활동
정답: 1
[[06 제37회데이터분석준전문가자격검정시험복원문제.pdf]]
### 문제의 출제 의도
이 문제는 데이터 거버넌스 체계에서 데이터 표준화와 관련된 활동을 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터 거버넌스 체계는 조직 내 데이터의 일관성, 정확성, 품질을 보장하기 위해 다양한 활동과 절차를 포함합니다. 이 문제를 통해 수험생이 데이터 표준화의 구체적인 활동과 역할을 이해하고 있는지 확인하고자 합니다.
### 주요 개념
1. **데이터 표준화 (Data Standardization)**: 데이터 표준화는 데이터의 일관성과 정확성을 보장하기 위해 데이터의 정의, 명명 규칙, 메타데이터, 데이터 사전 등을 표준화하는 활동입니다. 이는 데이터의 품질을 향상시키고, 여러 시스템 간의 데이터 통합과 상호 운용성을 높이는 데 중요합니다.
2. **데이터 관리 체계 (Data Management Framework)**: 데이터의 수집, 저장, 관리, 활용을 위한 전반적인 체계를 의미합니다. 데이터 관리 체계는 데이터 거버넌스의 일부로, 데이터 표준화, 데이터 품질 관리, 데이터 보안 등의 활동을 포함합니다.
3. **데이터 저장소 관리 (Data Repository Management)**: 데이터가 저장되는 물리적 또는 논리적 저장소를 관리하는 활동입니다. 이는 데이터의 보존, 백업, 복구, 접근 관리 등을 포함합니다.
4. **표준화 활동 (Standardization Activities)**: 데이터 표준화와 관련된 활동을 의미하며, 데이터의 일관성과 정확성을 보장하기 위해 데이터 정의, 명명 규칙, 메타데이터 관리 등을 포함합니다.
### 보기 설명
1. **데이터 표준화 (Data Standardization)**
- 데이터 표준 용어 설정, 명명 규칙 수립, 메타데이터 구축, 데이터 사전 구축 등의 활동을 포함합니다. 이는 데이터의 일관성과 정확성을 보장하기 위한 활동입니다.
- **적절한 설명입니다.**
2. **데이터 관리 체계 (Data Management Framework)**
- 데이터의 수집, 저장, 관리, 활용을 위한 전반적인 체계를 의미합니다. 데이터 표준화도 포함되지만, 더 넓은 개념입니다.
- **부분적으로 적절하지만, 너무 넓은 범위입니다.**
3. **데이터 저장소 관리 (Data Repository Management)**
- 데이터가 저장되는 물리적 또는 논리적 저장소를 관리하는 활동입니다. 데이터 표준화와는 다른 활동입니다.
- **부적절한 설명입니다.**
4. **표준화 활동 (Standardization Activities)**
- 데이터 표준화와 관련된 활동을 의미하지만, 구체적인 설명이 부족합니다. 데이터 표준화라는 용어가 더 구체적입니다.
- **부분적으로 적절하지만, 덜 구체적입니다.**
### 정답: 1
**데이터 표준화 (Data Standardization)**
데이터 표준 용어 설정, 명명 규칙 수립, 메타데이터 구축, 데이터 사전 구축 등의 업무는 모두 데이터 표준화의 구체적인 활동입니다. 이러한 활동들은 데이터의 일관성과 정확성을 보장하고, 데이터 통합과 상호 운용성을 높이는 데 중요한 역할을 합니다. 따라서 정답은 **데이터 표준화**입니다.
---