데이터 이해 - 데이터베이스의 정의와 특징

1. 데이터베이스의 특징으로 가장 부적절한 것은? ① 데이터베이스는 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용할 수 있도록 구성되어 있다. ② 데이터베이스는 통합된 데이터(Integrated Data)다. ③ 데이터베이스는 변화하는 데이터로 데이터의 삽입, 삭제, 갱신을 한다고 하더라도 항상 현재의 정확한 데이터를 유지해야 한다. ④ 데이터베이스는 검색 기능을 가지고 있으므로 다양한 방법으로 필요한 정보를 검색할 수 있다. 정답: 4 출처: [[01 데이터분석준전문가모의고사(ADsP) 1회.pdf]] ![[Screenshot 2024-08-03 at 10.30.06.png]] ### 문제의 출제 의도 이 문제는 데이터베이스의 정의와 기본적인 특징을 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터베이스는 데이터 관리 시스템의 핵심 요소로, 그 특징을 정확히 이해하는 것은 매우 중요합니다. 이 문제를 통해 수험생이 데이터베이스의 주요 특징과 그 역할을 제대로 파악하고 있는지 확인하고자 합니다. ### 주요 개념 1. **데이터베이스(Database)**: 데이터를 체계적으로 저장, 관리, 검색할 수 있는 시스템입니다. 데이터베이스는 여러 사용자와 응용 프로그램이 데이터를 효과적으로 공유하고 이용할 수 있도록 설계됩니다. 2. **통합된 데이터(Integrated Data)**: 데이터베이스는 중복을 최소화하고 일관성을 유지하기 위해 통합된 형태로 데이터를 저장합니다. 3. **변화하는 데이터(Dynamic Data)**: 데이터베이스는 데이터를 삽입, 삭제, 갱신하면서도 항상 현재의 정확한 데이터를 유지해야 합니다. 4. **공동 이용(Shared Data)**: 데이터베이스는 여러 사용자가 동시에 데이터를 접근하고 사용할 수 있도록 설계되어 있습니다. 5. **검색 기능**: 데이터베이스는 다양한 방법으로 데이터를 검색할 수 있는 강력한 검색 기능을 제공합니다. ### 보기 설명 1. **데이터베이스는 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용할 수 있도록 구성되어 있다.** - 데이터베이스는 다중 사용자 환경을 지원하며, 여러 사용자가 다양한 목적을 위해 데이터를 공동으로 사용할 수 있습니다. - **적절한 설명입니다.** 2. **데이터베이스는 통합된 데이터(Integrated Data)다.** - 데이터베이스는 데이터를 중복 없이 통합하여 저장하는 것을 목표로 합니다. - **적절한 설명입니다.** 3. **데이터베이스는 변화하는 데이터로 데이터의 삽입, 삭제, 갱신을 한다고 하더라도 항상 현재의 정확한 데이터를 유지해야 한다.** - 데이터베이스는 데이터의 변경이 있을 때마다 항상 최신의 정확한 데이터를 유지하도록 설계되어 있습니다. - **적절한 설명입니다.** 4. **데이터베이스는 검색 기능을 가지고 있으므로 다양한 방법으로 필요한 정보를 검색할 수 있다.** - 데이터베이스는 강력한 검색 기능을 제공하지만, 검색 기능은 데이터베이스의 특징이라기보다는 데이터베이스 관리 시스템(DBMS)의 기능입니다. 데이터베이스 자체는 데이터를 저장하는 구조입니다. - **부적절한 설명입니다.** ### 정답: 4 **데이터베이스는 검색 기능을 가지고 있으므로 다양한 방법으로 필요한 정보를 검색할 수 있다.** 검색 기능은 데이터베이스의 특징이라기보다는 데이터베이스 관리 시스템(DBMS)의 기능입니다. 데이터베이스는 데이터를 저장하고 관리하는 시스템이며, 검색 기능은 이를 활용하는 도구로서의 역할을 합니다. 따라서 ④번 설명이 부적절합니다. --- 03. 다음 중 DBMS(Database Management System)에 관한 설명 중 틀린 것은? ① 데이터베이스는 정의, 조작, 제어라는 3가지 필수 기능이 있다. ② 데이터베이스를 관리하고 운영하는 소프트웨어를 말한다. ③ 데이터베이스에 있는 모든 데이터는 분석이 가능하다. ④ 계층형(Hierarchical), 망형(Network), 관계형(Relational), 객체지향형(Object-Oriented), 객체관계형(Object-Relational) 등으로 분류된다. 정답: 3 출처: [[03 제34회데이터분석준전문가자격검정시험복원문제.pdf]] ### 문제의 출제 의도 이 문제는 데이터베이스 관리 시스템(DBMS)의 정의와 기능, 그리고 그 특징을 이해하고 있는지를 평가하기 위해 출제되었습니다. DBMS는 데이터베이스를 효율적으로 관리하고 운영하기 위해 필수적인 소프트웨어로, 그 역할과 특성을 정확히 이해하는 것이 중요합니다. ### 주요 개념 1. **DBMS (Database Management System)**: 데이터베이스를 정의하고, 조작하며, 제어하는 소프트웨어 시스템입니다. DBMS는 데이터의 저장, 관리, 검색, 업데이트, 보안, 백업 등의 기능을 제공합니다. 2. **데이터베이스의 필수 기능**: DBMS는 데이터베이스의 정의, 조작, 제어라는 세 가지 필수 기능을 가지고 있습니다. - **정의(Definition)**: 데이터베이스 구조를 정의하는 기능입니다. 데이터 모델링과 스키마 설계를 포함합니다. - **조작(Manipulation)**: 데이터를 삽입, 삭제, 수정, 검색하는 기능입니다. - **제어(Control)**: 데이터베이스의 접근 제어, 무결성, 보안, 회복 기능을 제공합니다. 3. **데이터베이스의 관리 및 운영**: DBMS는 데이터베이스를 효율적으로 관리하고 운영하기 위한 소프트웨어입니다. 이는 데이터베이스의 성능 최적화, 사용자 관리, 백업 및 복구 등을 포함합니다. 4. **데이터베이스의 분류**: 데이터베이스는 다양한 데이터 모델에 따라 분류됩니다. 주요 분류는 계층형, 망형, 관계형, 객체지향형, 객체관계형 등이 있습니다. 5. **데이터 분석 가능성**: 데이터베이스에 저장된 모든 데이터가 분석 가능한 것은 아니며, 데이터의 분석 가능 여부는 데이터의 구조, 데이터 품질, 접근 권한 등에 따라 달라집니다. ### 보기 설명 1. **데이터베이스는 정의, 조작, 제어라는 3가지 필수 기능이 있다.** - DBMS의 핵심 기능으로, 데이터베이스 구조의 정의, 데이터의 조작, 데이터 접근 및 보안의 제어가 포함됩니다. - **적절한 설명입니다.** 2. **데이터베이스를 관리하고 운영하는 소프트웨어를 말한다.** - DBMS는 데이터베이스의 관리 및 운영을 담당하는 소프트웨어입니다. - **적절한 설명입니다.** 3. **데이터베이스에 있는 모든 데이터는 분석이 가능하다.** - 모든 데이터가 분석 가능한 것은 아닙니다. 데이터의 구조, 품질, 형식, 접근 권한 등에 따라 분석 가능 여부가 달라집니다. - **부적절한 설명입니다.** 4. **계층형(Hierarchical), 망형(Network), 관계형(Relational), 객체지향형(Object-Oriented), 객체관계형(Object-Relational) 등으로 분류된다.** - 데이터베이스는 다양한 데이터 모델에 따라 이러한 방식으로 분류됩니다. - **적절한 설명입니다.** ### 정답: 3 **데이터베이스에 있는 모든 데이터는 분석이 가능하다.** 모든 데이터가 분석 가능한 것은 아닙니다. 데이터의 분석 가능 여부는 데이터의 구조, 품질, 접근 권한, 저장 형식 등에 따라 달라집니다. 따라서 ③번 설명이 틀렸습니다. --- 03. 아래에서 설명하는 (가)는 무엇인가? (가)는 식별된 비즈니스 문제를 데이터의 문제로 변환하여 정의하는 단계 ( ) 정답: 문제정의 출처: [[03 제34회데이터분석준전문가자격검정시험복원문제.pdf]] ### 문제의 출제 의도 이 문제는 데이터 분석 프로젝트의 단계 중 비즈니스 문제를 데이터 문제로 변환하는 특정 단계를 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터 분석 프로젝트는 여러 단계로 이루어지며, 각 단계는 프로젝트의 성공에 중요한 역할을 합니다. ### 주요 개념 1. **비즈니스 문제**: 조직에서 해결해야 할 실제 문제로, 데이터 분석을 통해 해결할 수 있습니다. 2. **데이터 문제**: 비즈니스 문제를 해결하기 위해 필요한 데이터 분석의 관점에서 정의된 문제입니다. 3. **문제 정의 단계**: 데이터 분석 프로젝트의 초기 단계로, 비즈니스 문제를 명확히 이해하고 이를 데이터 문제로 변환하여 정의하는 과정입니다. 이는 프로젝트의 방향을 설정하는 중요한 단계입니다. ### (가)에 해당하는 단계 **(가)**는 데이터 분석 프로젝트에서 비즈니스 문제를 데이터의 문제로 변환하여 정의하는 단계로, 이는 데이터 분석 프로젝트의 초기 단계입니다. 이 단계는 문제를 명확히 이해하고, 분석 목표를 설정하며, 필요한 데이터를 식별하는 과정입니다. 이 단계는 다음과 같은 과정을 포함합니다: - 비즈니스 문제 이해 - 분석 목표 설정 - 데이터 요구사항 정의 - 데이터 수집 계획 수립 이 단계를 통해 비즈니스 문제를 데이터 분석의 관점에서 명확하게 정의하고, 이를 해결하기 위한 데이터 분석 계획을 수립합니다. ### 답: 문제 정의 단계 **문제 정의 단계**는 비즈니스 문제를 데이터 문제로 변환하여 정의하는 단계입니다. 이는 데이터 분석 프로젝트의 성공을 위한 중요한 첫 단계로, 명확한 문제 정의가 없으면 이후의 데이터 수집, 분석, 모델링 등의 단계가 방향을 잃을 수 있습니다. **정답**: 문제 정의 단계 --- 04. 다음 중 빈칸에 공통으로 들어갈 알맞은 단어를 적으시오. ( )란 전사차원의 모든 데이터에 대하여 정책 및 지침, 표준화, 운영조직 및 책임등의 표준화된 관리체계를 수립하고 운영을 위한 프레임워크(Framework) 및 저장소(Repository)를 구축하는 것을 말한다. 특히 마스터 데이터(Master Data), 메타 데이터(Meta Data), 데이터 사전(Data Dictionary)은 ( )의 중요한 관리 대상이다. ( ) 정답: 데이터 거버넌스 출처: [[03 제34회데이터분석준전문가자격검정시험복원문제.pdf]] ### 문제의 출제 의도 이 문제는 데이터 관리 체계의 한 부분으로서 데이터 거버넌스의 개념을 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터 거버넌스는 조직 내 모든 데이터에 대한 관리 정책, 절차 및 책임을 정의하고 운영하는 체계를 의미합니다. ### 주요 개념 1. **데이터 거버넌스 (Data Governance)**: 전사적 데이터 관리 체계로, 데이터의 품질, 보안, 개인정보 보호, 데이터 사용의 표준화 등을 포함한 데이터 관리 정책과 절차를 정의하고 운영하는 것입니다. 데이터 거버넌스는 조직 내 데이터의 효율적이고 일관된 관리와 사용을 보장합니다. 2. **마스터 데이터 (Master Data)**: 조직의 주요 엔티티(고객, 제품, 공급업체 등)에 관한 핵심 데이터로, 다양한 시스템과 프로세스에서 일관되게 사용되는 데이터입니다. 3. **메타 데이터 (Meta Data)**: 데이터에 대한 데이터로, 데이터의 정의, 구조, 관계, 사용 방법 등을 설명합니다. 메타 데이터는 데이터 관리와 검색을 용이하게 합니다. 4. **데이터 사전 (Data Dictionary)**: 데이터베이스나 데이터 웨어하우스에서 사용되는 데이터 요소에 대한 정의와 설명을 제공하는 도구로, 데이터의 구조와 의미를 이해하는 데 도움을 줍니다. ### 빈칸에 들어갈 단어 데이터 거버넌스 (Data Governance) 란 전사차원의 모든 데이터에 대하여 정책 및 지침, 표준화, 운영조직 및 책임 등의 표준화된 관리체계를 수립하고 운영을 위한 프레임워크(Framework) 및 저장소(Repository)를 구축하는 것을 말합니다. 특히 마스터 데이터(Master Data), 메타 데이터(Meta Data), 데이터 사전(Data Dictionary)은 데이터 거버넌스의 중요한 관리 대상입니다. **정답**: 데이터 거버넌스 --- 05. 다음 내용이 설명하고 있는 단어를 적으시오. 이것은 배깅에 랜덤과정을 추가한 방법이다. 원 자료로부터 부스트랩 샘플을 추출하고, 각 부스트랩 샘플에 대해 트리를 형성해 나가는 과정은 배깅과 유사하나, 각 노드마다 모두 예측변수 안에서 최적의 분할을 선택하는 방법 대신 예측변수를 임의로 추출하고 추출된 변수 내에서 최적의 분할을 만들어 나가는 방법을 사용한다. ( ) 정답: 랜덤 포레스트 출처: [[03 제34회데이터분석준전문가자격검정시험복원문제.pdf]] ### 문제의 출제 의도 이 문제는 머신러닝 알고리즘 중 하나인 랜덤 포레스트(Random Forest)의 개념과 특징을 이해하고 있는지를 평가하기 위해 출제되었습니다. 랜덤 포레스트는 앙상블 학습 방법 중 하나로, 다수의 결정 트리를 통해 예측 성능을 향상시키는 기법입니다. ### 주요 개념 1. **부스트랩 샘플링 (Bootstrap Sampling)**: 원본 데이터에서 여러 번의 복원 추출을 통해 새로운 샘플을 생성하는 방법입니다. 각 샘플은 원본 데이터와 동일한 크기를 가지며, 일부 데이터는 여러 번 추출될 수 있습니다. 2. **배깅 (Bagging, Bootstrap Aggregating)**: 여러 부스트랩 샘플을 사용해 각각의 모델을 학습시키고, 그 예측 결과를 평균 내거나 다수결 투표를 통해 최종 예측을 만드는 앙상블 학습 방법입니다. 배깅은 모델의 분산을 줄여 성능을 향상시킵니다. 3. **랜덤 포레스트 (Random Forest)**: 배깅의 확장으로, 각 결정 트리를 학습할 때 모든 예측변수를 고려하는 대신, 각 노드에서 임의로 선택된 예측변수들 중 최적의 분할을 선택합니다. 이는 트리 간의 상관성을 줄이고, 예측 성능과 일반화 능력을 향상시킵니다. ### 빈칸에 들어갈 단어 **랜덤 포레스트 (Random Forest)** 는 배경에 랜덤과정을 추가한 방법으로, 원 자료로부터 부스트랩 샘플을 추출하고, 각 부스트랩 샘플에 대해 트리를 형성해 나가는 과정은 배깅과 유사하지만, 각 노드마다 모두 예측변수 안에서 최적의 분할을 선택하는 방법 대신 예측변수를 임의로 추출하고 추출된 변수 내에서 최적의 분할을 만들어 나가는 방법을 사용합니다. **정답**: 랜덤 포레스트 ```python import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn.ensemble import RandomForestClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score, confusion_matrix, ConfusionMatrixDisplay # 샘플 데이터셋 생성 data = { 'Feature 1': [5, 7, 4, 6, 8, 9], 'Feature 2': [2, 3, 4, 5, 6, 1], 'Target': ['Yes', 'No', 'Yes', 'No', 'Yes', 'No'] } # 데이터프레임으로 변환 df = pd.DataFrame(data) # 특성과 타겟 분리 X = df[['Feature 1', 'Feature 2']] y = df['Target'] # 학습용 데이터와 테스트용 데이터로 분리 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # 랜덤 포레스트 모델 생성 clf = RandomForestClassifier(n_estimators=100, random_state=42) # 모델 학습 clf.fit(X_train, y_train) # 예측 y_pred = clf.predict(X_test) # 정확도 평가 accuracy = accuracy_score(y_test, y_pred) print(f'Accuracy: {accuracy:.2f}') # 혼동 행렬 시각화 cm = confusion_matrix(y_test, y_pred, labels=clf.classes_) disp = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=clf.classes_) disp.plot() plt.title('Confusion Matrix') plt.show() # 데이터 시각화 plt.figure(figsize=(10, 5)) # 학습 데이터 시각화 plt.subplot(1, 2, 1) plt.scatter(X_train['Feature 1'], X_train['Feature 2'], c=[{'Yes': 'blue', 'No': 'red'}[label] for label in y_train], marker='o') plt.title('Training Data') plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.grid(True) # 테스트 데이터와 예측 결과 시각화 plt.subplot(1, 2, 2) plt.scatter(X_test['Feature 1'], X_test['Feature 2'], c=[{'Yes': 'blue', 'No': 'red'}[label] for label in y_test], marker='o', label='Actual') plt.scatter(X_test['Feature 1'], X_test['Feature 2'], c=[{'Yes': 'lightblue', 'No': 'lightcoral'}[label] for label in y_pred], marker='x', label='Predicted') plt.title('Test Data and Predictions') plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.legend() plt.grid(True) plt.tight_layout() plt.show() ``` --- 8. 다음 중 사용자와 데이터베이스 사이에서 사용자의 요구에 따라 정보를 처리해주고 데이터베이스를 관리해 주는 소프트웨어는 무엇인가? ① SQL ② ERD ③ Data Dictionary ④ DBMS 정답: 4 출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]] 9. 다음 중 아래의 데이터 거버넌스 체계가 설명하는 항목은? 메타데이터 관리, 데이터 사전 관리, 데이터 생명주기 관리 ① 데이터 표준화 ② 데이터 관리 체계 ③ 데이터 저장소 관리 ④ 표준화 활동 정답: 2 출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]] ### 문제의 출제 의도 이 문제는 데이터 거버넌스 체계에서의 주요 개념과 용어들을 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터 거버넌스는 데이터의 품질, 보안, 접근성 등을 보장하기 위한 조직의 정책, 절차 및 책임 체계를 말합니다. 이 문제를 통해 수험생이 데이터 거버넌스의 구성 요소와 그 역할을 정확히 이해하고 있는지 확인하려고 합니다. ### 주요 개념 1. **데이터 거버넌스 (Data Governance)**: 조직 내 데이터의 품질, 보안, 접근성 및 일관성을 보장하기 위해 정책, 절차, 표준 및 책임을 정의하고 실행하는 체계입니다. 2. **메타데이터 관리 (Metadata Management)**: 메타데이터는 데이터를 설명하는 데이터로, 데이터의 의미, 구조, 관리 규칙 등을 정의합니다. 메타데이터 관리는 이러한 정보를 체계적으로 관리하여 데이터의 사용성과 이해도를 높이는 역할을 합니다. 3. **데이터 사전 관리 (Data Dictionary Management)**: 데이터 사전은 데이터베이스에 있는 데이터 요소의 정의와 설명을 제공하는 도구입니다. 데이터 사전 관리는 데이터의 구조와 의미를 명확하게 정의하고 문서화하여 데이터의 일관성을 유지합니다. 4. **데이터 생명주기 관리 (Data Lifecycle Management)**: 데이터의 생성부터 폐기까지의 모든 단계를 관리하는 것을 의미합니다. 데이터 생명주기 관리는 데이터의 저장, 보호, 유지보수, 백업 및 삭제와 같은 활동을 포함합니다. ### 보기 설명 1. **데이터 표준화 (Data Standardization)**: 데이터의 일관성과 정확성을 보장하기 위해 데이터 형식, 정의, 값 등을 표준화하는 활동입니다. 이 보기와는 메타데이터 관리, 데이터 사전 관리, 데이터 생명주기 관리와는 직접적인 연관이 없습니다. 2. **데이터 관리 체계 (Data Management Framework)**: 데이터의 수집, 저장, 관리, 활용을 위한 전반적인 체계를 의미합니다. 메타데이터 관리, 데이터 사전 관리, 데이터 생명주기 관리 모두 데이터 관리 체계의 구성 요소입니다. 따라서 정답은 이 보기입니다. 3. **데이터 저장소 관리 (Data Repository Management)**: 데이터가 저장되는 물리적 또는 논리적 저장소를 관리하는 활동입니다. 이는 데이터 거버넌스 체계의 일부이지만, 문제에서 언급된 메타데이터 관리, 데이터 사전 관리, 데이터 생명주기 관리와는 다소 다른 범주에 속합니다. 4. **표준화 활동 (Standardization Activities)**: 데이터 표준화와 관련된 활동을 의미합니다. 데이터 형식, 정의, 값 등을 표준화하는 활동으로, 데이터 관리 체계와는 다소 다른 범주입니다. ### 정답: 2 **데이터 관리 체계 (Data Management Framework)** 란 메타데이터 관리, 데이터 사전 관리, 데이터 생명주기 관리를 포함하는 포괄적인 데이터 관리 시스템을 의미합니다. 이 체계는 데이터의 품질, 보안, 접근성 및 일관성을 보장하기 위해 필요한 모든 관리 활동을 포함합니다. --- 10. 다음 중 데이터 거버넌스의 구성 요소가 아닌 것은? ① 원칙(Principle) ② 조직(Organization) ③ 데이터 매니지먼트(Data Management) ④ 절차(Process) 정답: 3 출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]] ### 문제의 출제 의도 이 문제는 데이터 거버넌스의 구성 요소를 정확히 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터 거버넌스는 조직 내 데이터의 품질, 보안, 접근성 및 일관성을 보장하기 위한 포괄적인 체계입니다. 이 체계는 다양한 구성 요소로 이루어져 있으며, 각 구성 요소는 데이터 거버넌스의 효과적인 실행을 보장합니다. ### 주요 개념 1. **데이터 거버넌스 (Data Governance)**: 데이터의 품질, 보안, 접근성 및 일관성을 보장하기 위해 조직 내에서 데이터를 관리하고 통제하는 정책, 절차, 조직 및 표준의 체계입니다. 데이터 거버넌스의 주요 구성 요소는 원칙, 조직, 절차 등입니다. 2. **원칙 (Principle)**: 데이터 거버넌스의 근간이 되는 기본 규칙과 가이드라인을 의미합니다. 데이터 관리와 관련된 의사결정을 안내하는 역할을 합니다. 3. **조직 (Organization)**: 데이터 거버넌스를 실행하고 관리하기 위한 조직 구조를 의미합니다. 이는 데이터 관리 책임자, 데이터 소유자, 데이터 관리자 등의 역할과 책임을 포함합니다. 4. **절차 (Process)**: 데이터 관리와 관련된 일련의 절차와 프로세스를 의미합니다. 이는 데이터의 수집, 저장, 처리, 배포, 삭제와 같은 활동을 관리하는 방법을 정의합니다. 5. **데이터 매니지먼트 (Data Management)**: 데이터의 수집, 저장, 유지, 처리, 보호 등을 포함한 전반적인 데이터 관리 활동을 의미합니다. 데이터 거버넌스의 실행을 지원하는 중요한 활동이지만, 데이터 거버넌스의 구성 요소라기보다는 데이터 거버넌스가 지향하는 목표와 활동에 가깝습니다. ### 보기 설명 1. **원칙 (Principle)**: 데이터 거버넌스의 근간을 이루는 기본 규칙과 가이드라인입니다. 데이터 관리와 관련된 의사결정을 안내합니다. - **적절한 구성 요소입니다.** 2. **조직 (Organization)**: 데이터 거버넌스를 실행하고 관리하기 위한 조직 구조입니다. 데이터 관리 책임자, 데이터 소유자, 데이터 관리자 등의 역할과 책임을 포함합니다. - **적절한 구성 요소입니다.** 3. **데이터 매니지먼트 (Data Management)**: 데이터의 수집, 저장, 유지, 처리, 보호 등을 포함한 전반적인 데이터 관리 활동입니다. 이는 데이터 거버넌스의 구성 요소가 아니라 데이터 거버넌스의 실행을 지원하는 활동입니다. - **부적절한 구성 요소입니다.** 4. **절차 (Process)**: 데이터 관리와 관련된 일련의 절차와 프로세스를 의미합니다. 데이터의 수집, 저장, 처리, 배포, 삭제와 같은 활동을 관리하는 방법을 정의합니다. - **적절한 구성 요소입니다.** ### 정답: 3 **데이터 매니지먼트 (Data Management)**는 데이터 거버넌스의 구성 요소라기보다는 데이터 거버넌스의 실행을 지원하는 활동에 가깝습니다. 데이터 거버넌스의 구성 요소는 원칙, 조직, 절차와 같은 정책 및 구조적 요소들입니다. 따라서 데이터 매니지먼트는 데이터 거버넌스의 구성 요소가 아닙니다. --- 4. 데이터 웨어하우스에 대한 설명으로 가장 적절하지 않은 것은? ① 데이터 웨어하우스는 하나의 통합된 데이터 저장 공간으로 기업 내의 의사결정지원 애플리케이션을 위한 정보 기반을 제공한다. ② ETL을 주기적으로 비/정형 데이터베이스로부터 정보를 추출하고 정제된 규약에 따라 정보를 변환한 후에 데이터 웨어하우스에 정보를 저장한다. ③ 일반적으로 데이터 웨어하우스는 전사적 차원에서 접근하기보다는 제무, 생산, 운영과 같이 특정 조직의 특정 업무 분야에 초점을 맞추어 구축된다. ④ 데이터 웨어하우스에서 관리하는 데이터들은 시간이 흐르며 변하는 값을 유지한다. 정답: 3 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] ### 문제의 출제 의도 이 문제는 데이터 웨어하우스의 개념과 주요 특징을 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터 웨어하우스는 조직 내에서 데이터 분석과 의사결정을 지원하기 위해 중요한 역할을 하며, 이를 정확히 이해하는 것이 중요합니다. ### 주요 개념 1. **데이터 웨어하우스 (Data Warehouse)**: 데이터 웨어하우스는 여러 소스에서 데이터를 통합하여 저장하고, 기업 내의 의사결정 지원 애플리케이션을 위해 정보를 제공하는 시스템입니다. 데이터 웨어하우스는 대규모의 데이터를 장기적으로 저장하며, 데이터 분석과 보고를 위해 설계되었습니다. 2. **ETL (Extract, Transform, Load)**: ETL 과정은 데이터 웨어하우스로 데이터를 이동시키기 위해 사용하는 절차입니다. 데이터 소스로부터 데이터를 추출(Extract)하고, 이를 정제하고 변환(Transform)한 후, 데이터 웨어하우스에 적재(Load)합니다. 3. **전사적 차원**: 데이터 웨어하우스는 기업 전체의 데이터를 통합하여 저장하고 관리하는 것을 목표로 합니다. 이는 특정 부서나 업무 분야에 국한되지 않고, 전사적인 관점에서 데이터를 관리합니다. 4. **시간적 데이터**: 데이터 웨어하우스는 데이터를 장기적으로 저장하며, 시간의 흐름에 따라 변하는 데이터를 관리합니다. 이는 데이터 분석에서 과거 데이터를 참조하여 인사이트를 도출하는 데 중요합니다. ### 보기 설명 1. **데이터 웨어하우스는 하나의 통합된 데이터 저장 공간으로 기업 내의 의사결정지원 애플리케이션을 위한 정보 기반을 제공한다.** - 데이터 웨어하우스의 기본 개념으로, 적절한 설명입니다. 2. **ETL을 주기적으로 비/정형 데이터베이스로부터 정보를 추출하고 정제된 규약에 따라 정보를 변환한 후에 데이터 웨어하우스에 정보를 저장한다.** - 데이터 웨어하우스 구축에서 ETL 과정은 필수적입니다. 적절한 설명입니다. 3. **일반적으로 데이터 웨어하우스는 전사적 차원에서 접근하기보다는 제무, 생산, 운영과 같이 특정 조직의 특정 업무 분야에 초점을 맞추어 구축된다.** - 데이터 웨어하우스는 전사적 차원에서 데이터를 통합하여 관리하는 시스템입니다. 특정 부서나 업무에 국한되지 않습니다. 부적절한 설명입니다. 4. **데이터 웨어하우스에서 관리하는 데이터들은 시간이 흐르며 변하는 값을 유지한다.** - 데이터 웨어하우스는 데이터를 시간의 흐름에 따라 변하는 값으로 관리합니다. 적절한 설명입니다. ### 정답: 3 **일반적으로 데이터 웨어하우스는 전사적 차원에서 접근하기보다는 제무, 생산, 운영과 같이 특정 조직의 특정 업무 분야에 초점을 맞추어 구축된다.** 이 설명은 부적절합니다. 데이터 웨어하우스는 일반적으로 전사적 차원에서 데이터를 통합하여 관리하며, 특정 부서나 업무 분야에 국한되지 않습니다. 데이터 마트(Data Mart)가 특정 부서나 업무 분야에 초점을 맞추어 구축됩니다. --- 8. 다음 중 데이터베이스에 대한 설명으로 가장 적절하지 않은 것은? ① 법률적으로 데이터베이스는 기술을 기반으로 한 일정의 저작물로 인정된다. ② 데이터베이스 내의 모든 데이터는 2차 연관 데이터를 표현한다. ③ 한 조직의 다수 사용자가 공동으로 이용하고 유지하는 공용 데이터이다. ④ DBMS 소프트웨어를 사용하여 데이터베이스를 구축하고 유지한다. 정답: 2 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] ### 문제의 출제 의도 이 문제는 데이터베이스의 개념과 특성을 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터베이스는 데이터를 체계적으로 저장, 관리하고 여러 사용자가 공동으로 이용할 수 있도록 하는 중요한 시스템입니다. 이 문제를 통해 수험생이 데이터베이스의 법적 정의, 데이터 특성, 사용자 접근성, 그리고 데이터베이스 관리 시스템(DBMS)의 역할에 대한 이해를 평가하고자 합니다. ### 주요 개념 1. **데이터베이스 (Database)**: 여러 사용자와 애플리케이션이 데이터를 체계적으로 저장, 관리, 검색할 수 있는 시스템입니다. 데이터베이스는 다양한 분야에서 광범위하게 사용되며, 데이터의 일관성, 무결성, 보안을 유지하는 것이 중요합니다. 2. **법적 인정**: 법률적으로 데이터베이스는 기술을 기반으로 한 일정의 저작물로 인정됩니다. 데이터베이스 자체는 지식재산권의 보호를 받을 수 있습니다. 3. **2차 연관 데이터**: 데이터베이스 내의 데이터는 반드시 2차 연관 데이터를 표현하는 것이 아닙니다. 데이터베이스는 1차 데이터, 2차 데이터, 메타데이터 등 다양한 종류의 데이터를 포함할 수 있습니다. 4. **공용 데이터**: 데이터베이스는 한 조직의 여러 사용자가 공동으로 이용하고 유지하는 공용 데이터를 포함합니다. 여러 사용자가 동시에 접근하고 사용할 수 있도록 설계되어 있습니다. 5. **DBMS (Database Management System)**: DBMS는 데이터베이스를 구축하고 유지하기 위한 소프트웨어입니다. 데이터의 저장, 검색, 수정, 삭제 등의 작업을 효율적으로 관리합니다. ### 보기 설명 1. **법률적으로 데이터베이스는 기술을 기반으로 한 일정의 저작물로 인정된다.** - 데이터베이스는 법률적으로 기술을 기반으로 한 저작물로 인정되며, 지식재산권의 보호를 받습니다. - **적절한 설명입니다.** 2. **데이터베이스 내의 모든 데이터는 2차 연관 데이터를 표현한다.** - 데이터베이스 내의 데이터는 반드시 2차 연관 데이터를 표현하는 것이 아닙니다. 데이터베이스에는 1차 데이터, 2차 데이터, 메타데이터 등 다양한 종류의 데이터가 포함될 수 있습니다. - **부적절한 설명입니다.** 3. **한 조직의 다수 사용자가 공동으로 이용하고 유지하는 공용 데이터이다.** - 데이터베이스는 여러 사용자가 공동으로 이용하고 유지하는 공용 데이터를 포함합니다. - **적절한 설명입니다.** 4. **DBMS 소프트웨어를 사용하여 데이터베이스를 구축하고 유지한다.** - DBMS는 데이터베이스를 구축하고 유지하는 데 필요한 소프트웨어입니다. 데이터를 효율적으로 관리하고 접근할 수 있도록 도와줍니다. - **적절한 설명입니다.** ### 정답: 2 **데이터베이스 내의 모든 데이터는 2차 연관 데이터를 표현한다.** 이 설명은 부적절합니다. 데이터베이스 내의 데이터는 반드시 2차 연관 데이터를 표현하는 것이 아니며, 1차 데이터, 2차 데이터, 메타데이터 등 다양한 종류의 데이터를 포함할 수 있습니다. --- 4. 데이터베이스의 특징에 대한 설명으로 가장 적절하지 않은 것은? ① 통합된 데이터로 동일한 내용의 데이터가 중복되어 저장된다. ② 변화되는 데이터로 데이터의 삽입, 삭제, 갱신에도 항상 현재의 정확한 데이터를 유지한다. ③ 공용 데이터로 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다. ④ 저장된 데이터는 컴퓨터가 접근할 수 있는 저장매체에 저장된다. 정답: 1 [[06 제37회데이터분석준전문가자격검정시험복원문제.pdf]] 12. 아래에서 설명하는 데이터 거버넌스 체계는? ``` 데이터 표준 용어 설정, 명명 규칙 수립, 메타 데이터 구축, 데이터 사전 구축 등의 업무로 구성 ``` ① 데이터 표준화 ② 데이터 관리 체계 ③ 데이터 저장소 관리 ④ 표준화 활동 정답: 1 [[06 제37회데이터분석준전문가자격검정시험복원문제.pdf]] ### 문제의 출제 의도 이 문제는 데이터 거버넌스 체계에서 데이터 표준화와 관련된 활동을 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터 거버넌스 체계는 조직 내 데이터의 일관성, 정확성, 품질을 보장하기 위해 다양한 활동과 절차를 포함합니다. 이 문제를 통해 수험생이 데이터 표준화의 구체적인 활동과 역할을 이해하고 있는지 확인하고자 합니다. ### 주요 개념 1. **데이터 표준화 (Data Standardization)**: 데이터 표준화는 데이터의 일관성과 정확성을 보장하기 위해 데이터의 정의, 명명 규칙, 메타데이터, 데이터 사전 등을 표준화하는 활동입니다. 이는 데이터의 품질을 향상시키고, 여러 시스템 간의 데이터 통합과 상호 운용성을 높이는 데 중요합니다. 2. **데이터 관리 체계 (Data Management Framework)**: 데이터의 수집, 저장, 관리, 활용을 위한 전반적인 체계를 의미합니다. 데이터 관리 체계는 데이터 거버넌스의 일부로, 데이터 표준화, 데이터 품질 관리, 데이터 보안 등의 활동을 포함합니다. 3. **데이터 저장소 관리 (Data Repository Management)**: 데이터가 저장되는 물리적 또는 논리적 저장소를 관리하는 활동입니다. 이는 데이터의 보존, 백업, 복구, 접근 관리 등을 포함합니다. 4. **표준화 활동 (Standardization Activities)**: 데이터 표준화와 관련된 활동을 의미하며, 데이터의 일관성과 정확성을 보장하기 위해 데이터 정의, 명명 규칙, 메타데이터 관리 등을 포함합니다. ### 보기 설명 1. **데이터 표준화 (Data Standardization)** - 데이터 표준 용어 설정, 명명 규칙 수립, 메타데이터 구축, 데이터 사전 구축 등의 활동을 포함합니다. 이는 데이터의 일관성과 정확성을 보장하기 위한 활동입니다. - **적절한 설명입니다.** 2. **데이터 관리 체계 (Data Management Framework)** - 데이터의 수집, 저장, 관리, 활용을 위한 전반적인 체계를 의미합니다. 데이터 표준화도 포함되지만, 더 넓은 개념입니다. - **부분적으로 적절하지만, 너무 넓은 범위입니다.** 3. **데이터 저장소 관리 (Data Repository Management)** - 데이터가 저장되는 물리적 또는 논리적 저장소를 관리하는 활동입니다. 데이터 표준화와는 다른 활동입니다. - **부적절한 설명입니다.** 4. **표준화 활동 (Standardization Activities)** - 데이터 표준화와 관련된 활동을 의미하지만, 구체적인 설명이 부족합니다. 데이터 표준화라는 용어가 더 구체적입니다. - **부분적으로 적절하지만, 덜 구체적입니다.** ### 정답: 1 **데이터 표준화 (Data Standardization)** 데이터 표준 용어 설정, 명명 규칙 수립, 메타데이터 구축, 데이터 사전 구축 등의 업무는 모두 데이터 표준화의 구체적인 활동입니다. 이러한 활동들은 데이터의 일관성과 정확성을 보장하고, 데이터 통합과 상호 운용성을 높이는 데 중요한 역할을 합니다. 따라서 정답은 **데이터 표준화**입니다. ---