[[데이터 이해 - 데이터와 정보]] 1. 개인정보 비식별화 기법에 대한 설명으로 가장 적절하지 않은 것은? ① 가명처리 - 개인 식별이 가능한 데이터에 대하여 직접적으로 식별 할 수 없는 다른 값으로 대체 ② 범주화 - 개인 식별 정보를 해당 그룹의 대표 값으로 변환 ③ 데이터마스킹 - 개인 정보 식별이 가능한 특정 데이터 값 삭제 처리 ④ 총체처리 - 개별 데이터 값을 총합 또는 평균값으로 대체하는 것 정답: 3 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 이해 - 데이터와 정보]] 2. 다음 중 데이터에 대한 설명으로 가장 적절하지 않은 것은? ① 데이터는 충분한 추정의 근거를 이루는 사실이다. ② 데이터 자체로는 의미가 중요하지 않은 재료적인 사실이다. ③ 데이터는 축적된 지식과 아이디어가 결합된 창의적 산물이다. ④ 데이터는 지식경영에서 업무성과 형식지의 상호작용에 중요한 역할을 한다. 정답: 3 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 데이터 마이닝 개요]] 3. 개인에게 내재된 경험을 객관적인 데이터로 문서나 매체에 저장, 가공, 분석하는 과정은? ① 공통화(Socialization) ② 내면화(Internalization) ③ 연결화(Combination) ④ 표출화(Externalization) 정답: 4 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 이해 - 데이터베이스의 정의와 특징]] 4. 데이터 웨어하우스에 대한 설명으로 가장 적절하지 않은 것은? ① 데이터 웨어하우스는 하나의 통합된 데이터 저장 공간으로 기업 내의 의사결정지원 애플리케이션을 위한 정보 기반을 제공한다. ② ETL을 주기적으로 비/정형 데이터베이스로부터 정보를 추출하고 정제된 규약에 따라 정보를 변환한 후에 데이터 웨어하우스에 정보를 저장한다. ③ 일반적으로 데이터 웨어하우스는 전사적 차원에서 접근하기보다는 제무, 생산, 운영과 같이 특정 조직의 특정 업무 분야에 초점을 맞추어 구축된다. ④ 데이터 웨어하우스에서 관리하는 데이터들은 시간이 흐르며 변하는 값을 유지한다. 정답: 3 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 이해 - 빅데이터의 가치와 영향]] 5. 다음 중 빅데이터가 가치 창출 측면에서 기업, 정부, 개인에게 미친 영향으로 가장 적절한 것은? ① 빅데이터 활용을 통해 기업의 투명성에는 악영향을 미쳤지만, 기존의 Business Model을 혁신시킬 수 있다. ② 빅데이터의 가치에서 정부는 빅데이터를 현재 상황분석에는 활용할 수 있지만 미래 전략을 수립하는 데는 활용하고 있지 않다. ③ 시장에서 빅데이터 활용의 활성화에 따라 개인이 맞춤형 서비스를 받거나 적시에 필요한 정보를 얻기 기회에는 큰 영향을 주지 않게 되었다. ④ 분석 기술의 다양해지고 고도화되면서 높은 진입장벽이 생김으로 인해 빅데이터 서비스를 제공하는 기업들의 수가 줄어들게 되었다. 정답: 3 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 이해 - 위기 요인과 통제 방안]] 6. 빅데이터 시대 위기 요인 중 사생활 침해 문제를 해결하기 위해 개인 정보를 사용하는 자가 적극적 인 보호 장치를 강구하게 하는 방법으로 가장 적절한 것은? ① 알고리즘 접근 허용. ② 개인정보 제공자 동의제도 도입. ③ 개인정보 사용자 책임제도 도입. ④ 사용자에게 수집된 내용 공개 및 접근권 부여. 정답: 3 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 이해 - 데이터와 정보]] 7. 데이터 사이언스에 대한 설명으로 가장 적절하지 않은 것은? ① 데이터로부터 의미 있는 정보를 추출하는 학문이다. ② 데이터 분석 결과를 대상으로 총체적 결론을 사용하는 학문이다. ③ 데이터 분석 뿐만 아니라 효과적으로 구현하고 전달하는 과정까지 모두 포함하는 개념이다. ④ 전략적 활용을 통해 기업의 비즈니스 핵심 이슈에 답하고 사업성과를 전이할 수 있다. 정답: 2 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 이해 - 데이터베이스의 정의와 특징]] 8. 다음 중 데이터베이스에 대한 설명으로 가장 적절하지 않은 것은? ① 법률적으로 데이터베이스는 기술을 기반으로 한 일정의 저작물로 인정된다. ② 데이터베이스 내의 모든 데이터는 2차 연관 데이터를 표현한다. ③ 한 조직의 다수 사용자가 공동으로 이용하고 유지하는 공용 데이터이다. ④ DBMS 소프트웨어를 사용하여 데이터베이스를 구축하고 유지한다. 정답: 2 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터분석 기획 - 마스터 플랜 수립]] 9. 분석 마스터 플랜을 수립할 때 적용 범위 및 방식에 대한 고려요소가 아닌 것은? ① 분석데이터 적용 수준 ② 업무최적화 적용 수준 ③ 기술 적용 수준 ④ 투입 비용 수준 정답: 4 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터분석 기획 - 분석 기획 방향성 도출]] 10. 다음 중 분석 수준 진단의 대상으로 적절하지 않은 것은? ① 분석 성과에 대한 조사 ② 분석 업무 수행에 대한 조사 ③ 분석 인력 및 조직에 대한 조사 ④ 분석 인프라에 대한 조사 정답: 1 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터분석 기획 - 분석 기획 방향성 도출]] 11. 다음 중 분석 정의서에 대한 정의로 가장 적절한 것은? ① 분석에 필요한 요구사항을 기록한 문서 ② 분석의 범위, 분석 방법, 난이도 등의 분석 과정을 기록한 문서 ③ 분석 방법에 대한 절차와 장단점을 기록한 문서 ④ 분석 방법에 대한 내용을 기록한 문서 정답: 2 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터분석 기획 - 분석 기획 방향성 도출]] 12. 분석 기획에 대한 설명으로 가장 적절하지 않은 것은? ① 실제 분석을 수행하기에 앞서 분석 과제를 정의한다. ② 분석 목표가 달성될 수 있도록 과제를 적절히 관리하는 방안을 수립한다. ③ 성공적인 분석 계획을 도출하기 위한 중요한 사전 작업이다. ④ 상황적 분석은 분석 기획에서 가장 탐색적 데이터 분석을 포함한다. 정답: 4 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터분석 기획 - 분석 방법론]] 13. 분석 대상은 명확하지만, 분석 방식이 명확하지 않은 경우 수행하는 분석 주체의 유형으로 적절한 것은? ① 발견(Discovery) ② 통찰(Insight) ③ 최적화(Optimization) ④ 솔루션(Solution) 정답: 4 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터분석 기획 - 분석 방법론]] 14. 분석 과제의 특성 중 정확도(Accuracy)와 정밀도(Precision)에 대한 설명으로 적절하지 않은 것은? ① 분석의 안정성 측면에서는 정확도가 중요하며, 활용적인 측면에서는 정밀도가 중요하다. ② 정확도는 모델과 실제결과의 차이를 평가한다. ③ 정밀도는 모델을 지속적으로 반복했을 때 편차의 수준으로서, 일관적으로 동일한 결과를 제시한다. ④ 정확도와 정밀도는 Trade-Off 관계인 경우가 많다. 정답: 1 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터분석 기획 - 분석 기획 방향성 도출]] 15. 분석 성숙도 모델 구성에서 고려하는 분석 성숙도 진단 부문으로 적절하지 않은 것은? ① 비즈니스 부문 ② 기업 문화 부문 ③ 조직, 역량 부문 ④ IT 부문 정답: 2 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터분석 기획 - 마스터 플랜 수립]] 16. 분석 마스터 플랜의 세부 이행계획 수립 시 고려해야 할 데이터 분석체계(분석 방법론)에 대한 설명으로 적절한 것은? ① 데이터 분석 체계는 이해도가 높은 폭포수 모델이 가장 적절하다. ② 반복적인 정련 방식은 데이터 수집 및 확보 단계를 반복적으로 수행한다. ③ 프로토타입(Prototype) 모델은 데이터 분석체계로는 적절하지 못하다. ④ 프로젝트의 세부 일정계획도 데이터 분석체계를 고려하여 작성한다. 정답: 4 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 통계학 개론]] 17. 다음 중 유의수준 5% 하에서의 설명으로 가장 적절하지 않은 것은? ![[ADsP 기출문제 이미지 12.png]]]] ① age와 wage의 관계가 선형인지는 위의 결과로 판단할 수 없다. ② age의 효과를 제어했을 때 각 education 그룹 간의 wage가 동일하다고 할 수 없다. ③ age와 wage는 양의 상관관계를 가진다. ④ age가 증가함에 따라 wage에 미치는 영향은 각 education 그룹에 따라 다를 것이다. 정답: 3 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 데이터 마이닝 개요]] 18. 웹 데이터의 수집을 위해 웹페이지의 구조를 분석하여 데이터를 자동으로 수집하는 방법은? ① 스테밍(Stemming) ② 웹 크롤링(Web Crawling) ③ 클라우드 컴퓨팅(Cloud Computing) ④ TDM(Term-Document Matrix) 정답: 2 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 기초 통계분석]] 19. 소득 수준과 같이 정규 분포를 따르지 않고 오른쪽 꼬리가 긴(right-skewed)분포를 나타내는 자료의 평균값과 중앙값의 관계로 옳은 것은 무엇인가? ① 자료의 크기에 따라 달라진다. ② 평균이 중앙값보다 큰 경향을 보인다. ③ 평균이 중앙값과 일치하는 경향을 보인다. ④ 평균이 중앙값보다 작은 경향을 보인다. 정답: 2 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 데이터 마이닝 개요]] 20. 다음 중 앙상블 모형의 특징으로 적절하지 않은 것은? ① 모형의 투명성이 떨어져 원인 분석에는 적합하지 않다. ② 이상값(outlier)에 대한 대응력이 높아진다. ③ 전체적인 예측수준 변산을 감소시켜 정확도를 높일 수 있다. ④ 각 모형의 상호 연관성이 높을수록 정확도가 향상한다. 정답: 4 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 연관분석(Association Analysis)]] 21. 다음 중 연관분석에 대한 특징으로 가장 적절하지 않은 것은? ① 분석 방향이나 목적이 특별히 없는 경우 유용한 분석 방법이다. ② 분석을 위한 계산이 복잡하다는 단점이 있다. ③ 너무 제한된 품목을 가지고 연관규칙을 찾으려고 하면 의미 없는 결과가 나올 수 있다. ④ 연관분석의 결과는 조건 반응(if-then)으로 표현된다. 정답: 2 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 기초 통계분석]] 22. 다음 중 이상치를 판정하는 방법에 대한 설명으로 가장 부적절한 것은? ① Q2(중위수)+1.5*IQR 보다 크거나 Q2(중위수)-1.5*IQR 작은 데이터를 이상치로 규정한다. ② 3-시그마 법은 “평균으로부터 표준편차의 3배가 넘는 범위의 데이터”를 비정상이라 규정한다. ③ 훗날의 새로운 자료 수집과정에서 이상치를 판정하는 방법이 있다. ④ 표본에 기반한 방법으로 Grubb's Test, Hotellings T-Squared Test 등이 있다. 정답: 1 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 데이터 마이닝 개요]] 23. 모형평가 방법으로 가장 적절하지 않은 것은? ① k-fold 교차검증(k-fold Cross validation) ② 오분류표(Confusion Matrix) ③ 엔트로피(Entropy) ④ 홀드 아웃 방법(Hold-out method) 정답: 3 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - R기초]] 24. 다음 중 R의 데이터 구조 중 벡터에서 숫자형 벡터, 문자형 벡터, 논리 연산자 벡터를 모두 합쳐 하나의 벡터를 구성하였을 경우 합쳐진 벡터의 형식으로 옳은 것은? ① 논리 연산자 벡터 ② 숫자형 벡터 ③ 문자형 벡터 ④ 데이터 프레임 정답: 3 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 다변량 분석]] 25. 다음 중 아래 수식에 해당하는 거리 계산 방법은? ![[ADsP 기출문제 이미지 13.png]]]] ① 민코우스키(Minkowski) 거리 ② 마할라노비스(Mahalanobis) 거리 ③ 유클리드(Euclidean) 거리 ④ 맨하탄(Manhattan) 거리 정답: 4 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 기초 통계분석]] 26. 표본들이 서로 관련된 경우 짝지어진 두 관찰치의 크고 작음을 표시하여 그 두 분포의 차이에 대한 가설을 검증하는 비모수 검정 방법은? ① 부호 검정(Sign test) ② 만-휘트니의 U검정(Mann-Whitney U test) ③ 순위합차 검정(Wilcoxon Rank-Sum test) ④ 스피어만의 순위상관계수(Spearman's Rank Correlation Coefficient) 정답: 2 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 데이터 마이닝 개요]] 27. 인공신경망 모형에서 활성함수인 시그모이드(sigmoid)의 함수의 결과값으로 올바른 것은? ① -1 또는 1 ② 0 또는 1 ③ 0 ≤ y ≤ 1 ④ -1 ≤ y ≤ 1 정답: 3 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 분류분석(Classification)]] 28. 분류 모형의 평가를 위해 사용되는 방법으로 적절하지 않은 것은? ① 덴드로그램(Dendrogram) ② ROC(Receiver Operating Characteristic) 그래프 ③ 리프트표(Lift Chart) ④ 향상도 곡선(Lift Curve) 정답: 1 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 기초 통계분석]] 29. 표본추출의 방법으로 적절하지 않은 것은? ① 계통추출법 ② 집단추출법 ③ 층화추출법 ④ 단순무작위추출법 정답: 2 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 군집분석(Clustering)]] 30. 다음 중 군집분석에 대한 설명으로 가장 적절하지 않은 것은? ① 군집화의 방법에는 분리 군집, 밀도기반 군집, SOM(Self-Organizing Map)등이 있다. ② 군집분석은 집단 간 이질성과 집단 내 동질성이 모두 낮아지는 방향으로 군집을 만든다. ③ 특정한 군집을 형성하는 방법에는 병합적방법과 분할적 방법이 있다. ④ 군집분석의 이용되는 다변량 자료는 별도의 반응 변수가 요구되지 않는다. 정답: 2 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 데이터 마이닝 개요]] 31. 빅데이터 분석 프로세스에서 모델링 단계에 해당하지 않는 과정은? ① 모델의 개발 설계 및 구축 ② 탐색 및 분석 및 유의변수 도출 ③ 분석기법 선정 및 설계 ④ 모델링 성능평가 정답: 3 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 통계학 개론]] 32. 다음 중 아래 코드 실행 결과에 대한 설명으로 가장 적절한 것은? ![[ADsP 기출문제 이미지 14.png]]]] ① 위의 모델은 2차 선형 회귀 모델이다. ② 추정된 회귀식은 weight = 7.9879*Time이다. ③ 회귀모형은 유의수준 5% 하에서 통계적으로 유의미하다. ④ Intercept는 유의수준 0.1% 하에서 통계적으로 매우 유의미하다. 정답: 3 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 데이터 마이닝 개요]] 33. 다음 중 신경망 모형에서 출력값이 여러 개이고 목표치가 다범주인 경우에 사용하는 활성화 함수는? ① 하이퍼볼린 탄젠트(Hyperbolic Tangent) ② 시그모이드(Sigmoid) ③ 리키-렐루(Leaky-ReLU) ④ 소프트 맥스(Softmax) 정답: 4 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 데이터 마이닝 개요]] 34. 자료의 종류에 대한 설명으로 부적절한 것은? ① 명목척도 - 측정 대상이 어느 집단에 속하는지 분류할 때 사용하는 척도로 성별구분 등이 해당한다. ② 순서척도 - 측정 대상의 특성이 가지는 서열관계를 관측하는 척도로 특정 서비스의 선호도 등이 해당한다. ③ 구간척도 - 측정 대상이 갖는 속성의 양을 측정하는 것으로 온도 등이 해당된다. ④ 비율척도 - 비율 대상 간의 상대적인 기준으로 모든 사칙연산이 가능하나, 제로값을 가지지 않는 척도로 혈압, 학력 등이 해당된다. 정답: 4 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 데이터 마이닝 개요]] 35. 다음 중 의사결정나무의 특징에 대한 설명으로 가장 적절하지 않은 것은? ① 모형의 결과는 누구에게나 설명이 용이하다. ② 만드는 방법이 계산적으로 복잡하지 않다. ③ 특정 변수와 매우 상관성이 높은 다른 불필요한 변수가 있다하도 크게 영향을 받지 않는다. ④ 비정상적인 잡음 데이터에 대해서 민감하게 분류한다. 정답: 4 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 군집분석(Clustering)]] 36. 군집분석 기법으로 적절하지 않은 것은? ① PAM(Partitioning Around Medoids) ② Density based Clustering ③ Silhouette Coefficient ④ Fuzzy Clustering 정답: 3 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 데이터 마이닝 개요]] 37. 데이터 마이닝을 위한 데이터 분할에 대한 설명으로 부적절한 것은? ① 데이터 마이닝 적용 후 결과를 검증하기 위해 데이터를 구축용(Training), 검증용(Validation), 시험용(Test)으로 분할한다. ② 검증용 데이터는 학습 과정에서 사용되지 않는다. ③ 구축용 데이터는 추정용, 훈련용이라고도 불린다. ④ 데이터 양이 충분하지 않을 때는 교차검증(Cross-Validation)을 통해 모형을 평가하기도 한다. 정답: 2 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 데이터 마이닝 개요]] 38. 변수 가공에 대한 설명으로 적절하지 않은 것은? ① 파생변수는 기존의 변수를 조합하여 새로운 변수를 만드는 방법이다. ② 연속형 변수보다 범주형 변수가 이해하기 쉬울 때 연속형 변수를 구간화하여 활용한다. ③ 변환의 중요도는 개발 중인 모형에 준비된 데이터를 기준으로 한 번에 여러 개의 변수를 평가한다. ④ 구간화의 개수가 감소하면 정밀도는 높아지지만 속도가 느려진다. 정답: 4 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 데이터 마이닝 개요]] 39. 다차원척도법에 대한 설명으로 가장 적절하지 않은 것은? ① 데이터에 잠재해 있는 패턴이나 구조를 찾으려는 것이다. ② 찾으려는 정보가 패턴은 소수 차원의 공간에 기하학적으로 표현한다. ③ 계절을 사이의 유사성과 비유사성을 측정하여 차원을 축소하기 위해 사용한다. ④ 데이터의 축소를 목적으로 사용한다. 정답: 3 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 결측값 처리와 이상값 검색]] 40. 데이터 전처리 과정에 대한 설명으로 가장 적절한 것은? ① 데이터 특성을 파악하고 통찰을 얻기 위한 다각도 접근 방법을 데이터 EDA(Exploratory Data Analysis)라고 한다. ② R에서는 is.notnum() 함수를 이용해서 결측값 여부를 확인할 수 있다. ③ 모든 분석에서 이상치는 시간이 오래 걸리더라도 다 찾아내어 제거해야 한다. ④ 특정 변수에 NA 개수가 많더라도 해당 레코드를 삭제해야 한다. 정답: 1 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 이해 - 빅데이터의 가치와 영향]] 01. 아래에서 설명하는 용어는? 인터넷에 연결된 기기가 사람의 개입 없이 상호 간에 정보를 주고받아 처리하는 것을 의미한다. 이것의 예시로는 하기스의 Tweel Pee, 구글의 Google Glass, 나이키의 Fuel Band, 삼성전자의 갤럭시 기어가 있다. ( ) 정답: 사물 인터넷 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 이해 - 비즈니스 모델]] 02. 아래에서 설명하는 (가)는 무엇인가? (가)는 거래정보를 하나의 덩어리로 보고 이를 차례로 연결한 거래장부다. 기존 금융회사의 경우 중앙 집중형 서버에 거래 기록을 보관하는 반면, (가)는 거래에 참여하는 모든 사용자에게 거래 내역을 보내 주며 거래 때마다 이를 대조해 데이터 위조를 막는 방식을 사용한다. ( ) 정답: 블록체인 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 이해 - 빅데이터의 이해]] 03. 흔히 빅데이터의 특징을 Volume, Variety, Velocity의 3V로 정의하는데, 여기에 비즈니스 측면을 고려하여 4V로 정의할 경우 추가되어야 할 특징은? ( ) 정답: value 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터분석 기획 - 분석 기획 방향성 도출]] 04. 아래의 괄호 안에 들어갈 용어는? ROI(Return On Investment) 요소를 고려하여 데이터 분석 과제에 대한 우선순위 평가 기준을 정의할 때, 전략적 중요도에 따라 ( )을/를 가장 우선적으로 고려해야 한다. ( ) 정답: 시급성 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 시계열 예측]] 05. 아래에서 설명하는 시계열 모형은? - 시계열 모델 중 자기 자신의 과거 값을 사용하여 설명하는 모형임 - 백색 잡음의 현재값과 자리 자신의 과거값만의 선형 가중합으로 이루어진 정상성과 모형 - 모형에 사용하는 시계열 자료의 시점에 따라 1차, 2차, ..., p차 등을 사용하는 정상시계열 모형에서는 주로 1, 2차를 사용함 ( ) 정답: ar모형 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 데이터 마이닝 개요]] 06. 아래에서 설명하는 앙상블 방법은? - 배깅에 랜덤 과정을 추가한 방법 - 원자료로부터 부스트랩 샘플을 추출하고 각 부스트랩 샘플에 대해 형성해 나간다는 점에서 배깅과 유사 - 각 노드마다 예측변수를 임의로 추출하고, 추출된 변수 내에서 최적의 분할을 생성 ( ) 정답: 랜덤 포레스트 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 분류분석(Classification)]] 07. 아래의 오분류표를 이용하여 계산한 F1-score 값은? (단, 값을 분수로 나타내시오.) ![[ADsP 기출문제 이미지 15.png]]]] ( ) 정답: 6/19 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 분류분석(Classification)]] 08. 두 정수 x1과 x2는 다음과 같은 기본조건을 가진다. ![[ADsP 기출문제 이미지 16.png]]]] ( ) 정답: A:3, B:8 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 기초 통계분석]] 09. A 고등학교에서 B과목의 상위 2%의 상급반을 운영한다고 한다. 상급반에 들어가려고 할 때, B과목의 최저 점수는 몇점인가? (단, 상위 2%일 때 z=2.05, 평균점수=85, 표준편차=5) ( ) 정답: 95.25 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]] [[데이터 분석 - 기초 통계분석]] 10. 이상형 확률변수 x가 1, 2, 4로 주어졌을 때, p(x=1)이 0.4로 나타났다. p(x=2)의 확률은 얼마인가? (단, 기대값은 2.4) ( ) 정답: 0.2 출처: [[05 제36회데이터분석준전문가자격검정시험복원문제.pdf]]