3. 다음 중 데이터 사이언티스트(Data Scientist)에게 요구되는 소프트 역량(Soft Skill)이 아닌 것은?
① 이론적 지식
② 창의적 사고
③ 커뮤니케이션 기술
④ 비주얼라이제이션을 활용한 설득력
정답: 1
출처: [[01 데이터분석준전문가모의고사(ADsP) 1회.pdf]]
### 문제의 출제 의도
이 문제는 데이터 사이언티스트에게 요구되는 소프트 스킬(Soft Skills)과 하드 스킬(Hard Skills)을 구분할 수 있는지를 평가하기 위해 출제되었습니다. 데이터 사이언티스트는 기술적 능력뿐만 아니라 문제 해결, 협업, 소통 등의 소프트 스킬도 중요하게 요구됩니다. 이 문제를 통해 수험생이 데이터 사이언티스트의 역할에서 필요한 다양한 스킬 세트를 이해하고 있는지 확인하려고 합니다.
### 주요 개념
1. **소프트 스킬(Soft Skills)**: ==소프트 스킬은 주로 사람과의 상호작용, 문제 해결, 창의성, 의사소통== 등과 관련된 비기술적 능력입니다. 데이터 사이언티스트에게는 이러한 소프트 스킬이 기술적 능력만큼이나 중요합니다.
2. **하드 스킬(Hard Skills)**: ==하드 스킬은 주로 기술적 지식이나 특정 도구, 프로그래밍 언어 등과 관련된 능력==을 의미합니다. 데이터 사이언티스트는 데이터 분석, 모델링, 통계적 지식 등의 하드 스킬을 필요로 합니다.
3. **이론적 지식**: 통계, 수학, 데이터베이스 관리 등 데이터 분석에 필요한 기술적 지식입니다. 이는 하드 스킬에 속합니다.
4. **창의적 사고**: 문제를 해결하고 새로운 인사이트를 도출하기 위해 창의적으로 생각하는 능력입니다. 이는 소프트 스킬입니다.
5. **커뮤니케이션 기술**: 데이터 분석 결과를 이해하기 쉽게 전달하고, 협업하는 과정에서 필요한 의사소통 능력입니다. 이는 소프트 스킬입니다.
6. **비주얼라이제이션을 활용한 설득력**: 데이터를 시각화하여 결과를 효과적으로 전달하고, 이해관계자를 설득하는 능력입니다. 이는 소프트 스킬입니다.
### 보기 설명
1. **이론적 지식**
- 데이터 분석에 필요한 수학, 통계, 프로그래밍 등 기술적 지식을 의미합니다. 이는 하드 스킬로 분류됩니다.
- **하드 스킬**에 해당하며, 소프트 스킬이 아닙니다.
2. **창의적 사고**
- 문제 해결을 위한 새로운 아이디어를 제시하고, 데이터를 창의적으로 분석하는 능력입니다.
- **소프트 스킬**에 해당합니다.
3. **커뮤니케이션 기술**
- 분석 결과를 이해하기 쉽게 전달하고, 다양한 팀과 협업하는 과정에서 중요한 의사소통 능력입니다.
- **소프트 스킬**에 해당합니다.
4. **비주얼라이제이션을 활용한 설득력**
- 데이터를 시각적으로 표현하여 복잡한 정보를 명확하게 전달하고, 설득하는 능력입니다.
- **소프트 스킬**에 해당합니다.
### 정답: 1
**이론적 지식**은 데이터 사이언티스트에게 요구되는 하드 스킬이며, 소프트 스킬이 아닙니다. 창의적 사고, 커뮤니케이션 기술, 비주얼라이제이션을 활용한 설득력은 모두 소프트 스킬로, 데이터 사이언티스트가 효과적으로 일하기 위해 중요한 능력들입니다.
---
4. 다음 중 빅데이터 분석에 경제성을 제공해 준 결정적인 기술로 가장 적절한 것은?
① 저장장치 비용의 지속적인 하락
② 텍스트 마이닝
③ 클라우드 컴퓨팅
④ 스마트폰의 급속한 확산
정답: 3
출처: [[01 데이터분석준전문가모의고사(ADsP) 1회.pdf]]
### 문제의 출제 의도
이 문제는 빅데이터 분석에 있어 경제성을 제공해 준 주요 기술이 무엇인지 평가하기 위해 출제되었습니다. 빅데이터 분석은 대량의 데이터를 효율적으로 저장, 처리, 분석하기 위해 다양한 기술적 발전이 필요합니다. 이 문제를 통해 수험생이 빅데이터 분석의 경제성에 기여한 주요 기술을 이해하고 있는지 확인하고자 합니다.
### 주요 개념
1. **빅데이터 분석**: 빅데이터 분석은 대량의 데이터를 수집, 저장, 처리, 분석하여 의미 있는 정보를 도출하는 과정입니다. 이를 위해서는 고도화된 기술이 필요합니다.
2. **경제성**: 경제성은 비용 대비 효율성을 의미합니다. 빅데이터 분석에 있어 경제성을 제공하는 기술은 데이터 처리와 저장 비용을 절감하면서도 효율적인 분석을 가능하게 하는 기술입니다.
### 보기 설명
1. **저장장치 비용의 지속적인 하락**
- 저장장치 비용이 하락함으로써 데이터 저장 비용이 감소하게 되었습니다. 그러나 이는 빅데이터 분석에 경제성을 제공하는 중요한 요소이긴 하지만, 가장 결정적인 기술은 아닙니다.
2. **텍스트 마이닝**
- 텍스트 마이닝은 비정형 텍스트 데이터를 분석하여 유의미한 정보를 추출하는 기술입니다. 빅데이터 분석의 한 부분이지만, 경제성에 대한 결정적인 기술은 아닙니다.
3. **클라우드 컴퓨팅**
- 클라우드 컴퓨팅은 인터넷을 통해 데이터 저장 및 처리 능력을 제공하는 기술로, 빅데이터 분석에 있어 매우 중요한 역할을 합니다. 클라우드 컴퓨팅은 초기 투자 비용을 줄이고, 필요에 따라 자원을 확장하거나 축소할 수 있는 유연성을 제공하여 경제성을 크게 향상시킵니다.
4. **스마트폰의 급속한 확산**
- 스마트폰의 확산으로 데이터 생성이 급증하였으나, 이는 빅데이터의 양을 증가시킨 요소입니다. 빅데이터 분석의 경제성에 직접적인 기술적 기여보다는 데이터의 출처로서의 의미가 큽니다.
### 정답: 3
**클라우드 컴퓨팅**은 빅데이터 분석에 경제성을 제공해 준 결정적인 기술로 가장 적절합니다. 클라우드 컴퓨팅은 데이터 저장 및 처리 능력을 인터넷을 통해 제공함으로써, 초기 인프라 구축 비용을 줄이고, 필요에 따라 자원을 유연하게 관리할 수 있게 해줍니다. 이는 빅데이터 분석의 경제성을 크게 향상시킵니다.
---
5. 아래와 같은 SQL 문장을 사용할 때, 출력되는 결과로 옳은 것은?
```sql
select customer_name 고객명, e_customer_name 고객 영문명
from customer
where e_customer_name like '_A%';
```
① 영문명이 A로 시작하는 고객들의 이름
② 영문명에 A를 포함한 고객들의 비율
③ 위치 상관없이 영문명에 A를 포함하는 고객들의 이름
④ 영문명에 두 번째 문자가 A인 고객들의 이름
정답: 4
출처: [[01 데이터분석준전문가모의고사(ADsP) 1회.pdf]]
### 문제의 출제 의도
이 문제는 SQL 쿼리에서 패턴 매칭을 위해 사용되는 `LIKE` 연산자의 이해도를 평가하기 위해 출제되었습니다. 특히, 언더스코어(`_`)와 퍼센트(`%`) 와일드카드의 사용법을 정확히 이해하고 있는지를 확인합니다.
### 주요 개념
1. **SQL `LIKE` 연산자**: `LIKE` 연산자는 문자열 패턴 매칭을 위해 사용됩니다. 이 연산자는 두 가지 와일드카드 문자를 사용합니다.
- **언더스코어 (`_`)**: 단일 문자를 나타냅니다.
- **퍼센트 (`%`)**: 0개 이상의 문자를 나타냅니다.
2. **패턴 매칭**: 특정 패턴을 기반으로 데이터를 검색하는 방법입니다. 여기서 `'_A%'` 패턴은 두 번째 문자가 'A'인 문자열을 찾는 것을 의미합니다.
### 보기 설명
1. **영문명이 A로 시작하는 고객들의 이름**
- 패턴 `'A%'`를 사용해야 합니다. 첫 번째 문자가 'A'로 시작하는 모든 문자열을 찾습니다.
- **예시**: "Alex", "Andrew"
- **정답이 아닙니다.**
2. **영문명에 A를 포함한 고객들의 비율**
- 이와 같은 SQL 쿼리는 비율을 계산하는데 사용되지 않습니다. 패턴 매칭을 사용하여 데이터를 필터링합니다.
- **정답이 아닙니다.**
3. **위치 상관없이 영문명에 A를 포함하는 고객들의 이름**
- 패턴 `'%A%'`를 사용해야 합니다. 문자열의 어느 위치에든 'A'가 포함된 모든 경우를 찾습니다.
- **예시**: "Alex", "Brad"
- **정답이 아닙니다.**
4. **영문명에 두 번째 문자가 A인 고객들의 이름**
- 패턴 `'_A%'`는 첫 번째 문자는 아무거나이고, 두 번째 문자가 'A'인 모든 문자열을 찾습니다.
- **예시**: "Matt", "Jack"
- **정답입니다.**
### 정답: 4
**영문명에 두 번째 문자가 A인 고객들의 이름**
SQL 쿼리에서 `LIKE '_A%'`는 첫 번째 문자는 어떤 문자든 상관없이 두 번째 문자가 'A'인 문자열을 찾는 패턴 매칭입니다. 따라서 정답은 **4. 영문명에 두 번째 문자가 A인 고객들의 이름**입니다.
---
07. 다음 중 데이터 웨어하우스와 데이터 마트에 대한 설명으로 부적절한 것은?
① 데이터 마트는 모든 사용자 그룹에 서비스를 제공하는 데이터 웨어하우스 논리 모델을 지향한다.
② 데이터 웨어하우스에서 관리하는 데이터들은 시간의 흐름에 따라 변화하는 값을 저장한다.
③ 데이터 마트는 특정 분야에 집중하고 있기 때문에 해당 분야에 대한 전문성과 갖추고 있다면 구축하는 것이 용이하다.
④ 데이터 웨어하우스는 사용자의 의사결정에 도움을 주기 위해 정보를 기반으로 제공하는 하이 통합된 데이터 저장 공간을 말한다.
정답: 1
출처: [[03 제34회데이터분석준전문가자격검정시험복원문제.pdf]]
### 문제의 출제 의도
이 문제는 데이터 웨어하우스와 데이터 마트의 개념과 차이점을 이해하고 있는지를 평가하기 위해 출제되었습니다. 데이터 웨어하우스와 데이터 마트는 모두 데이터 관리와 분석을 위한 중요한 구조물이지만, 그 목적과 범위가 다릅니다. 이 문제를 통해 수험생이 이 두 가지 개념을 명확히 구분할 수 있는지 확인하려고 합니다.
### 주요 개념
1. **데이터 웨어하우스**: 대규모의 데이터 저장소로, 다양한 소스에서 데이터를 통합하여 장기적인 데이터를 저장합니다. 데이터 웨어하우스는 시간의 흐름에 따른 데이터를 포함하며, 의사결정을 지원하기 위해 설계되었습니다. 높은 통합성과 다목적성을 지향합니다.
2. **데이터 마트**: 데이터 웨어하우스의 하위 집합으로, 특정 사용자 그룹이나 특정 비즈니스 분야에 초점을 맞추어 설계된 작은 규모의 데이터 저장소입니다. 특정 분야에 집중하여 해당 사용자에게 필요한 데이터를 보다 빠르고 효율적으로 제공하는 것이 목적입니다.
### 보기 설명
1. **데이터 마트는 모든 사용자 그룹에 서비스를 제공하는 데이터 웨어하우스 논리 모델을 지향한다.**
- 데이터 마트는 특정 사용자 그룹이나 비즈니스 분야에 초점을 맞추어 설계된 작은 규모의 데이터 저장소입니다. 모든 사용자 그룹에 서비스를 제공하는 것은 데이터 웨어하우스의 역할입니다.
- **부적절한 설명입니다.**
2. **데이터 웨어하우스에서 관리하는 데이터들은 시간의 흐름에 따라 변화하는 값을 저장한다.**
- 데이터 웨어하우스는 장기적인 데이터를 저장하며, 시간의 흐름에 따른 변화를 추적합니다. 이는 데이터 웨어하우스의 핵심 기능 중 하나입니다.
- **적절한 설명입니다.**
3. **데이터 마트는 특정 분야에 집중하고 있기 때문에 해당 분야에 대한 전문성과 갖추고 있다면 구축하는 것이 용이하다.**
- 데이터 마트는 특정 비즈니스 분야나 사용자 그룹에 집중하기 때문에, 해당 분야의 전문성을 갖추고 있다면 상대적으로 쉽게 구축할 수 있습니다.
- **적절한 설명입니다.**
4. **데이터 웨어하우스는 사용자의 의사결정에 도움을 주기 위해 정보를 기반으로 제공하는 하이 통합된 데이터 저장 공간을 말한다.**
- 데이터 웨어하우스는 다양한 소스에서 데이터를 통합하여 사용자의 의사결정을 지원하는 고도로 통합된 데이터 저장 공간입니다.
- **적절한 설명입니다.**
### 정답: 1
**데이터 마트는 모든 사용자 그룹에 서비스를 제공하는 데이터 웨어하우스 논리 모델을 지향한다.**
데이터 마트는 특정 사용자 그룹이나 특정 비즈니스 분야에 집중하는 데이터 저장소이므로, 모든 사용자 그룹에 서비스를 제공하는 것은 데이터 마트의 목적에 부합하지 않습니다. 이는 데이터 웨어하우스의 역할입니다. 따라서 ①번 설명이 부적절합니다.
---
1. 다음 중 데이터베이스와의 통신을 위해 고안된 언어로 가장 적절한 것은?
① Java
② R
③ Python
④ SQL
정답: 4
출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]]
4. 다음 중 빅데이터가 발생시키는 문제를 중간자 입장에서 중재하고 해결하는 역할을 하는 직업은 무엇인가?
① 데이터 관리자
② 알고리즘리스트
③ 정보보호 전문가
④ 애널리스트
정답: 2
출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]]
### 문제의 출제 의도
이 문제는 빅데이터 관련 직업 중 특정 문제를 중간자 입장에서 중재하고 해결하는 역할을 담당하는 직업을 이해하고 있는지를 평가하기 위해 출제되었습니다. 각 직업의 주요 역할과 책임을 알고 있는지 확인하기 위한 문제입니다.
### 주요 개념
1. **데이터 관리자 (Data Manager)**: 데이터의 저장, 관리, 유지, 보호 등의 책임을 지는 직업입니다. 데이터의 품질을 유지하고 데이터베이스 시스템을 운영하는 것이 주요 역할입니다.
2. **알고리즘리스트 (Algorithmist)**: 빅데이터를 처리하고 분석하기 위해 알고리즘을 개발하고 최적화하는 역할을 합니다. 데이터의 문제를 해결하고 중재하는 역할을 담당할 수 있습니다.
3. **정보보호 전문가 (Information Security Specialist)**: 데이터 및 정보 시스템의 보안을 담당하는 직업입니다. 데이터의 무결성과 보안을 유지하는 것이 주요 역할입니다.
4. **애널리스트 (Analyst)**: 데이터를 분석하여 인사이트를 도출하고 비즈니스 결정을 지원하는 역할을 합니다. 데이터 분석과 관련된 다양한 문제를 해결하지만 중재 역할보다는 분석 역할에 집중합니다.
### 보기 설명
1. **데이터 관리자 (Data Manager)**
- 데이터베이스의 유지관리, 데이터 품질 관리, 데이터 보존 및 백업 등의 역할을 담당합니다.
- 주로 데이터의 저장과 관리에 중점을 둡니다.
- 중재 역할과는 다소 거리가 있습니다.
2. **알고리즘리스트 (Algorithmist)**
- 빅데이터를 처리하기 위한 알고리즘을 개발하고 최적화하는 전문가입니다.
- 데이터 처리 과정에서 발생하는 다양한 문제를 해결하고 중재하는 역할을 할 수 있습니다.
- **정답입니다.**
3. **정보보호 전문가 (Information Security Specialist)**
- 데이터 및 정보 시스템의 보안을 담당하며, 데이터의 기밀성, 무결성, 가용성을 보장합니다.
- 데이터 중재보다는 보안 유지에 중점을 둡니다.
4. **애널리스트 (Analyst)**
- 데이터를 분석하여 의미 있는 인사이트를 도출하고 비즈니스 결정을 지원합니다.
- 분석에 중점을 두지만, 중재 역할과는 다소 거리가 있습니다.
### 정답: 2
**알고리즘리스트 (Algorithmist)**는 빅데이터를 처리하고 분석하기 위해 알고리즘을 개발하고 최적화하는 역할을 합니다. 이 과정에서 데이터 처리와 관련된 다양한 문제를 중재하고 해결할 수 있기 때문에, 빅데이터가 발생시키는 문제를 중간자 입장에서 중재하고 해결하는 역할을 수행할 수 있는 직업으로 가장 적절합니다.
---
3. 아래에서 설명하는 정보시스템으로 가장 적절한 것은?
경영 효율화를 위해 기업 전체의 경영 자원을 통합적으로 관리하는 정보시스템
① ERP
② CRM
③ SCM
④ KMS
정답: 1
[[06 제37회데이터분석준전문가자격검정시험복원문제.pdf]]