29. 다음 중 회귀모형을 해석하는 방법으로 옳지 않은 것은? ① 모형이 통계적으로 유의미한가? ② 모형이 데이터를 잘 적합하고 있는가? ③ 모형의 종속변수, 독립변수 간의 상관계수가 유의한가? ④ 모형이 선형성, 정상성, 독립성을 만족하는가? 정답: 3 출처: [[03 제34회데이터분석준전문가자격검정시험복원문제.pdf]] 풀 수 있는 문제 --- 31. 다음 중 회귀분석에 대한 설명으로 가장 부적절한 것은? ① 독립변수의 수가 많아지면 모형의 설명력이 증가하지만 모형이 복잡해지고, 독립변수들 간에 서로 상관성이 높아지는 경우 다중공선성 문제가 발생할 수 있다. ② 잔차와 독립변수는 상관관계가 없다는 분석의 가정 중 하나이다. ③ 명목형 변수는 회귀분석에서 더미변수화 하여 사용할 수 있다. ④ 종합동에서 추정된 회귀식에 의해 설명되는 변동의 비율로 나타날 수 있다. 정답: 2 출처: [[03 제34회데이터분석준전문가자격검정시험복원문제.pdf]] 풀 수 있는 문제 --- 17. 다음 중 lasso 회귀모형에 대한 설명으로 부적절한 것은? ① 모형에 포함된 회귀계수들의 절대값의 크기가 클수록 penalty를 부여하는 방식이다. ② 자동적으로 변수선택을 하는 효과가 있다. ③ penalty의 정도를 조정하는 모수가 있다. ④ L2 penalty를 사용한다. 정답: 4 출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]] Lasso 회귀모형에 대한 설명 중 부적절한 것을 찾기 위해 각 선택지를 분석해 보겠습니다. ### Lasso 회귀모형 개요 Lasso (Least Absolute Shrinkage and Selection Operator) 회귀는 회귀계수에 패널티를 부여하여 회귀모델을 개선하는 방법입니다. Lasso 회귀는 회귀계수의 절대값 합에 패널티를 부과함으로써 일부 회귀계수를 0으로 만들어 변수 선택을 자동으로 수행하는 특징이 있습니다. ### 선택지 분석 #### ① "모형에 포함된 회귀계수들의 절대값의 크기가 클수록 penalty를 부여하는 방식이다." - **적절한 설명**입니다. Lasso 회귀는 회귀계수의 절대값 합 (L1L1L1 norm)에 패널티를 부여합니다. 회귀계수의 절대값이 클수록 더 큰 패널티가 적용됩니다. #### ② "자동적으로 변수선택을 하는 효과가 있다." - **적절한 설명**입니다. Lasso 회귀는 패널티로 인해 일부 회귀계수를 0으로 만들 수 있습니다. 이로 인해 모델에 중요하지 않은 변수는 자동으로 제거되며, 변수 선택의 효과를 가집니다. #### ③ "penalty의 정도를 조정하는 모수가 있다." - **적절한 설명**입니다. Lasso 회귀에는 패널티의 크기를 조정하는 모수 λ\lambdaλ가 있습니다. λ\lambdaλ가 크면 패널티가 커지고, 회귀계수가 더 작아지며, λ\lambdaλ가 작으면 패널티가 작아집니다. #### ④ "L2 penalty를 사용한다." - **부적절한 설명**입니다. Lasso 회귀는 L2L2L2 패널티가 아닌 L1L1L1 패널티를 사용합니다. L2L2L2 패널티는 Ridge 회귀에서 사용되며, 이는 회귀계수의 제곱합에 패널티를 부과합니다. ### 결론 **정답은 ④번**입니다. Lasso 회귀는 L1L1L1 패널티를 사용하며, L2L2L2 패널티는 Ridge 회귀에서 사용됩니다. --- 25. Credit 데이터는 400명의 신용카드 고객에 대해 신용카드 대금(Balance)과 소득(Income), 학생 여부(Student=Y/N)를 포함한다. Balance를 종속변수로 하는 아래의 모형 적합 결과 중 가장 부적절한 것은? ![[ADsP 기출문제 이미지 09.png]] ① 위의 모형은 Balance를 설명하는데 통계적으로 유의하다. ② Income이 증가할수록 Balance가 증가하는 경향이 있다. ③ Income과 StudentYes의 교호작용은 유의하지 않다. ④ Income이 증가함에 따라 커지는 Balance의 증가분이 학생 여부에 따라 유의적인 차이가 있다. 정답: 4 출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]] 풀 수 있는 문제 --- 26. 다음 중 회귀분석에서 모형의 설명력을 확인하기 위해 사용되는 결정계수의 특성으로 부적절한 것은? ① 결정계수는 0에서 1의 값을 가진다. ② 높은 값을 가질수록 측정된 회귀식의 설명력이 높다. ③ 종속변수와 독립변수 사이의 표본상관 계수와 같다. ④ 추정된 회귀식에 의해 설명되지 않는 변동의 비율을 나타낼 수 있다. 정답: 3 출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]] 풀 수 있는 문제 --- 27. 다음 중 목표변수가 연속형인 회귀나무에서 분류 기준값의 선택 방법으로 가장 적절한 것은? ① 카이제곱 통계량, 지니지수 ② 지니지수, F-통계량 ③ F-통계량, 분산 감소량 ④ 분산 감소량, 엔트로피 지수 정답: 3 출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]] 목표변수가 **연속형**인 회귀나무(Regression Tree)에서 분류 기준값의 선택 방법으로 적절한 방법은 **분산 감소량**입니다. 회귀나무는 목표변수가 연속형이므로, 분류를 통해 분산이 얼마나 감소하는지를 기준으로 최적의 분할을 선택합니다. F-통계량 또한 회귀 분석에서 사용되며, 연속형 변수의 설명력을 평가하는 데 유용합니다. ### 선택지 분석 1. **① 카이제곱 통계량, 지니지수**: - 카이제곱 통계량과 지니지수는 주로 **분류나무(Classification Tree)** 에서 사용됩니다. 카이제곱 통계량은 범주형 변수를 대상으로 하고, 지니지수는 이질성을 측정하는 기준으로 사용됩니다. 2. **② 지니지수, F-통계량**: - 지니지수는 분류나무에서 사용되며, 회귀나무에서는 사용되지 않습니다. F-통계량은 연속형 변수를 평가할 때 사용될 수 있지만, 지니지수와 함께 사용되는 것은 적절하지 않습니다. 3. **③ F-통계량, 분산 감소량**: - **적절한 선택**입니다. F-통계량은 회귀 분석에서, 분산 감소량은 회귀나무에서 분할의 기준으로 사용될 수 있습니다. 4. **④ 분산 감소량, 엔트로피 지수**: - 분산 감소량은 적절하지만, 엔트로피 지수는 주로 분류나무에서 사용되며, 회귀나무에서는 사용되지 않습니다. ### 결론 **정답은 ③번**입니다. 회귀나무에서는 분산 감소량과 F-통계량이 적절한 분류 기준으로 사용될 수 있습니다. --- 29. 다음 중 선형회귀모형의 통계적으로 유의미한지 평가하는 통계량으로 가장 적절한 것은? ① F-statistics ② T-statistics ③ Chi-statistics ④ R-square 정답: 1 출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]] 풀 수 있는 문제 --- 30. 아래 그래프는 392대의 자동차에 대한 연비(mpg)와 엔진 마력(horsepower)를 포함하고 있다. 다음 중 이에 대한 설명으로 가장 적절하지 않은 것은? ![[ADsP 기출문제 이미지 10.png]] ① mpg를 설명하기 위해 horsepower를 설명변수로 하는 단순선형회귀모형은 적절하다. ② horsepower가 증가할수록 mpg가 감소하는 경향이 있다. ③ mpg와 horsepower 간의 피어슨 상관계수는 두 변수의 관계를 잘 설명하지 못할 수도 있다. ④ mpg와 horsepower는 음의 상관관계를 가진다. 정답: 3 출처: [[04 제35회데이터분석준전문가자격검정시험복원문제.pdf]] 풀 수 있는 문제 --- 28. 다음 중 회귀분석에서 확인해야 할 사항으로 틀린 것은? ① 회귀계수의 유의미함을 판단하기 위해 t-통계량과 p-value, 이들의 신뢰구간을 확인한다. ② 모형의 설명력을 확인하기 위해 1에서 1사이의 값을 갖는 결정계수를 확인한다. ③ 모형이 통계적으로 유의미한지 확인하기 위해 F-통계량을 확인한다. ④ 모형이 데이터를 잘 적합하는지 확인하기 위해 잔차 그래프를 그리고 회귀잔차를 한다. 정답: 2 [[06 제37회데이터분석준전문가자격검정시험복원문제.pdf]] 풀 수 있는 문제 --- 36. 회귀분석에 대한 설명으로 가장 적절한 것은? ① 여러 개의 종속변수와 독립변수 사이의 관계를 분석하는 것을 단순회귀분석이라고 한다. ② 독립변수를 활용하여 종속변수가 속하는 그룹을 예측하기 위한 비선형 모델이다. ③ 관찰된 연속형 변수에 대해 두 변수 사이의 모형을 추정한 뒤 변수 간 관계를 파악한다. ④ 종속변수의 변화는 독립변수의 변화를 예측할 수 있다. 정답: 3 [[06 제37회데이터분석준전문가자격검정시험복원문제.pdf]] 풀 수 있는 문제 --- 09. 아래 괄호 안에 들어갈 용어는? ``` 회귀분석의 정규성이란 ( )(이)가 정규분포를 만족한다는 것을 의미한다. ( ) ``` 정답: 잔차 [[06 제37회데이터분석준전문가자격검정시험복원문제.pdf]] 풀 수 있는 문제 ---