### 분산분석 분산분석의 기본 가정이 아닌 것은? - 관측값들은 독립적이어야 한다. - 각 모집단에서 독립변수는 F분포를 따른다. - 각 모집단에서 반응변수는 정규분포를 따른다. - 반응변수의 분산은 모집단에서 동일하다. #### 해설 ### 분산분석(ANOVA)의 기본 개념 이해하기 분산분석(ANOVA, Analysis of Variance)은 두 개 이상의 그룹 간의 평균 차이를 비교하는 통계 기법입니다. 분산분석을 정확히 수행하기 위해서는 몇 가지 가정이 필요합니다. 주어진 문제를 이해하기 위해 다음 개념들을 실제 데이터 예시와 연구 주제를 통해 설명하겠습니다. #### 1. 관측값들의 독립성 **가정:** 각 관측값은 독립적으로 측정되어야 합니다. **예시:** 학생들의 시험 점수를 비교하는 연구에서, 한 학생의 점수는 다른 학생의 점수에 영향을 주지 않아야 합니다. **연구주제:** "세 개의 서로 다른 교수법이 학생들의 수학 점수에 미치는 영향을 비교하는 연구"에서, 한 학생의 점수가 다른 학생의 점수에 영향을 미치지 않도록 독립적으로 수집해야 합니다. #### 2. 반응변수의 정규성 **가정:** 각 모집단에서 반응변수는 정규분포를 따라야 합니다. **예시:** 각 교수법 그룹의 학생 수학 점수 분포가 정규분포를 따라야 합니다. **연구주제:** "세 개의 서로 다른 교수법이 학생들의 수학 점수에 미치는 영향을 비교하는 연구"에서, 각 교수법 그룹의 점수가 정규분포를 따르는지 확인해야 합니다. #### 3. 등분산성 **가정:** 반응변수의 분산은 각 모집단에서 동일해야 합니다. **예시:** 세 그룹의 수학 점수 분산이 동일해야 합니다. **연구주제:** "세 개의 서로 다른 교수법이 학생들의 수학 점수에 미치는 영향을 비교하는 연구"에서, 세 그룹 간 점수 분산이 같아야 합니다. 즉, 각 그룹의 점수의 흩어짐 정도가 비슷해야 합니다. #### 4. 독립변수의 분포 **가정:** 각 모집단에서 독립변수는 F분포를 따라야 한다는 것은 분산분석의 가정이 아닙니다. 이 문장은 잘못된 가정입니다. **분석:** 분산분석의 기본 가정은 독립변수가 F분포를 따른다는 것이 아니라, 독립변수들이 서로 독립적이고 반응변수와의 관계에서 정규성, 등분산성 등의 가정을 만족해야 한다는 것입니다. ### 결론 주어진 문제에서 분산분석의 기본 가정이 아닌 것은: - 각 모집단에서 독립변수는 F분포를 따른다. 이 가정은 잘못된 가정입니다. 실제로는 독립변수가 F분포를 따라야 한다는 가정은 존재하지 않습니다. F분포는 ANOVA 테스트의 결과를 평가하는 데 사용되는 분포입니다. ANOVA에서 검정 통계량이 F분포를 따르기 때문에, 이 결과를 통해 그룹 간 평균 차이를 평가하게 됩니다. --- ### 일원배치 분산분석 일원배치 분산분석에서 자유도에 대한 설명으로 틀린 것은? - 총제곱합의 자유도는 (자료의 총 개수 - 1)이다. - 집단 간 제곱합의 자유도는 (집단의 개수 - 1)이다. - 집단 내 제곱합의 자유도는 (자료의 총 개수 - 집단의 개수)이다. - 집단 내 제곱합의 자유도는 총제곱합의 자유도에서 집단 간 제곱합의 자유도를 뺀 값이다. #### 해설 ### 일원배치 분산분석(One-way ANOVA)에서 자유도에 대한 설명 일원배치 분산분석은 하나의 독립변수에 대해 여러 그룹 간의 평균 차이를 비교하는 통계 기법입니다. 자유도에 대한 이해는 ANOVA를 올바르게 수행하는 데 필수적입니다. 각 문장에 대한 설명을 실제 데이터 예시와 연구 주제를 통해 설명하겠습니다. #### 1. 총제곱합의 자유도 **설명:** 총제곱합(SST, Total Sum of Squares)의 자유도는 전체 자료의 개수에서 1을 뺀 값입니다. \[ \text{SST 자유도} = N - 1 \] 여기서 N은 자료의 총 개수입니다. **예시:** 30명의 학생이 세 그룹으로 나누어져 각각 다른 교수법으로 수업을 들었다고 가정합니다. 총 학생 수는 30명입니다. 따라서 총제곱합의 자유도는 30 - 1 = 29입니다. **연구주제:** "세 개의 서로 다른 교수법이 학생들의 수학 점수에 미치는 영향을 비교하는 연구"에서, 전체 학생 수가 30명이면 총제곱합의 자유도는 29가 됩니다. #### 2. 집단 간 제곱합의 자유도 **설명:** 집단 간 제곱합(SSB, Sum of Squares Between)의 자유도는 집단의 개수에서 1을 뺀 값입니다. \[ \text{SSB 자유도} = k - 1 \] 여기서 k는 집단의 개수입니다. **예시:** 세 개의 교수법 그룹이 있다면, 집단 간 제곱합의 자유도는 3 - 1 = 2입니다. **연구주제:** "세 개의 서로 다른 교수법이 학생들의 수학 점수에 미치는 영향을 비교하는 연구"에서, 교수법 그룹이 3개이므로 집단 간 제곱합의 자유도는 2가 됩니다. #### 3. 집단 내 제곱합의 자유도 **설명:** 집단 내 제곱합(SSW, Sum of Squares Within)의 자유도는 전체 자료의 개수에서 집단의 개수를 뺀 값입니다. \[ \text{SSW 자유도} = N - k \] 여기서 N은 자료의 총 개수, k는 집단의 개수입니다. **예시:** 30명의 학생이 세 개의 그룹으로 나누어져 있다면, 집단 내 제곱합의 자유도는 30 - 3 = 27입니다. **연구주제:** "세 개의 서로 다른 교수법이 학생들의 수학 점수에 미치는 영향을 비교하는 연구"에서, 총 학생 수가 30명이고 그룹이 3개이므로 집단 내 제곱합의 자유도는 27이 됩니다. #### 4. 집단 내 제곱합의 자유도는 총제곱합의 자유도에서 집단 간 제곱합의 자유도를 뺀 값이다. **설명:** 이 설명은 맞습니다. 총제곱합의 자유도는 집단 간 제곱합의 자유도와 집단 내 제곱합의 자유도를 더한 값과 같습니다. \[ \text{SST 자유도} = \text{SSB 자유도} + \text{SSW 자유도} \] 따라서, \[ \text{SSW 자유도} = \text{SST 자유도} - \text{SSB 자유도} \] **예시:** 위의 예시를 사용하면, 총제곱합의 자유도는 29, 집단 간 제곱합의 자유도는 2입니다. 따라서 집단 내 제곱합의 자유도는 29 - 2 = 27이 됩니다. **연구주제:** "세 개의 서로 다른 교수법이 학생들의 수학 점수에 미치는 영향을 비교하는 연구"에서, 총제곱합의 자유도가 29이고 집단 간 제곱합의 자유도가 2이므로 집단 내 제곱합의 자유도는 27이 됩니다. ### 결론 주어진 문제에서 일원배치 분산분석의 자유도에 대한 설명으로 틀린 것은: - 집단 내 제곱합의 자유도는 (자료의 총 개수 - 집단의 개수)이다. 이 설명은 틀린 것입니다. 정확한 집단 내 제곱합의 자유도는 (자료의 총 개수 - 집단의 개수)이며, 이는 맞습니다. 그러나 문제의 다른 문장을 틀린 것으로 제시하는 것은 자유도 계산에서 혼동을 피하는 데 중요합니다. 주어진 설명 중에 모두 맞기 때문에, 특정 부분이 틀리다는 것을 찾기 어렵지만, 문장의 일관성을 확인해야 합니다. --- ### 공분산 공분산에 대한 설명으로 틀린 것은? - 공분산은 음수의 값을 가질 수 있다. - 한 변수의 분산이 0이면, 공분산도 0이다. - 두 변수의 선형관계의 밀접성 정도를 나타낸다. - 공분산이 양수이면 두 변수가 같은 방향으로 움직이는 것을 나타낸다. #### 해설 ### 공분산(Covariance)에 대한 기본 개념 이해하기 공분산은 두 변수 간의 관계를 나타내는 통계량입니다. 주어진 문제를 이해하기 위해 공분산에 대한 기본 개념을 실제 데이터 예시와 연구 주제를 통해 설명하겠습니다. #### 1. 공분산은 음수의 값을 가질 수 있다. **설명:** 공분산은 두 변수의 관계를 나타내며, 두 변수가 반대 방향으로 움직이면 음수의 값을 가질 수 있습니다. **예시:** 주식 A와 주식 B가 있습니다. 주식 A의 가격이 오를 때 주식 B의 가격이 내리는 경향이 있다면, 두 주식의 공분산은 음수가 될 수 있습니다. **연구주제:** "주식 A와 주식 B의 가격 변화 간의 관계를 분석"하는 연구에서, 두 주식의 가격이 반대 방향으로 움직일 경우 공분산이 음수입니다. #### 2. 한 변수의 분산이 0이면, 공분산도 0이다. **설명:** 한 변수의 분산이 0이라는 것은 그 변수가 상수임을 의미합니다. 상수 변수와 다른 변수 간의 공분산은 0입니다. **예시:** 변수 X가 항상 5라는 값을 가진다면, X의 분산은 0입니다. 이때 다른 변수 Y와의 공분산도 0이 됩니다. **연구주제:** "기온과 특정 지역의 고정된 평균 기온과의 관계를 분석"하는 연구에서, 특정 지역의 기온이 일정하다면, 기온과 그 지역의 기온 간의 공분산은 0입니다. #### 3. 두 변수의 선형관계의 밀접성 정도를 나타낸다. **설명:** 공분산은 두 변수 간의 방향성을 나타내지만, 선형관계의 밀접성 정도를 정량적으로 나타내지는 않습니다. 선형관계의 밀접성을 정확히 나타내기 위해서는 상관계수(correlation coefficient)를 사용해야 합니다. **예시:** 변수 X와 Y가 있습니다. 공분산이 크면 두 변수의 변화 방향이 비슷하다는 것을 의미하지만, 그 관계가 얼마나 강한지는 알 수 없습니다. **연구주제:** "두 변수의 방향성을 분석"하는 연구에서 공분산은 방향성을 나타내지만, 선형관계의 밀접성을 측정하기 위해서는 상관계수를 사용해야 합니다. #### 4. 공분산이 양수이면 두 변수가 같은 방향으로 움직이는 것을 나타낸다. **설명:** 공분산이 양수이면 두 변수가 동시에 증가하거나 동시에 감소하는 경향이 있음을 의미합니다. **예시:** 주식 A와 주식 B가 있습니다. 주식 A의 가격이 오를 때 주식 B의 가격도 오르는 경향이 있다면, 두 주식의 공분산은 양수입니다. **연구주제:** "주식 A와 주식 B의 가격 변화 간의 관계를 분석"하는 연구에서, 두 주식의 가격이 같은 방향으로 움직일 경우 공분산이 양수입니다. ### 결론 주어진 문제에서 공분산에 대한 설명으로 틀린 것은: - 두 변수의 선형관계의 밀접성 정도를 나타낸다. 이 설명은 틀린 것입니다. 공분산은 두 변수 간의 방향성을 나타내지만, 선형관계의 밀접성 정도를 정확히 나타내지는 않습니다. 선형관계의 밀접성을 나타내기 위해서는 공분산을 정규화한 상관계수를 사용해야 합니다. --- ### 검정력 가설검정 시 대립가설 (H1) 이 사실인 상황에서 귀무가설 (Ho) 을 기각할 확률을 무엇이라 하는가? - 검정력 - 신뢰수준 - 유의수준 - 제 2종 오류를 범할 확률 #### 해설 ### 가설검정의 기본 개념 이해하기 가설검정에서 대립가설(H1)이 사실인 상황에서 귀무가설(H0)을 기각할 확률은 **검정력**이라고 합니다. 이를 이해하기 위해 가설검정의 주요 개념을 실제 데이터 예시와 연구 주제를 통해 설명하겠습니다. #### 1. 검정력 (Power of a Test) **설명:** 검정력은 실제로 대립가설이 참일 때 이를 올바르게 기각할 확률을 의미합니다. 이는 제2종 오류(β)를 피할 확률과 관련이 있습니다. 검정력이 높을수록 실제로 효과가 있을 때 이를 발견할 가능성이 커집니다. **예시:** 새로운 약물의 효과를 테스트하는 연구에서, 검정력이 높으면 실제로 약물이 효과가 있을 때 이를 발견할 확률이 높습니다. 예를 들어, 검정력이 0.8이면, 실제로 약물이 효과가 있을 때 80%의 확률로 이를 발견할 수 있습니다. **연구주제:** "새로운 약물의 효능을 시험하는 연구"에서 검정력이 높다면, 실제로 약물이 효과가 있을 때 이를 검출할 가능성이 높습니다. #### 2. 신뢰수준 (Confidence Level) **설명:** 신뢰수준은 모집단의 모수를 포함하는 구간 추정의 신뢰도를 의미합니다. 예를 들어, 신뢰수준이 95%라면, 100번의 표본 추출 중 95번은 해당 구간이 모수를 포함하게 됩니다. **예시:** 95% 신뢰구간을 사용하여 평균 혈압을 추정하는 경우, 이 신뢰구간은 모집단의 평균 혈압을 95%의 확률로 포함하게 됩니다. **연구주제:** "성인 남성의 평균 혈압을 추정하는 연구"에서 95% 신뢰수준을 사용하면, 이 구간이 실제 평균 혈압을 포함할 가능성이 95%입니다. #### 3. 유의수준 (Significance Level) **설명:** 유의수준(α)은 귀무가설(H0)이 참일 때 이를 기각할 확률을 의미합니다. 이는 제1종 오류(실제로 참인 귀무가설을 기각하는 오류)를 범할 최대 허용 확률입니다. 일반적으로 유의수준은 0.05(5%)로 설정됩니다. **예시:** 새로운 약물의 효과를 테스트하는 연구에서, 유의수준이 0.05라면, 실제로 약물이 효과가 없을 때 이를 효과가 있다고 잘못 결론 내릴 확률이 5%입니다. **연구주제:** "새로운 약물의 효능을 시험하는 연구"에서 유의수준을 0.05로 설정하면, 실제로 약물이 효과가 없더라도 5%의 확률로 효과가 있다고 결론지을 수 있습니다. #### 4. 제 2종 오류를 범할 확률 (Probability of Type II Error) **설명:** 제2종 오류(β)는 대립가설(H1)이 참일 때 귀무가설(H0)을 기각하지 않는 오류를 범할 확률입니다. 이는 실제로 효과가 있음에도 불구하고 이를 발견하지 못하는 확률을 의미합니다. **예시:** 새로운 약물이 실제로 효과가 있음에도 불구하고, 효과가 없다고 결론 내리는 경우가 제2종 오류입니다. 검정력은 1 - β이므로, 검정력이 높을수록 제2종 오류를 범할 확률이 낮아집니다. **연구주제:** "새로운 약물의 효과를 시험하는 연구"에서, 제2종 오류를 줄이기 위해 검정력을 높여야 합니다. 이는 더 큰 표본을 사용하거나, 더 민감한 측정 도구를 사용하는 방법 등을 포함할 수 있습니다. ### 문제에 대한 답변 가설검정 시 대립가설(H1)이 사실인 상황에서 귀무가설(H0)을 기각할 확률은 **검정력**입니다. 따라서 주어진 선택지에서 정답은: - **검정력**입니다. --- ### 비대칭도(왜도) 비대칭도 (Skewness) 에 관한 설명으로 틀린 것은? - 비대칭도의 값이 1이면 좌우대칭형인 분포를 나타낸다. - 비대칭도는 대칭성 혹은 비대칭성을 나타내는 측도이다. - 비대칭도의 부호는 관측값 분포의 긴 쪽 꼬리 방향을 나타낸다. - 비대칭도의 값이 음수이면 자료의 분포 형태가 왼쪽으로 꼬리를 길게 늘어뜨린 모양을 나타낸다. #### 해설 ### 비대칭도(Skewness)의 기본 개념 이해하기 비대칭도(Skewness)는 데이터 분포의 비대칭성을 측정하는 통계적 지표입니다. 비대칭도의 값과 부호는 분포의 꼬리 방향을 나타내며, 이를 이해하기 위해 다음의 개념을 실제 데이터 예시와 연구 주제를 통해 설명하겠습니다. #### 1. 비대칭도의 값이 0이면 좌우대칭형인 분포를 나타낸다. **설명:** 비대칭도의 값이 0이면 데이터 분포가 완전히 대칭적임을 의미합니다. 즉, 평균을 중심으로 좌우 대칭인 분포를 나타냅니다. **예시:** 시험 점수가 평균을 중심으로 대칭적으로 분포되어 있을 때, 비대칭도의 값은 0이 됩니다. **연구주제:** "학생들의 수학 시험 점수 분포"에서, 점수가 평균을 중심으로 좌우 대칭적이라면 비대칭도의 값은 0입니다. #### 2. 비대칭도는 대칭성 혹은 비대칭성을 나타내는 측도이다. **설명:** 비대칭도는 분포의 대칭성 또는 비대칭성을 나타내는 측도입니다. 분포가 좌우 대칭이면 비대칭도는 0, 왼쪽 또는 오른쪽으로 치우친 경우 비대칭도는 양수 또는 음수 값을 가집니다. **예시:** 연봉 분포에서 일부 고액 연봉자가 오른쪽 꼬리를 길게 만든다면, 이 분포는 오른쪽으로 비대칭성을 가지며, 비대칭도는 양수가 됩니다. **연구주제:** "한 회사의 연봉 분포"에서, 고액 연봉자가 많아 오른쪽 꼬리가 길어진다면 비대칭도는 양수입니다. #### 3. 비대칭도의 부호는 관측값 분포의 긴 쪽 꼬리 방향을 나타낸다. **설명:** 비대칭도의 부호는 데이터 분포의 긴 꼬리가 어느 방향으로 향하는지를 나타냅니다. 비대칭도가 양수면 오른쪽 꼬리가 길고, 음수면 왼쪽 꼬리가 깁니다. **예시:** 시험 점수에서 일부 학생이 매우 낮은 점수를 받아 왼쪽 꼬리가 길어지면, 비대칭도는 음수가 됩니다. **연구주제:** "학생들의 수학 시험 점수 분포"에서, 일부 학생의 매우 낮은 점수로 인해 분포의 왼쪽 꼬리가 길어지면 비대칭도는 음수가 됩니다. #### 4. 비대칭도의 값이 음수이면 자료의 분포 형태가 왼쪽으로 꼬리를 길게 늘어뜨린 모양을 나타낸다. **설명:** 비대칭도의 값이 음수면 분포의 왼쪽 꼬리가 길게 늘어져 있는 형태를 나타냅니다. 이는 낮은 값들이 많이 존재한다는 것을 의미합니다. **예시:** 주택 가격이 매우 낮은 가격대에 많이 분포하고 일부 고가 주택이 적게 분포할 때, 비대칭도는 음수가 됩니다. **연구주제:** "주택 가격 분포"에서, 저가 주택이 많이 분포하고 고가 주택이 적게 분포한다면 비대칭도는 음수가 됩니다. ### 문제에 대한 답변 비대칭도에 관한 설명으로 틀린 것은 다음과 같습니다: - 비대칭도의 값이 1이면 좌우대칭형인 분포를 나타낸다. - 비대칭도는 대칭성 혹은 비대칭성을 나타내는 측도이다. - 비대칭도의 부호는 관측값 분포의 긴 쪽 꼬리 방향을 나타낸다. - 비대칭도의 값이 음수이면 자료의 분포 형태가 왼쪽으로 꼬리를 길게 늘어뜨린 모양을 나타낸다.