안녕하십니까. 데이터에듀 윤종식입니다.
2026년 시행된 ADsP 제48회(3과목) 기출 복원을 공개합니다.
이번 48회 3과목은 수험생 체감 난이도가 보통~어려움 수준으로 평가되었으며, 특히 통계적 추론·가설검정·회귀 진단과 같이 개념 이해를 바탕으로
R 결과 해석 및 박스플롯·잔차 분석 등 시각 자료를 해석하는 문항이 다수 출제되어 까다롭게 느낀 수험생이 많았습니다.
다만 출제 범위 자체는 기출 및 예상 문제에서 벗어나지 않았으며,
상관계수 성질, 교차분석, 가설검정 판단, PCA, 로지스틱 회귀, 의사결정나무, 연관규칙 지표, 결측값 처리 등 빈출 핵심 주제들이 중심적으로 출제되었습니다.
3과목은 계산과 해석이 결합된 과목 특성상,
개념 암기만으로는 대응이 어렵고 표·그래프·분석 결과를 해석하는 연습 여부에 따라 체감 난이도가 크게 달라지는 과목입니다.
이번 회차에서도 이러한 특징이 뚜렷하게 나타난 것으로 보입니다.
21. chickwts 데이터는 여섯 가지 닭 사료 첨가물(feed)과 각 사료를 먹인 닭의 무게(weight)를 변수로 가진다. 아래는 사료 첨가물별 닭의 무게를 비교한 상자그림(Box Plot)이다.이 상자그림을 바탕으로 한 설명 중 가장 적절하지 않은 것은 무엇인가?
> meatmeal 그룹에 속한 관측치의 수가 가장 많다.
22. 다음 중 데이터의 이상값(outlier) 탐지 및 처리 방법에 대한 설명으로 가장 적절하지 않은 것은 무엇인가?
> 상자그림(Box Plot)을 활용한 이상값 탐지는 평균과 표준편차를 기준으로 이상 여부를 판단한다.
23. 다음 중 통계적 추론(statistical inference)에 대한 설명으로 가장 적절하지 않은 것은 무엇인가?
> 가설검정에서 사용되는 검정통계량은 항상 하나로만 유일하게 결정된다.
24. 다음은 회귀분석에서 모형의 적절성을 확인하기 위한 질문과 그에 대한 판단 방법을 제시한 것이다. 이 중 가장 적절하지 않은 것은 무엇인가?
> 모형이 데이터에 적합한가? → 설명변수 간 상관계수를 확인한다.
25. 다음 중 온도(섭씨, 화씨)나 각종 지수와 같이 절대영점이 존재하지 않는 데이터를 분류하는 데 가장 적절한 척도는 무엇인가?
> 구간척도
26. 다음은 가설검정(hypothesis testing)에 대한 설명이다.이 중 가장 적절하지 않은 것은 무엇인가?
> 귀무가설이 참이라는 가정하에 검정통계량의 값이 나타날 가능성이 작을수록 귀무가설을 채택한다.
27. 교차분석(cross-tabulation analysis)은 두 개 이상의 변수를 결합하여 자료의 빈도를 분석하는 기법이다. 다음 중 교차분석에 대한 설명으로 부적절한 것은 무엇인가?
> 교차분석은 두 변수 모두 범주형 변수가 아니어도 적용할 수 있으며, 변수 간 관계를 분석하는 데 사용된다.
28. 두 확률변수 X와 Y의 상관계수가 0.5일 때 다음 중 옳은 것은 무엇인가?
> X+0.3과 Y+0.2의 상관계수는 0.5이다.
29. 선형 회귀 모델을 구축한 후 수행한 잔차 분석 결과가 다음 그림과 같을 때, 해당 모델의 성능을 개선하기 위한 가장 적절한 조치는 무엇인가?
> 독립변수와 종속변수 간의 관계를 검토하여 비선형 모델(다항 회귀 등) 도입을 고려한다.
30. 다음 중 통계적 추론(statistical inference)에 대한 설명으로 가장 적절하지 않은 것은 무엇인가?
> 구간추정(Interval Estimation)은 모수의 참값이 포함되어 있으리라고 추정되는 구간을 결정하는 것이며, 신뢰수준은 주어진 신뢰구간이 모수를 포함할 확률이다.
31. sleep 데이터는 두 종류의 수면유도제(group)에 대해 20명 환자의 수면 시간 증감(extra)을기록한 자료이다. 아래의 두 집단 평균 비교 결과를 바탕으로 한 설명 중 가장 적절하지 않은 것은 무엇인가?
> 유의수준 1%에서 수면유도제 2가 수면유도제 1보다 평균 수면시간을 유의하게 증가시킨다고 결론 내릴 수 있다.
32. 다음은 주성분 분석(PCA)에 대한 설명이다. 이 중 옳지 않은 것은 무엇인가?
> 제1주성분에서 제2주성분으로 갈수록 각 주성분이 설명하는 분산은 증가한다.
33. Hitters 데이터는 야구선수 322명의 기록과 연봉(Salary) 정보를 포함하고 있다. 다음은 여러 설명변수를 이용해 연봉을 설명하는 다중 선형회귀분석 결과이다. 아래 결과에 대한 설명으로 가장 적절하지 않은 것은 무엇인가?
> 통계적으로 가장 유의한 설명변수는 PutOuts이다.
34. 다음은 로지스틱 회귀분석(Logistic Regression)에 대한 설명이다. 이 중 가장 적절하지 않은 것은 무엇인가?
> 로지스틱 회귀모형의 연결함수(link function)는 시그모이드(sigmoid) 함수이다.
35. 다음은 두 개의 숫자형 변수 간의 관계를 파악하기 위한 척도에 대한 설명이다. 이 중 가장 적절하지 않은 것은 무엇인가?
> 상관계수의 부호가 음수이면, 두 변수는 반비례 관계라고 해석할 수 있다.
36. 다음 중 분해 시계열(decomposition time series)을 구성하는 요소로 적절하지 않은 것은 무엇인가?
> 규칙요인
37. ChickWeight 데이터에서 Weight를 종속변수로, Time을 설명변수로 하는 단순선형회귀분석 결과에 대한 설명 중 올바르지 않은 것은 무엇인가?
> 회귀식의 절편이 0인지 여부를 뚜렷하게 알 수 없다.
38. 다음 중 추세가 존재하는 비정상 시계열을 정상 시계열로 변환하는 방법으로 가장 적절한 것은 무엇인가?
> 차분
39. 다음은 데이터 분할(학습·검증·테스트 데이터)에 대한 설명이다.이 중 옳지 않은 것은 무엇인가?
> 검증 데이터는 최종 모델의 성능을 평가하기 위해 사용된다.
40. 아래 데이터 마이닝 추진 단계를 순서대로 나열한 것 중 가장 옳은 것은?
(가) 데이터 준비
(나) 목적 정의
(다) 데이터 마이닝 기법 적용
(라) 데이터 가공
(마) 검증
(나) -> (가) -> (라) -> (다) -> (마)
41. 다음은 의사결정나무 모형에 대한 설명이다. 이 중 가장 적절하지 않은 것은 무엇인가?
> 반응변수가 연속형 변수인 경우, 의사결정나무 모형은 학습 데이터에 대해 항상 예측 정확도 100%의 모형을 구축할 수 있다.
42. 인공신경망 모형에서 입력층에서 전달된 신호의 합을 출력값으로 변환하여 다음 층으로 전달하는 함수는 무엇인가?
> 활성화 함수
43. 다음 중 변수 간 상관관계를 고려하여 거리 측정을 수행하는 방법은 무엇인가?
> 마할라노비스 거리
44. 아래 설명이 나타내는 평가 지표는 무엇인가?
정밀도(precision)와 재현율(recall)은 한 지표의 값이 높아지면 다른 지표의 값이 낮아질 가능성이 높은 관계를 지니고 있다. ( )는 이러한 효과를 보정하기 위한 만든 지표이다.
F1-score
45. 연관규칙 A->B에 대한 지지도(support)의 계산식으로 올바른 것은 무엇인가?
> (A와 B가 동시에 포함된 거래 수)/(전체 거래 수)
46. 이름과 성별로 구성된 고객 데이터가 있다. 각 고객 데이터에서 이름 항목과 성별 항목은 각각 10%의 확률로 결측값을 가진다고 하자. 이름과 성별의 결측 여부는 서로 독립적이며, 이름 또는 성별 중 하나라도 결측값이 존재하는 고객 데이터는 모두 삭제된다. 이때, 임의로 하나의 고객 데이터를 선택했을 때 해당 데이터가 삭제될 확률은 얼마인가?
> 19%
47. 다음 중 군집 내 오차 제곱합(SSE)의 증가량을 최소화하는 군집분석 연결법은 무엇인가?
> 와드 연결법
48. 정형데이터마이닝 기법 중 반응변수(종속변수)가 없는 데이터의 구조를 파악하는 데 활용되는 기법은 무엇인가?
> K-평균 군집분석
49. 아래 거래에서 연관규칙 A->B 의 신뢰도(Confidence)는 얼마인가?
품목 거래 건수
[A] 100
[B,D] 100
[C] 100
[A, B, C, D] 50
[B, D] 200
[A, B, D] 250
[A, C] 200
50%
50. 연관규칙에서 향상도(Lift)에 대한 설명으로 가장 적절한 것은?
> 향상도가 1보다 크면 해당 규칙은 의미 있는 연관성을 가진다고 볼 수 있다.
※ 본 문제는 수험생 기억을 바탕으로 복원된 문제로,
문제의 순서가 실제 시험과 다를 수 있으며,
일부 문항은 정확히 복원되지 않았을 수 있습니다.
또한 복원 과정에서 문제 및 정답이 수정·보완될 수 있습니다.
문제와 정답에 이견이 있으신 분들은 댓글을 이용해 주시기 바랍니다.
의견을 주시면 반영하여 바로 수정할 수 있도록 하겠습니다.
감사합니다.
로그인이 필요합니다.
로그인 하시겠습니까?
댓글을 삭제하시겠습니까?
게시글을 삭제하시겠습니까?
댓글
댓글 0