안녕하세요, 데이터에듀 윤종식입니다.
2025년 ADsP 마지막 시험인 제47회(3과목) 기출 복원을 공개합니다.
이번 시험은 전반적으로 보통 수준의 난이도였으며, 전체 출제 흐름은 최근 회차와 유사했습니다. 다만 표본추출·가설검정, 박스플롯 경계, ARIMA·정상성, 활성화 함수, EM·SOM·스크리 플롯 등에서 일부 심화 문항과 레벨 5의 고난이도 문제가 일부 포함되어 까다롭게 느낀 수험생도 있었습니다.
그럼에도 30문항 중 20문항 이상은 45~46회와 난이도·주제가 유사하여, 예상문제·모의고사·최근 기출 중심으로 학습했다면 충분히 대응 가능한 수준이었습니다. 종합적으로 합격 난이도는 무난한 회차로 평가됩니다.
21. 다음 중 절대적 영점(Absolute Zero) 이 존재하는 척도는 무엇인가?
> 비율척도(Ratio Scale)
22. 다음 중 탐색적 데이터 분석(EDA, Exploratory Data Analysis) 의 특성으로 적절하지 않은 것은 무엇인가?
> 동일한 분석 결과를 얻기 위해 재현성을 검증하는 단계이다.
23. 아래 boxplot에서 상한(최댓값)과 하한(최솟값)은 얼마인가?
<아래>
Q1(1사분위수) = 4, Q3(3사분위수) = 12
> 하한 = -8, 상한 = 24
24. 다음 중 가설검정에서 1종 오류(Type I Error) 와 2종 오류(Type II Error) 에 대한 설명으로 적절하지 않은 것은 무엇인가?
> 유의수준(α)은 1종 오류가 발생할 최소허용확률을 의미한다.
25. 다음 중 표본조사에 대한 설명으로 잘못된 것을 고르시오
> 표본추출로 비표본오차를 최소화하거나 없앨 수 있다.
26. 다음 분포에서 A, B, C에 해당하는 통계량의 연결로 옳은 것은?
> A: 최빈값, B: 중앙값, C: 평균
27. 다음 중 표본추출 방법에 대한 설명으로 옳지 않은 것은 무엇인가?
> 계통추출 - N개의 개체에 번호를 부여하고 k 간격으로 나눈 후 각 집단에서 임의로 추출한다.
28. 다음 중 통계적 유의성(Statistical Significance) 에 대한 설명으로 적절하지 않은 것은 무엇인가?
> p-value가 클수록 귀무가설을 기각할 가능성이 높아진다.
29. 다음은 수면개선 프로그램 참여 여부에 따른 두 그룹(그룹1, 그룹2)의 수면시간 변화량을 나타낸 상자그림(Boxplot)이다. 이를 해석한 내용 중 부적절한 것은 무엇인가?
> 그룹2는 왼쪽 꼬리가 긴 형태로 그래프로 나타내어진다.
30. 아래 주성분분석 결과에 대한 설명으로 틀린 것은 무엇인가?
> Javelin 변수의 영향력이 가장 크다.
31. 다음 중 단순회귀모형에서 SSE가 20이고, 샘플이 10일때, MSE는 얼마인가?
> 2.50
32. 다중회귀분석에서 다중공선성 문제를 대처하기 위해 사용할 수 있는 방법으로 가장 적절하지 않은 것은?
> Logistic
33. 다중회귀분석에서 다중공선성(Multicollinearity)에 대한 설명으로 적절하지 않은 것은 무엇인가?
> 다중공선성이 존재하더라도 회귀계수의 분산은 항상 같다.
34. 다음 중 아래의 결과물에 대한 설명으로 적절하지 않은 것은 무엇인가?
> 다른 설명변수의 조건이 동일할 때 사립학교(Private Yes)의 경우 공립학교(Private No)에 비해 졸업률이 낮다.
35. 다음은 회귀분석을 수행한 결과에 대한 설명이다. 다음 중 가장 적절하지 않은 것은?
>변수 drat은 p-값이 0.05보다 크므로 유의하지 않으며, 따라서 최종 회귀식은 mpg = 29.39 - 0.03 × hp - 3.22 × wt 로 표현된다.
36. 다음 중 시계열 분석에 대한 설명으로 가장 적절하지 않은 것은?
>백색잡음은 대표적인 비정상 시계열이다.
37. 두 변수의 비선형 관계를 분석하기 위해 사용할 수 있는 지표로 가장 적절한 것은?
> 스피어만 상관계수
38. 다음 중 ARIMA 모형에 대해 적절하지 않은 것은?
> 자기회귀의 차수를 결정한 후 차분의 차수를 결정한다.
39. 신용카드 대금(Balance)과 소득(Income), 학생 여부(Student=Y/N)를 포함한 아래 회귀 분석 결과를 바탕으로 가장 부적절한 설명은 무엇인가?
> Income을 통제한 후에도, 학생 여부와 신용카드 대금의 관계는 독립적이다.
40. 다음 중 시계열 자료의 정상성(Stationarity) 을 판단하기 위한 조건으로 적절하지 않은 것은 무엇인가?
> 시계열의 자기상관계수가 시간의 흐름에 따라 점차 감소한다.
41. 다음 중 인공신경망에서 분류(Classification) 문제에 사용되는 Softmax 활성화 함수로 옳은 것은 무엇인가?
> f(zᵢ) = e⁽ᶻᵢ⁾ ∕ ( ∑ⱼ₌₁ᵏ e⁽ᶻⱼ⁾ )
42. 다음 중 앙상블(Ensemble) 학습에 대한 설명으로 부적절한 것은 무엇인가?
> 부스팅(Boosting) 은 모든 개별 모델에 동일한 가중치를 부여하여 순차적으로 학습한다.
43. 다음 설명에 해당하는 활성화 함수는 무엇인가?
입력층이 직접 출력층으로 연결되는 인공 신경망에서 출력층의 노드가 1개일 때 이 활성화 함수를 사용하면 로지스틱 회귀 모형과 작동 원리가 동일해진다.
> 시그모이드 함수
44. 아래 오분류표를 보고 민감도를 구하시오
> 0.33
45. 혼합 분포 군집에서 최대 가능도 추정에 대한 것은?
> EM 알고리즘
46. 다음 중 아래의 스크릿 플랏을 보고 k-평균 군집분석에서 k구하시오
> 4
47. 다음 중 군집분석(Clustering) 기법에 대한 설명으로 적절하지 않은 것은 무엇인가?
> SOM 에서는 각 입력벡터마다 노드의 수가 동일하게 변한다.
48. 다음 중 군집분석(Clustering) 기법에 대한 설명으로 적절하지 않은 것은 무엇인가?
> K-평균 군집화(K-means Clustering) 에서 초기 중심값(k값) 의 설정은 결과에 영향을 주지 않는다.
49. 다음 중 군집 내 편차들의 제곱합을 고려한 군집 연결 방법은?
> 와드연결법
50. 아래는 품목별 거래내역을 통해 우유와 커피의 지지도를 구하시오.
우유 : 20
커피 : 30
우유,커피 : 30
우유,초콜릿 : 20
전체: 100
> 0.3
문제는 복원되는 과정에서 문제의 순서가 틀릴 수 있으며, 정확히 복원이 되지 않은 문제가 있을 수 있습니다. 또, 복원된 문제가 수정될 수 있고 정답도 변경될 수 있습니다.
문제와 정답에 이견이 있으신 분들은 댓글을 이용해 주시기 바랍니다.
의견을 주시면 반영하여 바로 수정할 수 있도록 하겠습니다.
로그인이 필요합니다.
로그인 하시겠습니까?
댓글을 삭제하시겠습니까?
게시글을 삭제하시겠습니까?
댓글
댓글 0