시험후기

ADsP

[최종정리]데이터분석 준전문가 46회 (ADsP 46회) 3과목 데이터 분석 시험분석

관리자 25.08.12 조회 2818

안녕하십니까 데이터에듀 윤종식입니다.

2025년 ADsP 세번째 시험인 46회 기출문제 복원한 내용을 게시합니다.

46회 시험은 전반적으로 이전과 비슷한 수준이었으나, 처음 보는 경향의 문제와 ADP 시험에서 나올 법한 문제가 몇 개 출제되고 어려웠다는 의견이 있었습니다. 다만, 30문제 중 20문제 이상은 45회 시험과 비슷한 난이도의 문제들로 예상문제와 모의고사 그리고 기출문제를 중심으로 공부했다면 충분이 맞출 수 있는 수준의 문제들이 출제되어 합격하는데는 문제가 없는 수준이었던 것으로 평가됩니다.

자세한 내용은 데이터에듀PT에서 확인하실 수 있습니다.

 

21. 결측값에 대한 설명으로 올바른 것은 무엇인가?
>결측값을 대체하는 목적은 과도하게 데이터 정보가 삭제하는 것을을 방지하기 위함이다.

 

22. 가설 검정에 대한 설명으로 가장 적절하지 않은 것은 무엇인가?
>P-value가 유의수준 0.05보다 작으면 대립가설을 기각한다.

 

23. 통계적 추론으로 적절하지 않은 것은?
> 30대 남성 체중 기대값을 E(X)로 할 때 모수로 판단할 수 있다.

 

24. 기다음 확률분포표에서 확률변수 X의 기댓값을 구하시오.
>2.0

 

25. 다음 회귀 분석 결과에서 결정계수(R2)를 구하시오.
SSR = 30 , SSE = 20
>0.6

 

26. 일표본 T 검정을 진행한 결과로 적절하지 않은 것은?
>Alpha값이 0.05로 낮아 유의수준 0.05에서 귀무가설이 기각되지 않는다.

 

27. 중앙 50% 데이터가 흩어진 정도를 나타내는 것은?
>사분위수 범위

 

28. MDS를 수행한 것으로 옳은 것은?
>영화를 본 사람들을 대상으로 취향을 분석한다.

 

29. 독립변수 A와B의 피어슨 상관계수가 0.8이다. p-값이 0.01일 때, 유의수준 0.05 하에서 상관계수에 관한 검정에 대한 설명으로 옳은 것은?
>A와 B는 양의 선형 관계이고, 통계적으로 유의하다

 

30. 아래의 표에서 X,Y의 표본 공분산(Sample Covariance)은 얼마인가?
>3.5

 

31. 다음 중 주성분분석(PCA)에 대한 설명으로 가장 부적절한 것은?
>주성분 수는 데이터의 수만큼 생성이 가능하다.

 

32. 데이터 마이닝 프로세스 올바르게 이은 것은?
>목적 정의 > 데이터 준비 > 데이터 가공 > 기법 적용 > 검증

 

33. 상관 분석에 대한 설명으로 잘못된 것은?
>독립 변수에 대한 종속값을 예측한다.

 

34. 정상성을 가진 시계열 모델의 특징에 대한 설명으로 옳은 것은?
>시계열의 평균과 분산이 시간의 흐름에 따라 변하지 않고 일정하게 유지된다.

 

35. 잔고와 수입에 따른 신용카드 연체 가능성을 회귀 분석한 결과를 주고 옳지 않은 것은?
> 밸런스가 고정일 때 소득이 증가하면 디폴트가 감소한다.

 

36. 다음 중 분류 분석의 정의로 가장 올바른 것은?
> 이미 분류된 데이터를 바탕으로 새로운 데이터가 어떤 그룹에 속하는지 예측하는 분석 기법이다.

 

37. 신경망 모델에 대한 설명으로 적절하지 않은 것은?
>렐루(ReLU) 함수를 활성화 함수로 사용할 때, 은닉층이 없는 인공신경망은 로지스틱 회귀 모형과 동일한 특성을 가진다.

 

38. 다층 퍼셉트론에서 은닉층이 1개일 때 가중치의 수를 구하는 문제/연결 선의 개수를 구하면?
• 입력층(Input Layer): 20개 노드
• 은닉층(Hidden Layer): 50개 노드
• 출력층(Output Layer): 3개 노드
>1150

 

39. 시그모이드(Sigmoid) 함수의 출력값 범위로 알맞은 것은?
>0 <= y <= 1

 

40. 다음 중 부스팅(Boosting)에 대한 설명으로 옳은 것은?
>여러 개의 모델을 순차적으로 학습시켜 예측 성능을 향상시킨다.

 

41. 신경망 모델에 대한 설명으로 옳지 않은 것은?
> 모든 은닉층 노드의 수는 동일하다.

 

42. 다층 퍼셉트론(MLP)에서 출력층의 결과가 다변(multiclass)일 때 주로 사용하는 활성화 함수는 무엇인가?
>Softmax 함수

 

43. 1-특이도를 X축으로 삼고 민감도를 Y축으로 갖는 그래프는?
>ROC 커브

 

44. 다음 중 실제로 참인 데이터(Positive) 중에서 모델이 참(Positive)으로 예측한 비율을 나타내는 지표는 무엇인가?
>재현율

 

45. 분류 나무에서 가지치기의 기준 중 가장 적절하지 않은 것은?
>잔차 제곱합

 

46. K-Means 군집 분석에서 초기 군집 중심(centroid)을 선택하는 방법으로 옳은 것은?
>데이터 집합에서 무작위로 추출한다.

 

47. 연관분석에서 최소 지지도를 2로 설정했다. 다음 보기 중 최대 길이의 빈발항목 집합으로 옳은 것은?
>{b, c, e}

 

48. 다음 중 연관분석에 관한 설명 중 옳지 않은 것은?
>A→B일 때, 지지도보다 신뢰도가 더욱 중요한 지표이다.

 

49. 다음 표는 특정 기간 동안 판매된 음료 구매 건수를 나타낸 것이다. “커피 → 우유”의 지지도(Support)를 구하시오.
>0.3

 

50. 최장연결법을 이용하여 군집 분석을 수행한 결과에 대한 설명으로 옳지 않은 것은?
> 다시 최장연결법으로 분석 해도 결과가 고정된다.

 

문제는 복원되는 과정에서 문제의 순서가 틀릴 수 있으며, 정확히 복원이 되지 않은 문제가 있을 수 있습니다. 또, 복원된 문제가 수정될 수 있고 정답도 변경될 수 있습니다.

문제와 정답에 이견이 있으신 분들은 댓글을 이용해 주시기 바랍니다.

의견을 주시면 반영하여 바로 수정할 수 있도록 하겠습니다.

댓글

댓글 1
  1. 마라탕탕후루룩
    혹시 정답이 몇 번인지는 복원이 어려울까요..?
    25.08.15.
실명으로 변경됐습니다.