남은 문제 : 36

문제 1333 Hitters 데이터셋은 메이저리그에서 활약하는 322명의 선수에 대한 타자 기록으로 연봉을 비롯한 20개의 변수를 포함하고 있다. 아래는 모형적합에 앞서 데이터를 Train set과 Test set으로 분할하는 과정이다. 다음 중 아래에 대한 설명으로 가장 부적절한 것은?

보기 1.50:50으로 데이터를 분할하고 있다.
2.50%의 데이터(Train set)를 사용하여 모형을 학습하고 나머지 50%의 데이터(Test set)로 모형을 평가하기 위한 사전작업이다.
3.모형 학습과 평가를 동일한 데이터셋에 진행하면 모형이 과적합 될 수 있다.
4.일반적으로 Test set에 대한 모형평가 결과가 Train set에 대한 모형평가 결과보다 좋다.
정답 4
해시
태그

lADsP 완전 정복l 데이터 마이닝 추진 단계 / 데이터 분할_1
bzuLGmxw_Ao
04:12
~
06:16
검수 상태 : 불통




lADsP 완전 정복l 데이터 분할_2
i03po9aGsOI
00:06
~
02:04
검수 상태 : 불통




lADsP 완전 정복l 데이터 분할_3 / 성과 분석_1
1F7GZpwAGWc
00:17
~
02:30
검수 상태 : 불통



키워드 : 영상UID : 시작 시간 : 종료 시간 : 우선순위 :
이전 다음