머신 러닝 (1) 썸네일형 리스트형 머신 러닝 입문자를 위한 설명 - 교차 검증(K-Fold Cross Validation) 기계 학습(머신 러닝) 알고리즘은 '모델'이 학습 데이터(Training Data)를 통해 학습된 속성을 기반으로 결과를 예측하도록 합니다. 얼핏 생각하기에는 적합한 데이터를 이용하여 훈련시킨다면 다른 데이터에 대해서도 정확한 답을 내놓을 것 같지만, 실제로 시도해 보면 생각만큼 제대로 작동하지는 않습니다. 여기서는 그 원인들 중 하나인 Overfitting(이하 과적합) 문제에 대해 이야기해보고자 합니다. 과적합이란 '학습이 너무 잘 된 상태'를 의미합니다. 학습이 잘 이루어졌는데 어째서 문제가 발생하는지 궁금하신 분들을 위해 간단한 예시를 들겠습니다. 다음과 같이 붉은색의 예측한 그래프와 파란색의 원하는 결과 그래프가 상이한 상황을 볼 수 있습니다. 이처럼 과적합이란 "모델이 실제 변수들 간의 관계보.. 이전 1 다음