학습용 데이터로 학습한 모델의 성능을 평가하는 과정
테스트용 데이터로 평가 진행
실전에 얼마나 강한지가 중요!
테스트용 입력 데이터(x)를 학습 모델에 입력하여 예측한 결과(y_pred)가 실제 출력데이터(y)와 일치하는지 여부로 판단
진정한 의미의 학습은 암기한 내용을 똑같이 되새김하는 것만이 아니다.
학습 후에는 현실에 적용할 수 있도록 일반화가 검증되어야 한다.
학습 (train)과 시험 (test).
일반화를 검증하기 위해서는 학습 (train)된 모형을 시험(test) 한다.
시험의 결과는 “오류”로 평가하게 된다.
오류의 유형: 편향 오류 (bias error) or 과소적합 오류 (underfitting error)
모형이 편향적 즉 과하게 단순해서 발생하는 오류의 유형이다.
모형의 복잡성이 증가할 수록 줄일 수 있다.
오류의 유형: 분산 오류 (variance error) or 과적합 오류 (overfitting error)
모형이 과하게 복잡해서 발생하는 오류이며 많은 학습 데이터로 줄일 수 있다.
매개변수 최적화의 어려움으로 표출되는 오류이다.
토탈 오류 = 편향 오류 + 분산 오류 + 상수