Search

회귀모델의 평가

MSE(Mean Square Error)

실제값과 예측값간의 차이의 제곱의 평균
가장 직관적이고 일반적인 지표로 이상치에 민감하며 값이 작을수록 좋지만, 과도하게 줄이면 과적합의 오류를 범할 가능성이 있음

RMSE(Root Mean Square Error)

MSE에 Root 씌운 지표
오류 지표를 실제 값과 유사한 단위로 다시 변환했기 때문에 해석이 쉬움

MAPE

MAE(절대값의 차이)를 퍼센트로 변환한 지표
성능 비교 해석이 쉽고 0에 가까울수록 좋음

MSD(Mean Square Deviation)

실측값과 평균의 차이의 제곱의 평균

RMSD(Root Mean Square Deviation)

실측값과 평균의 차이의 제곱의 평균의 제곱근

R2R^2

회귀 분석 모형의 설명력을 나타내는 척도로, 항상 평균을 출력하는 예측모델보다 성능이 얼마나 더 좋은가를 나타냄
결정계수(coefficient of determination)
1에 가까울수록 성능이 좋고, 0에 가까울수록 성능이 떨어짐
변수의 수가 증가하면 R2도 증가

Adjusted R2R^2(수정된 결정계수)

다중 회귀분석의 경우 결정계수는 독립변수의 개수가 증가함에 따라 커지게 되는데, 독립변수의 유의성과 상관없이 독립변수의 개수에 의존하게 되는 단점을 보완
(n : 데이터의 수, k : 독립변수의 개수)