정오행렬 /분류행렬( Confusion Matrix)
[1] 기준 ,알고 싶은 변수(Positivie)
<-> [0](Negative)
정확도 (Accuracy) vs 오류율(Error Rate)
정확도 (Accuracy)
클래스 0과 1 모두를 정확하게 분류
TN+TP/TN+TP+FP+FN
오류율(Error Rate)
클래스 0과 1 모두를 정확하게 분류하지 못함
FP+FN/TN+TP+FP+FN or 1-Accuracy
TPR(True Positive Rate) vs FPR(False Positive Rate)
TPR(True Positive Rate)
실제 Class 1중에 잘 맞춘 것
TP/FN+TP
FPR(False Positive Rate)
실제 Class 0중에 못 맞춘 것
FP/TN+FP
민감도(Sensitivity) vs 특이도(Specificity)
민감도(Sensitivity)
실제 Class 1중에 잘 맞춘 것
TP/FN+TP
특이도(Specificity)
실제 Class 0중에 잘 맞춘 것
TN/TN+FP or 1-FPR
재현율(Recall) vs 정밀도(Precision)
재현율(Recall)
실제 Class 1중에 잘 맞춘 것
TP/FN+TP
정밀도(Precision)
예측 Class 1중에 잘 맞춘 것
TP/TP+FP
※ TPR = 민감도(Sensitivity) = 재현율(Recall)
'데이터마이닝.기계학습' 카테고리의 다른 글
데이터마이닝이란 (0) | 2021.03.12 |
---|---|
예측모델 평가척도 (0) | 2021.03.12 |
연관규칙 (0) | 2021.03.11 |
이익도표(Lift chart) (0) | 2021.03.11 |
로지스틱 회귀분석 : glm summary 결과 해석 (0) | 2021.03.11 |