데이터마이닝.기계학습

정오행렬(Confusion Matrix)

Nova 2021. 3. 5. 16:57

정오행렬 /분류행렬( Confusion Matrix)

 

[1] 기준 ,알고 싶은 변수(Positivie)

<-> [0](Negative)

 

정확도 (Accuracy)  vs 오류율(Error Rate)

 

정확도 (Accuracy)

클래스 0과 1 모두를 정확하게 분류

TN+TP/TN+TP+FP+FN

 

오류율(Error Rate)

클래스 0과 1 모두를 정확하게 분류하지 못함

FP+FN/TN+TP+FP+FN or 1-Accuracy

 

TPR(True Positive Rate) vs FPR(False Positive Rate)

 

TPR(True Positive Rate)

실제 Class 1중에 잘 맞춘 것

TP/FN+TP

 

FPR(False Positive Rate)

실제 Class 0중에 못 맞춘 것

FP/TN+FP

 

민감도(Sensitivity) vs 특이도(Specificity)

 

민감도(Sensitivity)

실제 Class 1중에 잘 맞춘 것

TP/FN+TP

 

특이도(Specificity)

실제 Class 0중에 잘 맞춘 것

TN/TN+FP  or 1-FPR

 

재현율(Recall)  vs 정밀도(Precision)

 

재현율(Recall)

실제 Class 1중에 잘 맞춘 것

TP/FN+TP

 

정밀도(Precision)

예측 Class 1중에 잘 맞춘 것

TP/TP+FP

 

※ TPR = 민감도(Sensitivity) = 재현율(Recall)

 

 

 

 

'데이터마이닝.기계학습' 카테고리의 다른 글

데이터마이닝이란  (0) 2021.03.12
예측모델 평가척도  (0) 2021.03.12
연관규칙  (0) 2021.03.11
이익도표(Lift chart)  (0) 2021.03.11
로지스틱 회귀분석 : glm summary 결과 해석  (0) 2021.03.11