모든 종류의 예측에 있어 신뢰할 수 있고 정확하며 효율적인 모델을 찾기 위해서는 머신러닝 및 데이터 과학에서 모델 성능을 평가해야 합니다. 이를 위한 몇 가지 일반적인 도구로는 혼동 행렬(Confusion Matrix)과 ROC 곡선이 있습니다. 두 가지 모두 서로 다른 목적을 가지고 있으며 언제 사용해야 하는지 정확히 아는 것이 강력한 모델 평가에 중요합니다. 이 블로그에서는 두 도구에 대해 자세히 살펴보고 비교한 후 마지막으로 모델 평가에서 어느 도구를 사용해야 하는지에 대한 지침을 제공할 것입니다.
모든 종류의 예측에 있어 신뢰할 수 있고 정확하며 효율적인 모델을 찾기 위해서는 머신러닝 및 데이터 과학에서 모델 성능을 평가해야 합니다. 이를 위한 몇 가지 일반적인 도구로는 혼동 행렬(Confusion Matrix)과 ROC 곡선이 있습니다. 두 가지 모두 서로 다른 목적을 가지고 있으며 언제 사용해야 하는지 정확히 아는 것이 강력한 모델 평가에 중요합니다. 이 블로그에서는 두 도구에 대해 자세히 알아보고 비교한 후 마지막으로 모델 평가에서 어느 도구를 사용해야 하는지에 대한 지침을 제공합니다.
혼란 행렬은 표입니다. 분류 모델이 얼마나 잘 수행되고 있는지 시각화하는 데 사용됩니다. 일반적으로 모델의 예측을 4가지 클래스로 나눕니다.
참 긍정(TP): 모델이 긍정 클래스를 올바르게 예측합니다.
True Negatives(TN): 모델이 Negative 클래스를 올바르게 예측합니다.
False Positives(FP): 모델이 Positive 클래스를 잘못 예측합니다.
False Negatives(FN): 모델이 네거티브 클래스를 잘못 예측했습니다. 유형 II 오류.
이진 분류의 경우 2x2 행렬로 설정할 수 있습니다. 다중 클래스 분류의 경우 더 큰 행렬로 확장됩니다.
정확도: (TP TN) / (TP TN FP FN)
정밀도: TP / (TP FP)
재현율(민감도): TP / (TP FN)
F1 점수: 2 (정밀도 * Recall) / (Precision Recall)
분류 결과에 대한 세부적인 통찰력을 원하는 경우 특히 혼동 행렬을 사용하세요. 이것이 제공하는 것은 클래스에서의 성능, 더 구체적으로 모델의 약점(예: 높은 오탐률)에 대한 세부적인 분석입니다.
클래스 불균형 데이터 세트: 정밀도, 재현율 및 F1 점수는 혼동 행렬에서 파생될 수 있는 측정항목 중 일부입니다. 이러한 지표는 클래스 불균형을 처리하는 상황에서 유용합니다. 이는 정확성과 비교하여 모델 성능을 실제로 나타냅니다.
이진 및 다중 클래스 분류 문제: 혼란 행렬은 이진 분류 문제에서 일상적으로 사용되는 것을 찾습니다. 그럼에도 불구하고 여러 클래스에서 훈련된 모델을 추정하기 위해 쉽게 일반화할 수 있어 다목적 도구가 됩니다.
수신자 작동 특성(ROC) 곡선 도 1은 차별 임계값이 변화함에 따라 이진 분류기 시스템이 얼마나 잘 수행되는지를 보여주는 그래픽 플롯입니다. 다양한 임계값 설정에서 참양성률과 거짓양성률을 비교하여 ROC 곡선을 만들어야 합니다.
참양성률, 재현율: TP / (TP FN)
FPR(위양성률): FP / (FP TN)
ROC 곡선 아래 영역(AUC-ROC)은 종종 요약 측정값으로 사용됩니다. 모델이 양성 클래스와 음성 클래스를 얼마나 잘 구별할 수 있는지에 대한 것입니다. AUC 1은 완벽한 모델에 해당합니다. AUC 0.5는 판별력이 없는 모델에 해당합니다.
ROC 곡선은 다음 시나리오에서 특히 유용합니다.
이진 분류기 평가 ROC 곡선은 이진 분류 작업에만 적용되므로 다중 클래스 문제에 직접 적용할 수 없습니다.
여러 모델 비교 AUC-ROC를 사용하면 서로 다른 모델을 비교할 수 있습니다. 결정 임계값 선택과 관련하여 불가지론적으로 단일 스칼라 값으로 모델을 만듭니다.
ROC 곡선은 민감도를 알고 싶을 때 도움이 됩니다. -다양한 임계값에서의 특이성 절충.
혼란 행렬: 모델 성능을 클래스별로 분석하여 특정 클래스에 대한 모델 문제를 진단하는 데 매우 유용합니다.
ROC 곡선: AUC로 요약되어 가능한 모든 임계값에 걸쳐 모델의 식별 능력에 대한 전반적인 그림을 제공합니다.
혼란 행렬: 무엇보다도 혼동 행렬의 정밀도 및 재현율과 같은 메트릭은 클래스 불균형의 맥락에서 더 많은 것을 말해 줍니다.
ROC 곡선: 불균형이 심한 데이터 세트의 경우 ROC 곡선은 클래스 분포를 직접 고려하지 않기 때문에 정보가 적을 수 있습니다.
혼동 행렬: 이진 분류뿐만 아니라 다중 클래스 분류도 작동합니다.
ROC 곡선: 주로 이진 분류에 사용되지만 다중 분류로 확장됩니다. 수업문제 출제 가능
혼란 행렬: 측정항목은 고정된 임계값에서 계산됩니다.
ROC 곡선: 가능한 모든 임계값에 대한 성능이 시각화됩니다.
혼란 행렬을 사용해야 하는지 ROC 곡선을 사용해야 하는지 여부는 사례와 특정 요구 사항에 따라 다릅니다.
혼란 행렬과 ROC 곡선 사이의 선택은 특정 요구 사항과 문제의 맥락에 따라 결정됩니다.
각 클래스에 대해 모델의 성능을 자세히 알고 싶을 때
클래스 불균형 데이터를 다루고 있으며 정확도 측정항목 이상의 것이 필요합니다.
멀티클래스 분류를 위한 모델 평가 작업을 진행 중입니다.
다양한 임계값에서 다양한 이진 분류기의 성능을 비교하고 싶습니다.
클래스를 구별하는 모델의 일반적인 능력에 관심이 있습니다.
모델을 비교하기 위해 하나의 요약 측정항목(AUC)만 사용하려고 합니다. .
혼란 행렬과 ROC 곡선은 모두 데이터 과학자의 기술에 정말 유용한 추가 기능입니다. 두 도구는 모델 성능에 대한 서로 다른 통찰력을 제공합니다. 예를 들어, 혼동 행렬은 특히 불균형 데이터세트의 경우 모델이 어떻게 작동하는지 정확히 이해하는 데 중요한 클래스별 세부 측정항목을 제공하는 데 적합합니다. 대조적으로, ROC 곡선은 모든 임계값에 걸쳐 이진 분류기의 전체적인 식별력을 포착하는 데 매우 효과적입니다. 각 기술의 특정 장단점을 숙지하면 보다 정확하고 안정적이며 효과적인 기계 학습 모델을 구축하는 데 있어 특정 모델 평가 요구 사항에 적합한 도구를 적용할 수 있습니다.
위 내용은 혼동 행렬과 ROC 곡선: 모델 평가에 어느 것을 사용해야 하는 경우의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!