정확도 측정항목은 모델이 전체 데이터 세트에서 얼마나 정확하게 예측했는지를 측정한 것입니다. 그러나 이 지표는 데이터 세트가 클래스 균형을 이룬 경우에만 신뢰할 수 있습니다. 즉, 데이터 세트의 각 범주에 대해 동일한 수의 샘플이 있습니다. 그러나 실제 데이터 세트는 종종 불균형이 심각하여 정확도 측정 기준을 더 이상 실현할 수 없습니다. 이 문제를 해결하기 위해 보다 포괄적이고 완전한 머신러닝 평가 지표로 F1 점수가 도입되었습니다. F1 점수는 모델의 정밀도와 재현율을 결합하여 모델의 정확성을 더 잘 평가할 수 있습니다. 정밀도는 모델이 양성으로 예측한 샘플 중 참양성인 표본의 수를 나타내고, 재현율은 모델이 올바르게 예측할 수 있는 참양성의 수를 나타냅니다. F1 점수 계산 공식은 2 * (정밀도 * 재현율) / (정밀도 + 재현율)입니다. 정밀도와 재현율을 종합적으로 고려함으로써 F1 점수는 모델의 성능을 보다 정확하게 평가할 수 있으며, 특히
F1 점수는 정확도를 평가하는 데 사용되는 혼동 행렬과 밀접한 관련이 있습니다. 정밀도 및 재현율과 같은 측정항목입니다. F1 점수는 정밀도와 재현율을 결합하여 모델의 전반적인 성능을 평가합니다.
정밀도는 모델이 내놓는 '긍정적인' 예측 중 몇 개가 올바른지 측정합니다.
Recall은 데이터 세트에 있는 양성 샘플의 수를 모델이 올바르게 인식하는 정도를 측정합니다.
정밀도와 재현율은 하나의 측정항목을 개선하면 다른 측정항목이 희생되는 균형 관계를 제공합니다. 정확도가 높다는 것은 데이터 세트의 실제 양성 샘플을 의심하는 엄격한 분류기를 의미하므로 재현율이 낮아집니다. 반면에, 높은 재현율에는 포지티브 클래스와 유사한 모든 샘플이 통과하도록 허용하는 완화된 분류기가 필요합니다. 이로 인해 일부 엣지 케이스 네거티브 샘플이 "포지티브 클래스"로 잘못 분류되어 정확도가 떨어집니다. 이상적으로는 완벽한 분류기를 얻기 위해 정밀도와 재현율 측정항목을 최대화하고 싶습니다.
F1 점수는 조화 평균을 사용하여 정밀도와 재현율을 결합하며, F1 점수를 최대화한다는 것은 정밀도와 재현율을 동시에 최대화한다는 의미입니다.
F1 점수 계산을 이해하려면 먼저 혼동행렬을 이해해야 합니다. 위에서 F1 점수는 정밀도와 재현율 측면에서 정의된다고 언급했습니다. 그 공식은 다음과 같습니다.
Precision
F1 점수는 아래와 같이 정밀도와 재현율 점수의 조화 평균으로 계산됩니다. 범위는 0~100%이며, F1 점수가 높을수록 분류기 품질이 우수함을 나타냅니다.
다중 클래스 데이터세트의 F1 점수를 계산하려면 일대일 기법을 사용하여 데이터세트의 각 클래스에 대한 개별 점수를 계산합니다. 클래스 정밀도와 재현율 값의 조화 평균을 취합니다. 그런 다음 순 F1 점수는 다양한 평균화 기술을 사용하여 계산됩니다.
거시 평균 F1 점수
미시 평균 F1 점수는 다중 클래스 데이터 분포에 대한 의미 있는 지표입니다. "순" TP, FP 및 FN 값을 사용하여 지표를 계산합니다.
Net TP는 데이터 세트의 클래스 TP 점수의 합을 의미하며, 이는 혼동 행렬을 각 클래스에 해당하는 일대다 행렬로 분해하여 계산됩니다.
가중 F1 점수 샘플
Fβ 점수는 F1 점수의 일반적인 버전입니다. F1 점수와 마찬가지로 조화 평균을 계산하지만 정밀도나 재현율을 우선시합니다. "β"는 가중치 계수를 나타내며, 이는 사용자가 설정한 하이퍼파라미터로 항상 0보다 크다.
위 내용은 머신러닝 평가를 위한 F1 점수 지표에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!