混同マトリックスは、機械学習エンジニアがモデルのパフォーマンスをより深く理解するのに役立つ評価モデルです。この記事では、バイナリ クラスの不均衡データ セットを例として取り上げます。このテスト セットは、機械学習モデルを評価するための 60 個のポジティブ クラス サンプルと 40 個のネガティブ クラス サンプルで構成されています。
バイナリ クラス データ セットには 2 つの異なるデータ カテゴリしかなく、単に「ポジティブ」カテゴリと「ネガティブ」カテゴリと名付けることができます。
このバイナリ分類問題の混同行列を完全に理解するには、まず次の用語に精通する必要があります:
True陽性 (TP) は、陽性クラスに属するサンプルが正しく分類されていることを意味します。
真陰性 (TN) は、陰性クラスに属するサンプルが正しく分類されていることを意味します。
偽陽性 (FP) は、陰性クラスに属するサンプルが陽性クラスに属するものとして誤って分類されることを意味します。
偽陰性 (FN) は、陽性クラスに属するサンプルが誤って陰性クラスに分類されることを意味します。
このサンプル データセットについては、モデルをトレーニングすることで取得できる混同行列の例が上に示されています。
最初の列の数値を加算すると、陽性クラスのサンプルの総数は 45 15 = 60 であることがわかります。 2 番目の列の数値を加算して、陰性クラスのサンプル数 (この場合は 40) を取得します。すべてのボックス内の数値の合計が、評価されたサンプルの総数になります。さらに、正しいカテゴリは行列の対角要素です。正のカテゴリでは 45、負のカテゴリでは 32 です。
さて、モデルは左下のボックスを陽性サンプルとして分類します。モデルによって予測された「陰性」が間違っているため、これは「FN」と呼ばれます。同様に、右上のボックスはネガティブ クラスに属すると予想されますが、モデルによって「ポジティブ」として分類されます。したがって、彼らは「FP」と呼ばれます。マトリックス内のこれら 4 つの異なる数値を使用すると、モデルをより注意深く評価できます。
以上が例を使用して、バイナリ クラスの混同行列を理解する方法を示します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。