機械学習における正則化とは何ですか?-AI-php.cn

機械学習における正則化とは何ですか?

王林

リリース： 2023-11-06 11:25:01

転載

934 人が閲覧しました

1. はじめに

機械学習の分野では、トレーニングプロセス中に関連するモデルが過学習または過小学習になる可能性があります。これを防ぐために、機械学習で正則化操作を使用してモデルをテストセットに適切に適合させます。一般に、正則化操作は、過学習や過小学習の可能性を減らすことで、誰もが最適なモデルを取得できるようにします。

この記事では、正則化とは何か、正則化の種類について理解します。さらに、バイアス、分散、過小適合、過適合などの関連する概念についても説明します。

くだらない話はやめて、始めましょう!

2. バイアスと分散

バイアスと分散は、学習したモデルと実際のモデルを説明するために使用されます。ギャップの 2 つの側面

を書き直す必要があります。この 2 つの定義は次のとおりです。

バイアスとは、 use all 可能なトレーニングデータセットでトレーニングされたすべてのモデルの出力の平均と、真のモデルの出力値の差。
分散は、異なるトレーニングデータセットでトレーニングされたモデルの出力値間の差です。

機械学習における正則化とは何ですか?

# バイアスにより、個々のデータポイントに対するモデルの感度が低下する一方で、データの一般化が促進され、孤立したデータポイントに対するモデルの感度。必要な機能がそれほど複雑ではないため、トレーニング時間も短縮できます。高いバイアスは、ターゲット関数の信頼性が高いと想定されていることを示しますが、場合によってはモデルの適合不足につながることがあります。

機械学習における分散 (分散) は、小さい値に対するモデルの感度を指します。データセットの変更。間違いです。データセットには大きな変動があるため、アルゴリズムはトレーニングセット内のノイズと外れ値をモデル化します。この状況は、多くの場合、過剰適合と呼ばれます。新しいデータセットで評価すると、モデルは基本的にすべてのデータポイントを学習するため、正確な予測を提供できません

比較的バランスの取れたモデルバイアスが低く分散が小さい場合、バイアスが高く分散が大きい場合は、過小適合と過適合が生じます。

3. アンダーフィッティング

モデルがトレーニングデータのパターンを正しく学習できず、新しいデータに一般化できない場合にアンダーフィッティングが発生します。アンダーフィッティングされたモデルはトレーニングデータのパフォーマンスが低く、不正確な予測につながる可能性があります。高いバイアスと低い分散が発生すると、アンダーフィッティングが発生する傾向があります

機械学習における正則化とは何ですか?

# #4.過学習

モデルがトレーニングデータでは非常に優れたパフォーマンスを発揮するが、テストデータではパフォーマンスが低下する場合、それは過学習 (新しいデータ) と呼ばれます。この場合、機械学習モデルはトレーニングデータのノイズに適合し、テストデータに対するモデルのパフォーマンスに悪影響を及ぼします。バイアスが低く分散が大きいと、過学習が発生する可能性があります。

機械学習における正則化とは何ですか?

5. 正則化の概念

「規則的な」という用語「」では、調整された損失関数を削減し、過剰適合または過小適合を回避するために機械学習モデルを調整する方法について説明します。

機械学習における正則化とは何ですか?

# 正則化手法を使用することで、機械学習モデルをより正確に適合させることができます。特定のテストセットに効果的に適用することで、テストセット内のエラーを効果的に削減します

#6.L1 正則化

#カラー回帰と比較して、L1 正則化の実装は主に損失関数にペナルティ項を追加することです。この項のペナルティ値は、次のようにすべての係数の絶対値の合計です。

機械学習における正則化とは何ですか?

Lasso 回帰モデルでは、回帰係数の絶対値を増やすことでペナルティが増加します。リッジ回帰項目と同様の方法で実現します。さらに、L1 正則化は、線形回帰モデルの精度を向上させる優れたパフォーマンスを発揮します。同時に、L1 正則化はすべてのパラメーターに均等にペナルティを課すため、一部の重みがゼロになる可能性があり、その結果、特定の特徴を削除できるスパースモデルが生成されます (重み 0 は削除と同等です)。

#7. L2 正則化

L2 正則化は、損失関数にペナルティ項を追加することによっても実現されます。ペナルティ項はすべての係数の二乗の合計に等しいということです。次のように：＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃

一般に、データが多重共線性 (独立変数の相関性が高い) を示す場合に採用される手法と考えられます。多重共線性における最小二乗推定 (OLS) は不偏ですが、分散が大きいため、観測値が実際の値と大きく異なる可能性があります。 L2 により、回帰推定の誤差がある程度減少します。通常、多重共線性の問題を解決するには収縮パラメーターを使用します。 L2 正則化により、重みの固定比率が減り、重みが平滑化されます。