機械学習アルゴリズムにおける過学習問題-AI-php.cn

機械学習アルゴリズムにおける過学習問題

WBOY

リリース： 2023-10-09 16:36:38

オリジナル

988 人が閲覧しました

機械学習アルゴリズムにおける過学習問題

機械学習アルゴリズムの過適合問題には特定のコード例が必要です

機械学習の分野では、モデルの過適合問題はよくある問題の 1 つです。課題。モデルがトレーニングデータにオーバーフィットすると、ノイズや外れ値に過度に敏感になり、新しいデータに対するモデルのパフォーマンスが低下します。過学習問題を解決するには、モデルのトレーニングプロセス中にいくつかの効果的な方法を採用する必要があります。

一般的なアプローチは、L1 正則化や L2 正則化などの正則化手法を使用することです。これらの手法では、モデルの過学習を防ぐためにペナルティ項を追加することでモデルの複雑さを制限します。以下では、特定のコード例を使用して、L2 正則化を使用して過学習問題を解決する方法を示します。

Python 言語と Scikit-learn ライブラリを使用して回帰モデルを実装します。まず、必要なライブラリをインポートする必要があります。

import numpy as np
from sklearn.linear_model import Ridge
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

ログイン後にコピー

次に、10 個のフィーチャとターゲット変数を含むダミーデータセットを作成します。ランダムノイズを追加して現実世界のデータをシミュレートしていることに注意してください:

np.random.seed(0)
n_samples = 1000
n_features = 10
X = np.random.randn(n_samples, n_features)
y = np.random.randn(n_samples) + 2*X[:, 0] + 3*X[:, 1] + np.random.randn(n_samples)*0.5

ログイン後にコピー

次に、データセットをトレーニングセットとテストセットに分割します:

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

ログイン後にコピー

これで、リッジ回帰モデルを作成し、正則化パラメータ alpha の値を設定します:

model = Ridge(alpha=0.1)

ログイン後にコピー

次に、トレーニングセットを使用してモデルをトレーニングします:

model.fit(X_train, y_train)

ログイン後にコピー

トレーニングが完了したら、テストを使用できます。モデルのパフォーマンスを評価するために設定します:

y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
print("Mean squared error: ", mse)

ログイン後にコピー

この例では、リッジ回帰モデルを使用し、正則化パラメーター alpha を 0.1 に設定します。 L2 正則化を使用すると、新しいデータをより適切に一般化するためにモデルの複雑さが制限されます。モデルのパフォーマンスを評価する際、予測値と真の値の差を表す平均二乗誤差を計算しました。

正則化パラメーター alpha の値を調整することで、モデルのパフォーマンスを最適化できます。アルファの値が小さい場合、モデルはトレーニングデータに過適合する傾向があり、アルファの値が大きい場合、モデルは過小適合する傾向があります。実際には、通常、相互検証を通じて最適なアルファ値を選択します。

要約すると、過剰適合問題は機械学習における一般的な課題です。 L2 正則化などの正則化手法を使用すると、モデルの複雑さを制限して、モデルがトレーニングデータに過剰適合するのを防ぐことができます。上記のコード例は、リッジ回帰モデルと L2 正則化を使用して過学習問題を解決する方法を示しています。この例が読者の正則化手法の理解と適用に役立つことを願っています。

以上が機械学習アルゴリズムにおける過学習問題の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。