モデルが収束しないのはなぜですか?
人工智能技术与咨询
人工智能技术与咨询 2022-09-07 10:22:26
0
1
889

モデルが収束しないのはなぜですか?

モデルが収束しないのはなぜですか?

モデルが収束しないのはなぜですか?

人工智能技术与咨询
人工智能技术与咨询

全員に返信(1)
人工智能技术与咨询

1. 逆伝播チェーンが壊れています。つまり、変数の一部が numpy 配列に変換されている可能性があります。変数は引き続き計算に参加できますが、勾配を伝播する能力を失い、その結果、勾配を次の値に伝播できなくなります。 2. 学習率 設定が無理 学習率を大きくしすぎると損失がnanになりやすくモデルが収束しなくなる 小さすぎるとモデルが学習してしまう3. パラメータの初期化はモデルのトレーニング速度に影響するため、ニューラル ネットワーク層のパラメータは適切に初期化されていません。

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート