モデルが収束しないのはなぜですか?

Question

モデルが収束しないのはなぜですか?モデルが収束しないのはなぜですか?モデルが収束しないのはなぜですか?

人工智能技术与咨询 · Answer

1. 逆伝播チェーンが壊れています。つまり、変数の一部が numpy 配列に変換されている可能性があります。変数は引き続き計算に参加できますが、勾配を伝播する能力を失い、その結果、勾配を次の値に伝播できなくなります。 2. 学習率設定が無理学習率を大きくしすぎると損失がnanになりやすくモデルが収束しなくなる小さすぎるとモデルが学習してしまう3. パラメータの初期化はモデルのトレーニング速度に影響するため、ニューラルネットワーク層のパラメータは適切に初期化されていません。