「ポケモン」の最初のジムをクリアするのに AI は 7,000 時間かかった
最近、外国人プログラマーのピーター・ウィッデン氏は、AI モデルを 50,000 時間トレーニングし、AI に「ポケットモンスター 赤」の遊び方を教えようとしました。
Whidden 氏は、エミュレーター上の制御入力を通じて AI にゲームと対話させ、学習セッションを 1 プレイあたり 2 時間に設定し、さらに AI を約 6 分で終了するように加速し、40 のセッションを同時に実行することもできました。これにより、AI の学習プロセスが高速化されます。
AI アルゴリズムは基本的にゲームに勝つ方法を気にしないため、Whidden は報酬目標を設定し、AI が何か新しいことを発見するたびにボーナス ポイントを獲得します。これは画面上のピクセルの変化によって引き起こされますが、これによりAIはアニメーション化された水面を長時間呆然と見つめることになります。
新しいものに関連する報酬メカニズムは、AI に戦闘を放棄するかポケモンを捕獲するかを選択させます Whidden はポケモンのレベルに関連する報酬メカニズムを追加しました。しかし、このシステムは事故にもつながりました.AIはポケモンを保管したり交換したりするときに報酬ポイントを減らしてしまうため、その後の行動でAIはポケモンセンターを完全に回避し、治療を受けずにチームを去り、ウィッデンは開始しなければなりませんでした報酬システムを調整します。
AI は人間の行動が苦手ではありますが、より奥深い行動も行っています。ウィッデンは、モンスター ボールを投げるだけで野生のポケモンを確実に捕まえることができるように、AI が特定の奇妙な道をたどっていることに気づきました。意味のない行動。
しかし、AI は 7,000 時間を費やして最初のジムを倒した後、月尖山で長い間迷子になり、50,000 時間を費やした後でも 2 番目のジムを見つけることができませんでした。しかし、AI はさまざまな魔法の作戦にも貢献しており、たとえば、AI はコイキングを最も好んで購入し、これまでに合計 10,000 回以上購入しており、野生のコラッタを捕獲したときは「AI」と名付けられました。
以上がAIが「ポケモン」の最初のジムをクリアするのに7000時間かかったの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。