Il a fallu 7 000 heures à l'IA pour nettoyer le premier gymnase de "Pokémon"
Récemment, un programmeur étranger, Peter Whidden, a formé un modèle d'IA pendant 50 000 heures, essayant d'apprendre à l'IA comment jouer à "Pokemon Red".
Whidden a fait interagir l'IA avec le jeu via une entrée de contrôle sur l'émulateur et a défini les sessions d'apprentissage sur deux heures par jeu. Il a également accéléré l'IA pour terminer en six minutes environ et a même exécuté 40 sessions simultanément, ce qui a permis d'accélérer. le processus d’apprentissage de l’IA.
Étant donné que l'algorithme de l'IA ne se soucie pas essentiellement de savoir comment battre le jeu, Whidden fixe des objectifs de récompense et gagne des points bonus chaque fois que l'IA découvre quelque chose de nouveau. Ceci est déclenché par les changements de pixels sur l'écran, mais cela amène également l'IA à regarder la surface de l'eau animée avec un air hébété pendant une longue période.
Le mécanisme de récompense lié aux nouveautés fait également choisir à l'IA d'abandonner le combat ou de capturer des Pokémon. Whidden a ajouté un mécanisme de récompense lié au niveau du Pokémon. Mais ce système a également conduit à des accidents. L'IA réduisait les points de récompense lors du stockage et du remplacement des Pokémon. Par conséquent, lors des actions ultérieures, l'IA a complètement évité le Centre Pokémon, laissant l'équipe sans traitement, et Whidden a dû commencer. encore une fois. Ajustez le système de récompense.
Bien que l'IA ne soit pas douée pour le comportement humain, elle a également effectué des actions plus profondes. Whidden s'est rendu compte que l'IA avait emprunté des chemins spécifiques et étranges pour garantir que les Pokémon sauvages pouvaient être capturés en lançant simplement une action inutile.
Cependant, après que l'IA ait passé 7 000 heures pour vaincre le premier gymnase, elle s'est perdue pendant longtemps dans la montagne Yuejian, et après 50 000 heures, elle n'a toujours pas réussi à trouver le deuxième gymnase. Mais l'IA a également contribué à de nombreuses opérations magiques. Par exemple, l'IA aime le plus acheter Magikarp, et l'a acheté plus de 10 000 fois au total lorsqu'elle a capturé un Rattata dans la nature, il a été nommé « AI ».
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!