Un nouveau modèle que même les joueurs d'échecs amateurs ne peuvent pas battre a vaincu l'IA Go la plus puissante du monde - KataGo ?
Oui, ce résultat époustouflant provient des derniers articles du MIT, de l'UC Berkeley, etc.
Les chercheurs ont utilisé des méthodes d'attaque contradictoires pour saisir les angles morts de KataGo, et sur la base de cette technologie, un programme Go de niveau débutant a réussi à vaincre KataGO.
Sans recherche, ce taux de réussite atteint même 99%.
Après avoir calculé cela, la chaîne alimentaire dans le monde de Go est instantanément devenue : joueurs amateurs > nouvelle IA > meilleure IA de Go ?
Attendez une minute, comment cette nouvelle IA magique peut-elle devenir si performante en même temps ?
Angle d'attaque astucieux
Avant de présenter la nouvelle IA, faisons d'abord connaissance du protagoniste qui a été attaqué cette fois-ci : KataGo.
KataGo, actuellement la Go AI open source la plus puissante, a été développée par des chercheurs de Harvard AI.
Auparavant, KataGo avait vaincu ELF OpenGo et Leela Zero de niveau surhumain, et même sans moteur de recherche, son niveau était équivalent à celui des 100 meilleurs joueurs professionnels de Go en Europe.
Shin Jin-soo, le joueur de Go coréen « numéro un » qui vient de remporter la Samsung Cup et a remporté « quatre couronnes en trois ans », utilise KataGo pour le sparring.
△Source photo : Hangame
Face à un adversaire aussi fort, la méthode choisie par les chercheurs peut être qualifiée d'écrasante.
Ils ont constaté que même si KataGo avait appris le Go en jouant des millions de parties contre lui-même, cela n'était toujours pas suffisant pour couvrir toutes les situations possibles.
Donc, cette fois, ils ne choisissent plus le jeu personnel, mais choisissent la méthode d'attaque contradictoire :
Laissez l'attaquant (adversaire) et la victime fixe (victime, également connue sous le nom de KataGo) jouer à un jeu et utilisez cette méthode pour entraîner l'attaque qui.
Ce changement leur a permis de former une politique contradictoire de bout en bout en utilisant seulement 0,3 % des données utilisées pour former KataGo.
Plus précisément, cette contre-stratégie ne concerne pas uniquement le jeu, mais met plutôt fin au jeu prématurément en incitant KataGo à placer un coup dans une position favorable à l'attaquant.
Prenons l'image ci-dessous comme exemple. L'attaquant qui contrôle les pierres noires place principalement des pierres dans le coin supérieur droit de l'échiquier, laissant d'autres zones à KataGo, et place également délibérément des pierres dans d'autres zones qui peuvent être facilement dégagées.
Adam Gleave, co-auteur de l'article, a introduit :
Cette approche fera croire à tort à KataGo qu'il a gagné, car son territoire (en bas à gauche) est beaucoup plus grand que celui de son adversaire.
Mais la zone dans le coin inférieur gauche ne contribue pas vraiment au score car il y a encore des taches solaires là-bas, ce qui signifie que ce n'est pas complètement sûr.
Parce que KataGo est trop confiant dans la victoire - pensant qu'il gagnera si le jeu se termine et que le score est calculé - KataGo prendra l'initiative de passer, puis l'attaquant passera également, mettant ainsi fin au jeu et commençant à score. (Les deux camps passent et le jeu se termine)
Mais comme l'analyse Gleave, puisque les pierres noires dans l'espace environnant de KataGo sont encore vivantes, elles ne sont pas jugées comme des "pierres mortes" selon les règles de l'arbitre de Go, il y a donc des places pour les pierres noires dans l'espace environnant de KataGo, aucune ne peut être calculée comme numéro de maillage effectif.
Le vainqueur final n'est donc pas KataGo, mais l'attaquant.
Cette victoire n'est pas unique. Sans recherche, cette contre-mesure a atteint un taux de victoire de 99% contre KataGo.
Lorsque KataGo a effectué suffisamment de recherches pour approcher des niveaux surhumains, son taux de victoire a atteint 50 %.
De plus, malgré cette stratégie astucieuse, le modèle attaquant lui-même n'est pas très fort au Go : en fait, il peut être facilement vaincu par des amateurs humains.
Les chercheurs ont déclaré que le but de leurs recherches était de prouver que même les systèmes d'IA très matures peuvent présenter de graves vulnérabilités en attaquant une vulnérabilité inattendue dans KataGo.
Comme l'a dit le co-auteur Gleave :
(Cette étude) souligne la nécessité de meilleurs tests automatisés des systèmes d'IA pour découvrir les pires modes de défaillance, plutôt que de simplement tester les performances du cas général.
Équipe de recherche
L'équipe de recherche vient du MIT, de l'UC Berkeley, etc. Les co-auteurs de l'article sont Tony Tong Wang et Adam Gleave.
Tony Tong Wang, doctorant en informatique au MIT, a de l'expérience en tant que stagiaire chez NVIDIA, Genesis Therapeutics et d'autres sociétés.
Adam Gleave est doctorant en intelligence artificielle à l'Université de Californie à Berkeley. Il est diplômé de l'Université de Cambridge avec une maîtrise et un baccalauréat. Son principal axe de recherche est la robustesse de l'apprentissage profond.
Le lien vers le document est joint à la fin, les amis intéressés peuvent le récupérer~
Lien du papier : https://arxiv.org/abs/2211.00241
Lien de référence : https://arstechnica. com /information-technology/2022/11/new-go-playing-trick-defeats-world-class-go-ai-but-loses-to-human-amateurs/
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!