인간이 다시 최고의 Go AI를 이길 수 있을까요? 바람을 거스르는 한 수로 완승한 아마추어 4단 체스 선수-일체 포함-php.cn

인간이 다시 최고의 Go AI를 이길 수 있을까요? 바람을 거스르는 한 수로 완승한 아마추어 4단 체스 선수

WBOY

풀어 주다： 2023-04-11 13:34:03

앞으로

1581명이 탐색했습니다.

2016년은 인공지능이 대두되는 해입니다.

알파고가 바둑 세계 챔피언 이세돌을 꺾은 이후 바둑의 최고 수준을 대표하는 선수들은 더 이상 인간이 아닙니다.

그러나 오늘 Financial Times의 기사는 바둑을 사람들의 시야로 다시 가져왔습니다. 인간은 AI를 물리칠 방법을 찾았습니다!

인간이 다시 최고의 Go AI를 이길 수 있을까요? 바람을 거스르는 한 수로 완승한 아마추어 4단 체스 선수

7년간의 휴면생활을 마치고 인간 체스선수들이 복귀할 것인가?

바둑이 역경을 이겨내고 인간이 AI를 이겼다고?

FT는 미국 출신 아마추어 체스 4단 선수인 켈린 펠린(Kellin Pelrine)이 최고의 체스 AI-카타고(AI-KataGo)를 단숨에 물리쳤다고 보도했습니다.

15개의 오프라인 게임 중 Perline은 컴퓨터의 도움 없이 14개의 게임을 승리했습니다.

그리고 인간 플레이어가 바둑왕을 되찾기 위한 이 계획은 캘리포니아 연구 회사인 FAR AI의 연구원들로부터 나왔습니다. 팀은 AI 체스 선수들의 약점을 분석해 최종 승리를 목표로 삼았다.

FAR AI CEO인 Adam Gleave는 "우리가 이 시스템을 활용하는 것은 매우 쉽습니다."라고 말했습니다.

Gleave는 팀이 개발한 AI가 나중에 KataGo로 100만 번 이상의 게임을 플레이했다고 말했습니다. 인간 플레이어가 악용할 수 있는 "버그"가 발견되었습니다.

Pelrine은 그들이 발견한 승리 전략이 "인간에게는 그다지 어렵지 않으며" 중급 플레이어가 이를 사용하여 기계를 물리칠 수 있다고 말했습니다. 그는 또한 이 방법을 사용하여 또 다른 최고의 바둑 시스템인 Leela Zero를 물리쳤습니다.

인간이 다시 최고의 Go AI를 이길 수 있을까요? 바람을 거스르는 한 수로 완승한 아마추어 4단 체스 선수

Kellin Pelrine

FT는 컴퓨터의 도움에도 불구하고 이 결정적인 승리가 인간 체스 선수들에게 문을 열었다고 썼습니다.

7년 전, 인공 지능은 가장 복잡한 게임에서 인간보다 훨씬 앞서 있었습니다.

DeepMind가 설계한 AlphaGo 시스템은 2016년 바둑 세계 챔피언 이세돌을 4-1로 이겼습니다. 이세돌 역시 참패 3년 만에 알파고를 '무적'이라며 은퇴를 선언했다.

펠린은 인공지능의 힘에 동의하지 않습니다. 그의 의견으로는 체스 게임의 조합과 변형이 많다는 것은 컴퓨터가 체스 플레이어의 미래 가능한 모든 움직임을 평가하는 것이 불가능하다는 것을 의미합니다.

쉽게 말하면 펠리네가 사용하는 전략은 "동쪽 공격, 서쪽 공격"입니다.

Pelrine은 AI를 혼란시키기 위해 체스판 구석구석에 돌을 배치하는 반면, Pelrine은 AI 체스 플레이어의 영역을 목표로 삼아 점차적으로 둘러쌉니다.

인간이 다시 최고의 Go AI를 이길 수 있을까요? 바람을 거스르는 한 수로 완승한 아마추어 4단 체스 선수

펠리네는 포위 공격이 완료되려고 하는데도 AI 체스 선수들이 이 지역의 위험을 눈치채지 못했다고 말했습니다. 그는 이어 "그러나 인간으로서 이러한 취약점은 쉽게 찾을 수 있다"고 말했다. 버클리 캘리포니아 대학의 컴퓨터 과학 교수인 스튜어트 러셀(Stuart Russell)은 가장 발전된 바둑 게임 콘솔 중 일부가 이러한 취약점을 가지고 있는 것으로 밝혀졌다고 말했습니다. 이는 오늘날 최첨단 AI의 딥러닝 시스템이 근본적으로 결함이 있음을 보여주는 약점입니다.

그는 이러한 시스템은 자신이 경험한 특정 상황을 "이해"할 수 있을 뿐이며 인간과 같은 전략에 대해 간단한 일반화를 할 수 없다고 말했습니다.

AI를 이길 수 있는 건 AI뿐입니다!

하지만 엄밀히 말하면 연구진은 AI를 통해 AI를 물리쳤다. 즉 바둑에서 인간이 AI를 물리칠 수 있도록 AI를 활용한 것이다.

참고 자료로 사용된 논문은 2022년 11월에 처음 출판되었으며 올해 1월에 업데이트되었습니다. 저자는 MIT, UC Berkeley 및 기타 기관 출신입니다.

기사에서 연구원들은 저항 전략으로 AI를 훈련시키고 가장 발전된 바둑 인공 지능 시스템 KataGo를 물리쳤습니다.

인간이 다시 최고의 Go AI를 이길 수 있을까요? 바람을 거스르는 한 수로 완승한 아마추어 4단 체스 선수

프로젝트 주소: https://goattack.far.ai/adversarial-policy-katago#contents

논문 주소: https://arxiv.org/abs/2211.00241

결과에 따르면 KataGo가 검색 트리를 사용하지 않을 경우 공격자는 1000 게임에서 100%의 승률을 달성하고 KataGo가 충분한 검색을 사용하면 승률이 97%를 초과하는 것으로 나타났습니다.

이와 관련하여 연구진은 적대 전략 AI가 카타고를 이길 수 있지만, 동시에 인간 아마추어는 카타고를 이길 수 없다는 점을 강조했습니다.

즉, 이 AI가 바둑을 더 잘해서가 아니라 KataGo가 심각한 실수를 하도록 유도할 수 있기 때문에 이길 수 있는 것입니다.

인간이 다시 최고의 Go AI를 이길 수 있을까요? 바람을 거스르는 한 수로 완승한 아마추어 4단 체스 선수

공격 전략

이전에는 KataGo, AlphaZero 등 체스를 두는 AI가 셀프 게임을 통해 훈련되었습니다.

하지만 저자가 "피해자 플레이"라고 부르는 이 연구에서는 공격자(적)가 고정된 피해자(피해자) 전략(상대의 움직임을 복사하지 않음)으로 게임을 하면서 승리할 수 있도록 스스로 훈련해야 합니다.

이에 대해 연구자들은 이 문제를 해결하기 위해 두 가지 서로 다른 적대적 MCTS(A-MCTS) 전략을 도입했습니다.

샘플 A-MCTS-S: 연구원이 설정한 검색 프로세스는 다음과 같습니다. 피해자가 체스를 둘 때, 공격자의 차례가 되면 피해자의 전략 네트워크에서 샘플링하고, 공격자의 전략 네트워크에서 샘플링합니다.
재귀적 A-MCTS-R: A-MCTS-S가 피해자의 힘을 과소평가하기 때문에 연구원들은 새로운 전략 A-MCTS-R을 제안합니다. 그러나 이러한 변경으로 인해 공격자에 대한 훈련 및 추론의 계산 복잡성이 증가합니다.

구체적으로 A-MCTS-R에서 연구원은 피해자 노드에서 새로운(재귀적) MCTS 검색을 사용하여 시뮬레이션을 수행함으로써 A-MCTS-S 단계의 피해자 샘플링을 대체합니다.

더 이상 완벽한 피해자 모델은 아니지만, 피해자가 검색을 하지 않는다고 잘못 가정하는 A-MCTS-S보다 더 정확한 경향이 있습니다.

인간이 다시 최고의 Go AI를 이길 수 있을까요? 바람을 거스르는 한 수로 완승한 아마추어 4단 체스 선수