AI의 개발 과정에는 매우 흥미롭지만 상식과 반대되는 현상이 있습니다. -
"장기 게임과 같이 인간에게 상대적으로 어려운 일부 작업은 AI가 상대적으로 쉽게 달성할 수 있습니다. open 환경과의 상호작용, 계획 및 의사결정 등 인간에게 비교적 단순한 일들이 AI가 큰 도전에 직면해 있습니다.”
그리고 이것이 Moravec의 역설입니다.
그러나 이제 GITM은 이러한 역설적 한계를 성공적으로 깨고, 복잡하고 실제와 유사한 환경에서 획기적인 발전을 이루었으며, 인간처럼 생존하고 탐색하고 창조할 수 있습니다!
현실 세계를 밀접하게 시뮬레이션하는 베스트셀러 게임 "마인크래프트"에는 SenseTime이 칭화대학교, 상하이 인공지능연구소 및 기타 기관의 연구원들과 공동으로 제안한 제너럴리스트 AI 에이전트 Ghost가 등장합니다. Minecraft(GITM)는 Minecraft를 플레이할 수 있을 뿐만 아니라 이전의 모든 에이전트보다 더 나은 성능을 발휘합니다.
프로젝트 홈페이지 : https://github.com/OpenGVLab/GITM
본 연구는 일반 인공지능(AGI) 방향으로 진행됩니다 ) 중요한 조치가 취해졌습니다.
광범위한 임무 적용 범위
GITM은 Minecraft의 주요 세계에서 모든 기술적 과제에 대해 100% 임무 적용 범위를 달성했습니다(기술 트리에서 전체 262개 항목을 성공적으로 잠금 해제했습니다). 이전 에이전트의 합계는 30%에 불과했습니다. (과거에는 OpenAI, DeepMind를 포함한 모든 에이전트 방법이 총 78개만 잠금 해제되었습니다.)
높은 작업 성공률
가장 많이 본 "Get Diamonds" 작업에서 GITM이 달성했습니다. 67.5%의 성공률은 현재 최고 결과(OpenAI VPT)보다 47.5% 더 높습니다.
매우 높은 훈련 효율성
GITM의 훈련 효율성도 새로운 수준에 도달했습니다. 환경 상호 작용 단계 수는 기존 방법의 1만분의 1에 불과하며 단일 CPU 노드에서의 훈련은 2일 만에 완료할 수 있습니다. 이는 이전 OpenAI VPT 또는 17 GPU에서 요구되는 6480 GPU 일보다 훨씬 낮습니다. DeepMind DreamerV3에 필요한 일 수입니다.
일반 AI 에이전트 "Ghost in the Minecraft"(GITM)는 "마인크래프트" 게임을 플레이하며 처음부터 서바이벌 모드로 시작하여 메인 월드의 모든 아이템을 획득하고 다이아몬드를 캐는 게임을 진행합니다. 문제 없습니다. 마법이 부여된 책을 만들 수 있습니다!
GITM은 다양한 지형, 환경, 낮과 밤의 장면을 처리할 수 있으며 심지어 몬스터를 쉽게 만날 수도 있습니다.
GITM은 또한 생존이 필요한 대피소, 농지, 철 골렘, 자동화 장비를 만드는 데 필요한 레드스톤 회로, 네더 월드로 들어가는 데 필요한 네더 포털 등.
이러한 작업은 에이전트가 "Minecraft"에서 오랫동안 생존하고 발전하며 더욱 발전된 세계를 탐험할 수 있도록 하는 GITM의 강력한 기능과 확장성을 보여줍니다.
전체를 자율적으로 학습하고 마스터할 수 있는 일반 인공지능 방향 구축을 목표로 "마인크래프트"의 모든 기술적 과제를 극복하는 AI 에이전트 GITM을 개발합니다. 실제 기술 .
GITM은 기존의 RL 기반 아키텍처를 깨고 LLM(Large Language Model)이라는 새로운 패러다임을 에이전트의 핵심으로 채택합니다.
이 혁신은 또한 인공 일반 지능(AGI)의 연구 목표를 가속화하고 개방형 환경에서 인간처럼 인식하고 이해하고 상호 작용할 수 있는 지능형 에이전트를 개발하는 데 도움이 되며 큰 혁신을 가져옵니다. 로봇공학, 자율주행 등 산업으로 진출해 현실 세계의 복잡한 환경과 다양한 롱테일 문제를 효과적으로 해결하고, 대규모 산업에서의 AI 기술 구현을 촉진합니다.
"Ghost in the Minecraft"(GITM)
"큰 모델 + 큰 컴퓨팅 성능"의 전략적 레이아웃을 활용하여 AGI(일반 인공 지능)의 개발도 촉진합니다. 풀 스택 대형 모델 R&D 시스템인 SenseTime은 "Ririxin SenseNova" 대형 모델 시스템을 핵심으로 다중 모드 및 다중 작업 범용 대형 모델 분야에서 빠르게 발전할 수 있었습니다. 혁신적인 기술이 스마트 카, 스마트 라이프, 스마트 비즈니스에 빠르게 적용될 수 있도록 지원하고, 스마트 시티 등의 분야에서도 산업 지능을 지속적으로 향상시켜 나가고 있습니다.
오늘날 GITM의 성공으로 복잡한 작업을 처리하고 더 높은 기술 한계를 뛰어넘는 자율 주행과 같은 애플리케이션의 능력이 향상될 것입니다.
위 내용은 SenseTime과 Tsinghua University 일반 AI 에이전트가 Minecraft를 100% 잠금 해제합니다! 레드스톤 회로를 처음부터 구축하기 위해 단일 CPU에서 2일 훈련의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!