인간이 AI를 추월: DeepMind가 AI를 사용하여 행렬 곱셈 계산 속도에 대한 50년 기록을 깨고 일주일 후 수학자들이 다시 새로운 기록을 세웠습니다.-일체 포함-php.cn

인간이 AI를 추월: DeepMind가 AI를 사용하여 행렬 곱셈 계산 속도에 대한 50년 기록을 깨고 일주일 후 수학자들이 다시 새로운 기록을 세웠습니다.

王林

풀어 주다： 2023-04-11 13:16:03

앞으로

1183명이 탐색했습니다.

10월 5일 AlphaTensor가 출시되었고 DeepMind는 50년 동안 수학 분야의 미해결 수학 알고리즘 문제, 즉 행렬 곱셈을 해결했다고 발표했습니다. AlphaTensor는 행렬 곱셈과 같은 수학적 문제에 대해 새롭고 효율적이며 정확하다고 입증된 알고리즘을 발견한 최초의 AI 시스템이 되었습니다. "강화 학습을 통해 더 빠른 행렬 곱셈 알고리즘 발견"이라는 논문도 Nature 표지에 게재되었습니다.

그러나 AlphaTensor의 기록은 인간 수학자에 의해 깨지기 전까지 일주일 동안만 지속되었습니다.

최근 연구에서 오스트리아 린츠 요한 케플러 대학교 연구원 Manuel Kauers와 Jakob Moosbauer는 AlphaTensor의 행렬 곱셈 기록을 깨뜨렸다고 말합니다. 그들은 95단계로 5×5 행렬 곱셈을 수행하는 방법을 개발했습니다. 이는 AlphaTensor의 96단계 기록과 이전 기록인 98단계보다 한 단계 적습니다. 논문의 사전 인쇄본은 10월 13일 arxiv에 게시되었습니다.

인간이 AI를 추월: DeepMind가 AI를 사용하여 행렬 곱셈 계산 속도에 대한 50년 기록을 깨고 일주일 후 수학자들이 다시 새로운 기록을 세웠습니다.

논문 주소: https://arxiv.org/abs/2210.04045

논문 제목의 "FBHHRBNRSSSHK"는 실제로 모든 논문의 성의 첫 글자를 조합한 것입니다. DeepMind 논문의 저자. 이 명명 방법도 매우 흥미롭습니다.

인간이 AI를 추월: DeepMind가 AI를 사용하여 행렬 곱셈 계산 속도에 대한 50년 기록을 깨고 일주일 후 수학자들이 다시 새로운 기록을 세웠습니다.

저자가 말했듯이 DeepMind 알고리즘 솔루션은 "아직 끝이 아닙니다". 그러나 이번에 그들의 돌파구는 거인, 즉 AI의 어깨 위에 서는 것이라고 저자는 그들의 해결책이 DeepMind 솔루션을 기반으로 일련의 변환을 적용하여 1단계 곱셈 계산을 제거하는 것이라고 말했습니다.

AlphaTensor 2단계 발전

먼저 AlphaTensor의 결과를 간략하게 검토해 보겠습니다.

컴퓨터 과학의 많은 수학적 작업은 기계 학습, 컴퓨터 그래픽 생성, 다양한 시뮬레이션 또는 데이터 압축과 같은 행렬 곱셈을 통해 처리됩니다. 컴퓨터는 곱셈을 덧셈보다 훨씬 느리게 계산하므로 행렬 곱셈의 효율성이 조금만 향상되어도 큰 영향을 미칠 수 있습니다. 수십 년 동안 수학자들은 보다 효율적인 행렬 곱셈 알고리즘을 찾고 있었습니다.

1969년 독일 수학자 폴커 스트라센(Volker Strassen)은 처음으로 4×4 행렬 곱셈의 해를 64단계에서 49단계로 줄이는 알고리즘을 개발하여 수학계를 충격에 빠뜨렸습니다.

딥마인드가 이번에 출시한 AI 시스템 알파텐서는 스트라센 알고리즘보다 빠른 새로운 알고리즘을 발견했습니다. Demis Hassabis는 새로운 알고리즘이 하루에 수조 건의 계산을 수행할 때 효율성을 10~20%까지 높일 수 있는 잠재력이 있다고 말했습니다.

AlphaTensor는 Deepmind가 2018년에 출시한 범용 보드 게임 AI 시스템인 AlphaZero를 기반으로 게임에서 수학으로의 도약입니다. AlphaTensor를 교육하기 위해 Deepmind 연구팀은 행렬 곱셈 문제를 3D 보드 게임으로 변환했으며, 각 단계에서 새로운 알고리즘의 구성 요소가 생성되었습니다. AlphaTensor는 매번 수만 개의 동작 중에서 선택하여 가능한 한 적은 단계로 새로운 알고리즘을 생성한 것에 대한 보상을 받습니다. Deepmind는 이것을 "텐서 게임"이라고 부릅니다.

5×5 입력 행렬에서 AlphaTensor는 Strassen의 알고리즘과 기타 알려진 알고리즘을 독립적으로 발견했습니다. 또한 기존 알고리즘보다 더 효율적인 새로운 알고리즘을 개발했습니다.

예를 들어, 5×5 행렬 곱셈(n=4)은 80단계로 계산되었지만 AlphaTensor의 새로운 알고리즘은 n=5일 때 76단계만 필요하며 AlphaTensor는 해를 원래 98단계에서 96단계로 줄입니다. 단계. 4×4 행렬 곱셈은 Strassen에 의해 49단계로 감소되었으며 AlphaTensor에 의해 47단계로 최적화되었습니다. 이러한 효율성은 AlphaTensor에서 생성된 행렬 곱셈을 위한 70개 이상의 알고리즘을 통해 달성됩니다.

캡션: AlphaTensor가 발견한 알고리즘 복잡성은 알려진 행렬 곱셈 알고리즘과 비교됩니다

또한 AlphaTensor는 기계 학습을 위한 하드웨어별 알고리즘을 개발할 수도 있습니다. 현재 Google TPU 및 Nvidia V100의 알고리즘보다 20% 더 빠르게 실행되는 것으로 알려져 있습니다.

하드웨어에 맞게 곱셈 알고리즘을 인간이 독립적으로 조정하는 것은 어렵기 때문에 AlphaTensor의 Strassen 알고리즘 개선은 4×4 행렬 곱셈의 새로운 상한선을 생성하며 이는 AI 발전이 도움이 될 수 있다는 주요 증거입니다. 다른 학문. 또한 원래 전통적인 게임용으로 개발된 AlphaZero 시스템이 도메인 외부의 수학적 문제를 해결할 수 있음을 보여줍니다.

2 곱셈에 대한 솔루션 알고리즘은 이전 솔루션과 다릅니다. 둘째, 5×5 행렬의 경우 처음으로 95단계의 곱셈이 필요한 솔루션을 제안했습니다.

이 기사에서 저자는 두 가지 행렬 곱셈 방식을 간략하게 설명합니다. 정식 논문은 곧 출판되어 해 알고리즘의 검색 기술을 더 자세히 소개할 예정입니다.

4×4 행렬의 새로운 구성표에는 다음과 같이 총 47개의 곱셈이 포함됩니다.

5×5 행렬(n= 5) 95단계 곱셈 해법은 다음과 같습니다. GPU가 매일 1조 개의 행렬 컴퓨팅을 수행해야 한다는 점을 고려하면 98단계에서 96단계로, 겉으로는 사소해 보이는 점진적인 개선이 96단계에서 95단계로 실제로는 크게 향상될 수 있습니다. 컴퓨팅 효율성을 향상시키고 AI 애플리케이션이 기존 하드웨어에서 더 빠르게 실행되도록 합니다.

저자 정보:

Manuel Kauers, 린츠 요하네스 케플러 대학교 대수학 교수이자 대학 대수학 연구소 소장. 그의 연구 관심 분야는 컴퓨터 대수학, 기호 합산 및 적분, 특수 함수 항등식 등입니다.