ImageNet에서 80% 이상의 정확도를 갖춘 최초의 이진 신경망 BNext가 나왔습니다. -1과 +1의 5년 여정입니다.-일체 포함-php.cn

2년 전 멜리우스넷이 나왔을 때, Heart of the Machine은 기술 기사를 게재했습니다. "처음으로 MobileNet을 능가하는 이진 신경망, -1과 + 1의 3년간의 험난한 여정 》에서는 BNN의 개발 역사를 검토했습니다. 당시 초기 BNN 작업인 XNOR-Net을 기반으로 설립된 XNOR.AI는 Apple에 인수되었습니다. 이 저전력, 고성능 바이너리 신경망 기술이 곧 광범위한 응용 가능성을 열어줄 것이라고 모두가 상상했습니다.

그러나 지난 2년간 기술 기밀을 엄격히 지키는 애플로부터 BNN 기술 적용에 대해 더 많은 정보를 얻기 어려웠고, 그 외 특별히 눈길을 끄는 적용 사례도 없었습니다. 학계든 산업계든. 한편, 단말 수가 급증하면서 엣지 AI 애플리케이션과 시장도 빠르게 성장하고 있다. 2030년까지 엣지 디바이스가 5000억~1250억 개 생산될 것으로 예상되고, 엣지 컴퓨팅 시장은 600억 달러 규모로 급등할 것으로 예상된다. 현재 널리 사용되는 응용 분야로는 AIoT, Metaverse 및 로봇 단말 장비 등이 있습니다. 관련 산업에서는 기술 구현을 가속화하고 있으며, 3차원 재구성, 비디오 압축, 실시간 분야에서의 AI 기술의 광범위한 적용 등 위 분야의 많은 핵심 기술 링크에 AI 기능이 내장되어 있습니다. 장면에 대한 로봇 인식. 이러한 배경에서 엣지 기반의 고에너지 효율, 저전력 AI 기술, 소프트웨어 툴, 하드웨어 가속에 대한 업계의 요구가 점점 더 시급해지고 있습니다.

현재 BNN 적용을 제한하는 두 가지 주요 병목 현상이 있습니다. 첫째, 기존 32비트 딥 러닝 모델과의 정확도 격차를 효과적으로 좁힐 수 없다는 점, 둘째, 다양한 하드웨어에서 고성능 알고리즘 구현이 부족하다는 점입니다. . 기계 학습 문서의 속도 향상은 사용 중인 GPU 또는 CPU로 해석되지 않는 경우가 많습니다. 두 번째 이유는 첫 번째 이유에서 발생할 수 있습니다. BNN은 만족스러운 정확도를 달성할 수 없으므로 시스템 및 하드웨어 가속 및 최적화 분야의 실무자로부터 광범위한 관심을 끌 수 없습니다. 기계 학습 알고리즘 커뮤니티는 자체적으로 고성능 하드웨어 코드를 개발할 수 없는 경우가 많습니다. 따라서 높은 정확성과 강력한 가속을 모두 달성하려면 BNN 애플리케이션이나 가속기는 의심할 여지 없이 이 두 가지 분야의 개발자의 협력이 필요합니다.

BNN이 계산상 및 메모리 효율적인 이유

예를 들어 Meta 추천 시스템 모델 DLRM은 32비트 부동 소수점 수를 사용하여 가중치와 활성화 매개변수를 저장하며 모델 크기는 약 2.2GB입니다. 정확도가 약간 감소한(

BNN의 두 번째 중요한 장점은 계산 방법이 매우 효율적이라는 것입니다. 변수를 나타내기 위해 1비트, 즉 두 가지 상태만 사용합니다. 이는 모든 연산이 비트 연산으로만 완료될 수 있음을 의미하며 AND 게이트, XOR 게이트 및 기타 연산을 사용하여 기존의 곱셈 및 덧셈 연산을 대체할 수 있습니다. 비트 연산은 회로의 기본 단위입니다. 회로 설계에 익숙한 학생은 곱셈 및 덧셈 계산 단위의 면적을 효과적으로 줄이고 오프칩 메모리 액세스를 줄이는 것이 전력 소비를 줄이는 가장 효과적인 방법이라는 것을 이해해야 합니다. BNN은 메모리와 계산 모두에 중점을 두고 있으며 모두 고유한 장점을 가지고 있습니다. WRPN[1]은 맞춤형 FPGA 및 ASIC에서 BNN이 전체 정밀도에 비해 1000배의 전력 절감을 달성할 수 있음을 보여줍니다. 최근 연구인 BoolNet[2]에서는 부동 소수점 연산을 거의 사용하지 않고 순수한 이진 정보 흐름을 유지할 수 있는 BNN 구조 설계를 시연했습니다. 이는 ASIC 시뮬레이션에서 뛰어난 전력 소비와 정확도 균형을 달성합니다.

80% 정확도를 가진 첫 번째 BNN은 어떤 모습일까요?

독일 Hasso Plattner 컴퓨터 시스템 공학 연구소의 Nianhui Guo 및 Haojin Yang과 같은 연구원들은 BNext 모델을 제안하여 ImageNet 데이터세트에서 80% 이상의 top1 분류 정확도를 달성한 최초의 BNN이 되었습니다.