首個在ImageNet上精度超過80%的二值神經網路BNext問世，-1與+1的五年辛路歷程-人工智慧-PHP中文網

兩年前，當MeliusNet 問世時，機器之心曾發表過一篇技術文章《#第一次勝過MobileNet 的二值神經網絡，- 1 與1 的三年艱苦跋涉#》，回顧了BNN 的發展歷程。彼時，靠著早期 BNN 工作 XNOR-Net 起家的 XNOR.AI 被蘋果公司收購，大家曾暢想過這種低功耗、高效能的二值神經網路技術會不會即將開啟廣闊的應用前景。

然而，過去的兩年時間，我們很難從對技術嚴格保密的蘋果公司獲得關於BNN 技術應用的更多信息，而不論是學界和業界也未出現其他特別亮眼的應用案例。另一方面，隨著終端設備數量的暴漲，邊緣 AI 應用和市場正在迅速增長: 預計到 2030 年將產生 500 到 1250 億台邊緣設備，邊緣計算市場將暴漲到 600 億美元規模。這其中有幾個目前熱門的應用領域：AIoT、元宇宙和機器人終端設備。相關業界正加速發力技術落地，與此同時 AI 能力已經嵌入到以上領域的諸多核心技術環節中，如 AI 技術在三維重建、視頻壓縮以及機器人實時感知場景中的廣泛應用。在這樣的背景下，業界對基於邊緣的高能源效率、低功耗 AI 技術、軟體工具以及硬體加速的需求變的日益迫切。

目前，限制BNN 應用的瓶頸主要有兩面：首先，無法有效縮小和傳統32-bit 深度學習模型的精度差距；第二則是缺乏在不同硬體上的高性能演算法實作。機器學習論文上的加速比通常無法體現在你正在使用的 GPU 或 CPU 上。第二個原因的產生可能正是來自於第一個原因，BNN 無法達到令人滿意的精度，因此無法吸引來自系統和硬體加速、優化領域的從業者的廣泛關注。而機器學習演算法社群通常無法自行開發高效能的硬體程式碼。因此，想要同時獲得高精度和強加速效果，BNN 應用或加速器無疑需要這兩個不同領域的開發者進行協作。

BNN 為什麼對於計算和記憶體高效

舉個例子，Meta 推薦系統模型DLRM 使用32-bit 浮點數來儲存權重和激活參數，它的模型大小約2.2GB。而一個少量精度下降 (

BNN 的第二個顯著的優點是計算方式極度有效率。它只用 1bit 也就是兩種 state 來表示變數。這意味著所有運算只靠位元運算就能完成，借助與閘、異或閘等運算，可以取代傳統乘加運算。位運算是電路中的基礎單元，熟悉電路設計的同學應該明白，有效減小乘加計算單元的面積以及減少片外訪存是降低功耗的最有效手段，而BNN 從內存和計算兩個方面都具備得天獨厚的優勢，WRPN[1]展示了在客製化FPGA 和ASIC 上，BNN 對比全精度可獲得1000 倍的功耗節省。更近期的工作 BoolNet [2]展示了一種 BNN 結構設計可以幾乎不使用浮點運算並保持純 binary 的資訊流，它在 ASIC 模擬中獲得極佳的功耗、精度權衡。

第一個精確度上 80% 的 BNN 是什麼樣子的？

來自德國Hasso Plattner 電腦系統工程研究院的Nianhui Guo 和Haojin Yang 等研究者提出了BNext 模型，成為第一個在ImageNet 資料集上top1 分類準確率突破80% 的BNN :