ImageNet 上で 80% 以上の精度を持つ最初のバイナリニューラルネットワーク BNext が登場、-1 と +1 の 5 年間の旅-AI-php.cn

2 年前、MeliusNet が登場したとき、Machine Heart は技術記事「 MobileNet を初めて上回るバイナリニューラルネットワーク - 1 と 1 の 3 つ」を発表しました。 -年間の困難な旅》では、BNN の開発の歴史を振り返りました。当時、初期の BNN 作品である XNOR-Net に基づいて構築された XNOR.AI が Apple に買収され、この低消費電力で高性能のバイナリニューラルネットワークテクノロジがすぐに広範なアプリケーションの可能性を開くのではないかと誰もが想像していました。

しかし、過去 2 年間、Apple から BNN テクノロジーの応用に関するさらなる情報を入手することは困難でした。Apple はテクノロジーの秘密を厳重に保持しており、学術界や学術界からも情報を得ることができませんでした。その他、特に目を引く応用事例をご紹介します。一方で、端末デバイスの数が急増するにつれて、エッジ AI アプリケーションと市場は急速に成長しており、2030 年までに 5,000 ～ 1,250 億台のエッジデバイスが生産され、エッジコンピューティング市場は 600 億米ドルに急増すると予想されています。現在人気のあるアプリケーション分野としては、AIoT、メタバース、ロボット端末機器などが挙げられます。関連業界はテクノロジーの導入を加速しており、同時に、3 次元再構成、ビデオ圧縮、リアルタイムにおける AI テクノロジーの広範な適用など、上記の分野の多くの中核となる技術リンクに AI 機能が組み込まれています。ロボットによるシーンの認識。このような背景から、エッジベースの高エネルギー効率、低電力 AI テクノロジー、ソフトウェアツール、およびハードウェアアクセラレーションに対する業界の需要がますます緊急になっています。

現在、BNN の適用を制限する 2 つの主なボトルネックがあります: 1 つ目は、従来の 32 ビット深層学習モデルとの精度の差を効果的に狭めることができないこと、2 つ目は、パフォーマンスの欠如です。異なるハードウェア上での高性能アルゴリズムの実装。機械学習に関する論文の高速化は、使用している GPU や CPU に反映されないことがよくあります。 2 番目の理由は、1 番目の理由から生じる可能性があり、BNN は満足のいく精度を達成できないため、システムおよびハードウェアの高速化と最適化の分野の専門家から広範な注目を集めることができません。機械学習アルゴリズムコミュニティは、多くの場合、単独で高性能のハードウェアコードを開発できません。したがって、高精度と強力な加速の両方を達成するには、BNN アプリケーションまたはアクセラレータには間違いなく、これら 2 つの異なる分野の開発者の協力が必要です。

BNN が計算効率とメモリ効率が高い理由

たとえば、メタ推奨システムモデル DLRM は、32 ビット浮動小数点数を使用して重みとアクティベーションパラメータを保存します。モデルサイズは約2.2GBです。精度がわずかに低下した (

BNN の 2 番目の大きな利点は、計算方法が非常に効率的であることです。変数を表すのに 1 ビット、つまり 2 つの状態のみを使用します。これは、すべての演算がビット演算のみで完了できることを意味し、AND ゲート、XOR ゲートなどの演算を使用することで、従来の乗算や加算演算を置き換えることができます。ビット演算は回路の基本単位であり、回路設計に慣れている学生であれば、乗加算演算部の面積を効果的に削減し、オフチップメモリへのアクセスを削減することが消費電力を削減する最も効果的な方法であることを理解しているはずです。 WRPN [1] は、カスタマイズされた FPGA と ASIC 上で、BNN が完全精度と比較して 1000 倍の省電力を達成できることを実証しました。最近の研究 BoolNet [2] は、浮動小数点演算をほとんど使用せず、純粋なバイナリ情報フローを維持できる BNN 構造設計を実証しました。これにより、ASIC シミュレーションで優れた消費電力と精度のトレードオフが実現されます。

80% の精度を持つ最初の BNN はどのようなものでしょうか?

ドイツの Hasso Plattner Institute of Computer System Engineering の Nianhui Guo 氏や Haojin Yang 氏などの研究者は、BNext モデルを提案し、ImageNet で 80% 以上のトップ 1 分類精度を達成した最初の BNN となりました。データセット: