Le premier réseau neuronal binaire BNext avec une précision de plus de 80 % sur ImageNet a été lancé, un parcours de cinq ans de -1 et +1-IA-php.cn

Il y a deux ans, lors de la sortie de MeliusNet, le Cœur de la Machine publiait un article technique "Un réseau de neurones binaires qui bat MobileNet pour la première fois, -1 et + 1 trois ans de parcours ardu 》, a passé en revue l'historique de développement de BNN. À cette époque, XNOR.AI, fondé sur les premiers travaux de BNN XNOR-Net, a été racheté par Apple. Tout le monde avait imaginé si cette technologie de réseau neuronal binaire à faible consommation et hautes performances ouvrirait bientôt de larges perspectives d'application.

Cependant, au cours des deux dernières années, il nous a été difficile d'obtenir plus d'informations sur l'application de la technologie BNN d'Apple, qui garde strictement sa technologie confidentielle, et il n'y a pas eu d'autres cas d'application particulièrement accrocheurs. dans le monde universitaire ou industriel. D’un autre côté, avec le nombre croissant d’appareils terminaux, les applications et les marchés de l’IA de pointe connaissent une croissance rapide : on s’attend à ce que 500 à 125 milliards d’appareils de pointe soient produits d’ici 2030, et le marché de l’informatique de pointe atteindra 60 milliards de dollars. Il existe plusieurs domaines d'application actuellement populaires : l'AIoT, le Metaverse et les équipements terminaux robotiques. Les industries concernées accélèrent la mise en œuvre de la technologie. Dans le même temps, les capacités de l’IA ont été intégrées dans de nombreux liens techniques fondamentaux dans les domaines ci-dessus, tels que l’application généralisée de la technologie de l’IA dans la reconstruction tridimensionnelle, la compression vidéo et le temps réel. perception robotique des scènes. Dans ce contexte, la demande de l'industrie en matière de technologie d'IA, d'outils logiciels et d'accélération matérielle à haute efficacité énergétique et à faible consommation, est devenue de plus en plus urgente.

À l'heure actuelle, il existe deux principaux goulots d'étranglement limitant l'application du BNN : premièrement, l'incapacité de réduire efficacement l'écart de précision avec les modèles d'apprentissage profond 32 bits traditionnels, deuxièmement, le manque d'implémentation d'algorithmes hautes performances sur différents matériels ; . Les accélérations dans les articles sur l'apprentissage automatique ne se traduisent souvent pas par le GPU ou le CPU que vous utilisez. La deuxième raison peut découler de la première raison. Le BNN ne peut pas atteindre une précision satisfaisante et ne peut donc pas attirer l'attention des praticiens dans les domaines de l'accélération et de l'optimisation des systèmes et du matériel. La communauté des algorithmes d’apprentissage automatique ne peut souvent pas développer seule du code matériel hautes performances. Par conséquent, pour obtenir à la fois une grande précision et une forte accélération, les applications ou accélérateurs BNN nécessiteront sans aucun doute la collaboration de développeurs de ces deux domaines différents.

Pourquoi BNN est efficace en termes de calcul et de mémoire

Par exemple, le modèle de système de recommandation Meta DLRM utilise des nombres à virgule flottante de 32 bits pour stocker les poids et les paramètres d'activation, et la taille de son modèle est d'environ 2,2 Go. Une version binaire du modèle avec une légère réduction de précision (

Le deuxième avantage non négligeable du BNN est que la méthode de calcul est extrêmement efficace. Il n'utilise qu'un seul bit, soit deux états, pour représenter les variables. Cela signifie que toutes les opérations ne peuvent être effectuées que par des opérations sur bits. À l'aide de portes ET, de portes XOR et d'autres opérations, les opérations traditionnelles de multiplication et d'addition peuvent être remplacées. Les opérations sur bits sont l'unité de base du circuit.Les étudiants familiarisés avec la conception de circuits doivent comprendre que réduire efficacement la surface de l'unité de calcul de multiplication et d'addition et réduire l'accès à la mémoire hors puce sont les moyens les plus efficaces de réduire la consommation d'énergie. BNN se concentre à la fois sur la mémoire et le calcul. Tous présentent des avantages uniques. WRPN [1] a démontré que sur des FPGA et des ASIC personnalisés, BNN peut réaliser une économie d'énergie 1 000 fois supérieure à celle d'une précision totale. Des travaux plus récents, BoolNet [2], ont démontré une conception structurelle BNN qui ne peut utiliser presque aucune opération en virgule flottante et maintenir un flux d'informations binaires purs, ce qui permet d'obtenir d'excellents compromis en matière de consommation d'énergie et de précision dans la simulation ASIC.

À quoi ressemble le premier BNN avec une précision de 80 % ?

Des chercheurs tels que Nianhui Guo et Haojin Yang de l'Institut Hasso Plattner d'ingénierie des systèmes informatiques en Allemagne ont proposé le modèle BNext, devenant ainsi le premier BNN à atteindre une précision de classification top1 de plus de 80 % sur l'ensemble de données ImageNet :