


Sub-jurnal alam semula jadi |. Berdasarkan kerumitan endogen, rangkaian baru seperti otak Institut Automasi membina jambatan antara kecerdasan buatan dan neurosains

lajur AIxiv ialah lajur untuk menerbitkan kandungan akademik dan teknikal di laman web ini. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com
Karya ini diterbitkan dalam "Nature Computational Science", dan bersama-sama pengarang ialah Penyelidik Li Guoqi dan Xu Bo dari Institut Automasi, Akademi Sains China, dan Profesor Tian Yonghong dari Universiti Peking. Pengarang bersama ialah He Linxuan, pelajar sarjana muda dalam kelas Qian Xuesen di Universiti Tsinghua (pelatih di Institut Automasi), Xu Yunhui, pelajar sarjana muda dalam kelas asas matematik dan sains (pelatih di Institut Automasi) , dan He Weihua dan Lin Yihan, pelajar kedoktoran di Jabatan Instrumen Ketepatan di Universiti Tsinghua.
Membiarkan model mempunyai keupayaan kognitif yang lebih meluas dan umum adalah matlamat penting dalam perkembangan semasa bidang kecerdasan buatan (AI). Laluan model besar yang popular pada masa ini adalah berdasarkan Undang-undang Penskalaan untuk membina rangkaian saraf yang lebih besar, lebih mendalam dan lebih luas untuk meningkatkan prestasi model, yang boleh dipanggil kaedah pelaksanaan kecerdasan am "berdasarkan kerumitan eksogen". Walau bagaimanapun, laluan ini juga menghadapi beberapa kesukaran yang tidak dapat diatasi, seperti penggunaan sumber pengiraan yang tinggi dan penggunaan tenaga, dan mempunyai kelemahan dalam kebolehtafsiran.
Kecerdasan buatan dan neurosains telah lama saling bergantung dan dibangunkan secara kolaboratif. Untuk mengatasi dilema merealisasikan kecerdasan am "berdasarkan kerumitan eksogen", pasukan penyelidik Li Guoqi dan Xu Bo dari Institut Automasi, Akademi Sains China, bersama-sama dengan Universiti Tsinghua, Universiti Peking dan lain-lain, menggunakan ciri-ciri dinamik kompleks neuron otak dan mencadangkan pendekatan "berdasarkan kerumitan endogen" "Kaedah pembinaan model neuron seperti otak (Rajah 1) menambah baik masalah penggunaan sumber pengkomputeran yang disebabkan oleh pengembangan model tradisional dan memberikan contoh. penggunaan neurosains yang berkesan untuk membangunkan kecerdasan buatan. Jurnal Nature Computational Science mengulas mengenai perkara ini: "Penyelidikan AI lebih dekat dengan kejuruteraan dan aplikasi, manakala penyelidikan neurosains lebih bersifat penerokaan. Pasukan penyelidik mencabar pandangan tradisional ini dan menunjukkan bahawa neuron yang lebih terperinci dan realistik secara biologi Model boleh memacu kemajuan yang lebih besar dalam pembelajaran mendalam .” com/articles/s43588-024-00674-9
Rajah 1. "Kerumitan eksogen" dan "Kerumitan endogen" Kerumitan endogen ialah model rangkaian kecil dengan kerumitan endogen yang menggunakan ciri dinamik kompleks neuron otak untuk membina model primitif rangkaian saraf : Pencerahan neuron biologi
Dalam kajian ini, penyelidik mencadangkan konsep "model rangkaian kecil dengan kerumitan endogen" Idea teras adalah untuk mensimulasikan dinamik kompleks neuron biologi untuk menggabungkan kompleks Struktur dalaman memperkenalkan neuron individu untuk membina. model AI yang lebih cekap. Sebagai contoh, dalam kajian ini, penyelidik menggunakan model HH (Hodgkin-Huxley) dalam rangkaian neural spiking untuk menggantikan model LIF tradisional. Sebagai model matematik yang menerangkan mekanisme penjanaan potensi tindakan neuron, model HH mempunyai dinamik halus yang dibawa oleh struktur dalaman yang kompleks dan boleh mensimulasikan tindak balas neuron kepada pelbagai rangsangan.
Transformasi daripada kerumitan eksogen kepada kerumitan endogen
Terbitan Dinamik Teoritikal dan Simulasi#🎜#🎜L'équipe de recherche a théoriquement prouvé qu'il existe une certaine relation d'équivalence entre le modèle HH et le modèle LIF dans le mécanisme de génération de potentiel d'action, c'est-à-dire qu'un neurone HH peut être formé d'une manière de connexion spécifique avec quatre neurones LIF à paramètres variables dans le temps. (tv-LIF) L'équivalent microstructural est que chaque neurone LIF décrit un canal ionique dans le modèle HH. Sur la base de cette équivalence, la complexité endogène de l'unité de calcul peut être améliorée en concevant la microstructure, de sorte que le modèle de réseau HH puisse simuler les caractéristiques dynamiques du modèle de réseau LIF à plus grande échelle et obtenir des résultats similaires sur une structure de réseau plus petite. fonction.
L'équipe de recherche a effectué une vérification par simulation de cette théorie en simulant l'entrée de stimulation neuronale et en comparant la sortie du réseau. Sous le même stimulus d'entrée, le réseau tv-LIF avec une complexité exogène plus élevée est capable de produire la même réponse de sortie que le modèle HH. De plus, l'équipe a simplifié le « modèle HH » (tv-LIF2HH) construit à partir de quatre neurones tv-LIF dans le modèle s-LIF2HH, et a vérifié par des expériences de simulation que ce modèle simplifié conserve toujours la possibilité de capturer le comportement dynamique du HH. modèle (Figure 2).复 Figure 2. Les neurones de « complexité exogène » et de « complexité endogène » peuvent maintenir un comportement dynamique équivalent Afin
Comparaison des expériences d'apprentissage en réseau
En plus d'étudier le comportement dynamique de différents réseaux sous le même stimulus par simulation, le Les chercheurs ont construit un modèle de réseau HH plus vaste, le modèle de réseau s-LIF2HH, et ont effectué une classification multitâche et une amélioration en profondeur. Apprenez à expérimenter. Les résultats montrent que le modèle de réseau HH à complexité endogène peut avoir des performances similaires en termes de capacité de représentation et de robustesse à celles du modèle de réseau s-LIF2HH à plus grande échelle, et présente de meilleures performances que le réseau LIF général à plus grande échelle. Expérience d'apprentissage multitâche : le chercheur a mené une expérience d'apprentissage multitâche en utilisant l'ensemble de données Fashion-MNIST. Les résultats ont montré que le modèle de réseau HH peut atteindre des performances équivalentes à celles du modèle de réseau plus large s-LIF2HH, voire même. légèrement meilleur que le modèle de réseau s-LIF2HH à plus grande échelle d’un réseau LIF général (Figure 3).
- Performances de réseau comparables pour les réseaux à complexité exogène à grande échelle
Expériences d'apprentissage par renforcement temporel : recherche Les chercheurs ont mené des expériences d'apprentissage par renforcement séquentiel dans des environnements à pendule inversé et à double pendule inversé. Les résultats montrent. que le modèle de réseau HH peut effectuer une extraction d’informations temporelles plus puissante que les capacités du modèle de réseau LIF (Figure 4).
- Expérience de robustesse : les chercheurs ont ajouté du bruit gaussien aux tâches d'apprentissage multitâche et d'apprentissage par renforcement profond pour évaluer la robustesse du réseau. Les résultats expérimentaux montrent que le modèle de réseau général LIF à plus grande échelle subit la plus grande dégradation des performances sous l'influence du bruit, tandis que le modèle de réseau HH et le modèle de réseau s-LIF2HH à plus grande échelle présentent une plus grande robustesse. Lorsque l'intensité du bruit augmente, les courbes de récompense du modèle de réseau HH et du modèle de réseau s-LIF2HH restent proches et sont nettement moins affectées que le modèle de réseau LIF général (Figure 5).生 Figure 5. Le modèle de réseau HH avec une complexité endogène est meilleur qu'un réseau complexe exogène plus grand.
Des expériences ont prouvé l'efficacité et la fiabilité du modèle de complexité endogène dans la gestion de tâches complexes. Dans le même temps, l'étude a révélé que le modèle de réseau HH est plus efficace en termes de consommation de ressources informatiques, réduisant considérablement l'utilisation de la mémoire et du temps de calcul, améliorant ainsi l'efficacité informatique globale. L’équipe de recherche a expliqué les résultats de recherche ci-dessus à travers la théorie des goulots d’étranglement de l’information. De plus, la structure externe d’un modèle à petite échelle est relativement simple, ce qui facilite la compréhension de son processus de prise de décision, ce qui améliore également l’interprétabilité et la sécurité du modèle.
Conclusion et perspectives
Les petits modèles à complexité endogène apportent de nouvelles opportunités pour le développement de l'IA. En simulant la dynamique complexe des neurones biologiques et en optimisant la microstructure locale du modèle pour étendre la complexité endogène, nous pouvons construire des modèles d'IA plus efficaces et plus puissants et surmonter le dilemme des grands modèles avec une complexité externe. À l’avenir, l’expansion de la complexité endogène pourrait devenir une direction importante dans la recherche sur l’IA et promouvoir la technologie de l’IA vers des applications plus larges.
Cette recherche fournit de nouvelles méthodes et un soutien théorique pour intégrer les caractéristiques dynamiques complexes des neurosciences dans l'intelligence artificielle, et fournit une solution réalisable pour l'optimisation des modèles d'IA et l'amélioration des performances dans les applications pratiques. À l'heure actuelle, l'équipe de recherche a mené des recherches sur les réseaux HH à plus grande échelle et les neurones multi-branchés à plusieurs compartiments avec une plus grande complexité endogène, ce qui devrait améliorer encore l'efficacité informatique et les capacités de traitement des tâches des grands modèles et les mettre en œuvre dans la pratique. scénarios d'application. L'atterrissage rapide.
Atas ialah kandungan terperinci Sub-jurnal alam semula jadi |. Berdasarkan kerumitan endogen, rangkaian baru seperti otak Institut Automasi membina jambatan antara kecerdasan buatan dan neurosains. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

sorakan! Bagaimana rasanya apabila perbincangan kertas adalah perkataan? Baru-baru ini, pelajar di Universiti Stanford mencipta alphaXiv, forum perbincangan terbuka untuk kertas arXiv yang membenarkan soalan dan ulasan disiarkan terus pada mana-mana kertas arXiv. Pautan laman web: https://alphaxiv.org/ Malah, tidak perlu melawati tapak web ini secara khusus. Hanya tukar arXiv dalam mana-mana URL kepada alphaXiv untuk terus membuka kertas yang sepadan di forum alphaXiv: anda boleh mencari perenggan dengan tepat dalam. kertas itu, Ayat: Dalam ruang perbincangan di sebelah kanan, pengguna boleh menyiarkan soalan untuk bertanya kepada pengarang tentang idea dan butiran kertas tersebut Sebagai contoh, mereka juga boleh mengulas kandungan kertas tersebut, seperti: "Diberikan kepada

Ia juga merupakan video Tusheng, tetapi PaintsUndo telah mengambil laluan yang berbeza. Pengarang ControlNet LvminZhang mula hidup semula! Kali ini saya menyasarkan bidang lukisan. Projek baharu PaintsUndo telah menerima 1.4kstar (masih meningkat secara menggila) tidak lama selepas ia dilancarkan. Alamat projek: https://github.com/lllyasviel/Paints-UNDO Melalui projek ini, pengguna memasukkan imej statik, dan PaintsUndo secara automatik boleh membantu anda menjana video keseluruhan proses mengecat, daripada draf baris hingga produk siap . Semasa proses lukisan, perubahan garisan adalah menakjubkan Hasil akhir video sangat serupa dengan imej asal: Mari kita lihat lukisan lengkap.

Baru-baru ini, Hipotesis Riemann, yang dikenali sebagai salah satu daripada tujuh masalah utama milenium, telah mencapai kejayaan baharu. Hipotesis Riemann ialah masalah yang tidak dapat diselesaikan yang sangat penting dalam matematik, berkaitan dengan sifat tepat taburan nombor perdana (nombor perdana ialah nombor yang hanya boleh dibahagikan dengan 1 dan dirinya sendiri, dan ia memainkan peranan asas dalam teori nombor). Dalam kesusasteraan matematik hari ini, terdapat lebih daripada seribu proposisi matematik berdasarkan penubuhan Hipotesis Riemann (atau bentuk umumnya). Dalam erti kata lain, sebaik sahaja Hipotesis Riemann dan bentuk umumnya dibuktikan, lebih daripada seribu proposisi ini akan ditetapkan sebagai teorem, yang akan memberi kesan yang mendalam terhadap bidang matematik dan jika Hipotesis Riemann terbukti salah, maka antara cadangan ini sebahagian daripadanya juga akan kehilangan keberkesanannya. Kejayaan baharu datang daripada profesor matematik MIT Larry Guth dan Universiti Oxford

Jika jawapan yang diberikan oleh model AI tidak dapat difahami sama sekali, adakah anda berani menggunakannya? Memandangkan sistem pembelajaran mesin digunakan dalam bidang yang lebih penting, menjadi semakin penting untuk menunjukkan sebab kita boleh mempercayai output mereka, dan bila tidak mempercayainya. Satu cara yang mungkin untuk mendapatkan kepercayaan dalam output sistem yang kompleks adalah dengan menghendaki sistem menghasilkan tafsiran outputnya yang boleh dibaca oleh manusia atau sistem lain yang dipercayai, iaitu, difahami sepenuhnya sehingga apa-apa ralat yang mungkin boleh dilakukan. dijumpai. Contohnya, untuk membina kepercayaan dalam sistem kehakiman, kami memerlukan mahkamah memberikan pendapat bertulis yang jelas dan boleh dibaca yang menjelaskan dan menyokong keputusan mereka. Untuk model bahasa yang besar, kita juga boleh menggunakan pendekatan yang sama. Walau bagaimanapun, apabila mengambil pendekatan ini, pastikan model bahasa menjana

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Dalam proses pembangunan kecerdasan buatan, kawalan dan bimbingan model bahasa besar (LLM) sentiasa menjadi salah satu cabaran utama, bertujuan untuk memastikan model ini adalah kedua-duanya. berkuasa dan selamat untuk masyarakat manusia. Usaha awal tertumpu kepada kaedah pembelajaran pengukuhan melalui maklum balas manusia (RL

Bolehkah model bahasa benar-benar digunakan untuk ramalan siri masa? Menurut Undang-undang Tajuk Berita Betteridge (sebarang tajuk berita yang berakhir dengan tanda soal boleh dijawab dengan "tidak"), jawapannya mestilah tidak. Fakta nampaknya benar: LLM yang begitu berkuasa tidak dapat mengendalikan data siri masa dengan baik. Siri masa, iaitu, siri masa, seperti namanya, merujuk kepada satu set jujukan titik data yang disusun mengikut urutan masa. Analisis siri masa adalah kritikal dalam banyak bidang, termasuk ramalan penyebaran penyakit, analisis runcit, penjagaan kesihatan dan kewangan. Dalam bidang analisis siri masa, ramai penyelidik baru-baru ini mengkaji cara menggunakan model bahasa besar (LLM) untuk mengelas, meramal dan mengesan anomali dalam siri masa. Makalah ini menganggap bahawa model bahasa yang pandai mengendalikan kebergantungan berjujukan dalam teks juga boleh digeneralisasikan kepada siri masa.

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Semua pengarang kertas kerja ini adalah daripada pasukan guru Zhang Lingming di Universiti Illinois di Urbana-Champaign (UIUC), termasuk: Steven Code repair; pelajar kedoktoran tahun empat, penyelidik

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com. Pengenalan Dalam beberapa tahun kebelakangan ini, aplikasi model bahasa besar multimodal (MLLM) dalam pelbagai bidang telah mencapai kejayaan yang luar biasa. Walau bagaimanapun, sebagai model asas untuk banyak tugas hiliran, MLLM semasa terdiri daripada rangkaian Transformer yang terkenal, yang
