社群學習工具庫休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > 圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

WBOY

發布： 2024-05-30 11:17:17

原創

645 人瀏覽過

這幾天，AI屆的盛會－ICLR在維也納舉辦。

OpenAI、Meta、Google、智譜AI等世界前沿AI科技企業齊聚一堂。

現場名流雲集，星光耀眼，走幾步就能偶遇一位發過顛覆性paper的大咖。

毫無意外地，ICLR 2024展間也變成了追星現場。熱鬧的氣氛，快把屋頂掀翻了。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

現場追星圖靈巨頭

#圖靈三巨頭中的著名「e人」LeCun，提前就在X上大方公佈出自己的行程，滿懷期待地等著和粉絲們相見了。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

在留言區，不只粉絲興奮打卡，甚至還有準備現場遞履歷的。

粉絲們果然不虛此行，在現場，LeCun口若懸河地講解，熱情的觀眾們在周圍形成密實的包圍圈。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

言歸正傳，在整個ICLR活動上，Meta團隊將分享25餘篇論文和兩個研討會。這次，LeCun團隊在ICLR上發表了以下兩篇論文。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

論文網址：https://arxiv.org/abs/2305.19523

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

論文地址：https://arxiv.org/abs/2311.12983

另一位圖靈巨頭Yoshua Bengio，也顯示了自己的超高人氣。

現場觀眾總結道：「一個人真的需要在他的領域中做到獨一無二，才能讓他的會議室外排起如此長的隊伍！」

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

先前LeCun和Hinton都對此發表過言辭激烈的意見，Bengio的態度似乎一直比較模糊，迫不及待想知道他對於AGI是什麼看法了。在即將到來的5月11日，他將會在一場關於AGI的Workshop中發表演說。

值得一提的是，Bengio團隊也在今年的ICLR上獲得了傑出論文榮譽提名。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

論文網址：https://openreview.net/pdf?id=Ouj6p4ca60

#GoogleMeta隔壁，智譜AI也在

現場，Google開源模型Gema、機器人智能體背後框架Robotics Transformers，以及其他開創性的研究一併呈現。

緊鄰Meta和谷歌，展廳中間有一家非常亮眼的公司－智譜AI。

現場的童鞋正為大家介紹GLM-4、ChatGLM等一系列研究成果。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

這一系列展示，引起了許多國外學者的圍觀。

現場的近兩千名與會嘉賓和學者，認真聽了GLM大模型技術團隊的介紹。

介紹內容包含了GLM系列大模型的多項前沿研究成果，涵蓋數學、文生圖、影像理解、視覺UI理解、Agent智能體等領域。

在現場，大家熱烈討論起了對Scaling Law的看法。而GLM團隊，對此也有獨到見解－

「相較於模型大小或訓練運算量，智慧湧現與預訓練損失有較緊密的連結。」

例如，著名的OpenAI 996研究員Jason Wei，認真讀過智譜AI這篇講預訓練損失的論文後，表示十分讚歎。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

論文中，團隊透過訓練30 個不同參數和資料規模LLM，評估了其在12個中英文資料集上的表現。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

論文網址：https://arxiv.org/abs/2403.15796

結果觀察到，只有當預訓練損失低於某個閾值時，LLM會出現湧現能力。

而且，從預訓練損失的角度定義「湧現能力」，效果優於僅依賴模型參數或訓練量。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

智譜AI的這段表現，也讓越來越多外國網友意識到－－

##19歲獲得博士的Stability AI研究主任Tanishq表示，CogVLM這類最有競爭力、為開源生態做出重大貢獻的開源基礎模型，就是來自中國。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

這位遊戲工作室的前CEO，去年就開始用CogVLM和Stable Diffusion做完整的開源版本了。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

是的，自CogVLM自發布之後，其強大的能力便引起了外國網友的驚呼。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

在今年1月的LLM排行榜中，也有人發現—

#當時Gemini和GPT-4V遠遠領先任何開源LLM，唯一一個例外，就是CogVLM。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

可見，這波國產大模型出海，智譜AI已經悶聲不響地在國外建立了自己的巨大影響力。

特邀演講

展廳精彩演講之外，今年的ICLR，共邀請了七位特邀演講嘉賓，分享他們對AI的見解。

有來自GoogleDeepMind的研究科學家Raia Hadsell，喬治亞理工學院副教授&FAIR首席科學家Devi Parik，有來自馬克斯普朗克電腦科學研究所（MPI-SWS）的主任Moritz Hardt，唯一中國團隊是智譜AI 的GLM 大模型技術團隊。

Raia Hadsell

GoogleDeepMind科學家Raia Hadsell的演講主題是－「在人工智慧發展的起伏過程中學習：通往AGI道路上的意外真理」。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

經過數十年的穩定發展和偶爾的挫折後，AI正處於一個關鍵的轉折點。

AI產品已經爆炸式進入主流市場，我們還未觸及scaling紅利的天花板，因此整個社區都在探討下一步的方向。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

在這次的演講中，基於20多年在AI領域的經驗，Raia探討了我們對AGI發展之路的假設，如何隨時間發展而變化。

同時，她也揭示了，在這個探索的過程中，我們得到的意外發現。

從強化學習到分散式架構，再到神經網絡，已經在科學領域發揮潛在的革命性作用。

Raia認為，透過汲取過去的經驗教訓，可以為AI未來的研究方向提供重要的洞見。

Devi Parikh

另一邊，FAIR首席科學家Devi Parik給所有人講述了，自己生活中的故事。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

從演講題目可見略知，Parik的分享內容，非比尋常。

在ICLR大會上，在解釋為什麼科技環境是現在這個樣子時，大家會專注於針對網路、大數據和算力的發展，展開討論。

然鵝，鮮少有人關注那些微小，但重要的個人故事。

其實，每個人的故事，都可以匯聚成為推動科技進步的重要力量。

透過這種方式，我們可以彼此學習，互相激勵。這讓我們在追求目標時，更加堅韌和有效率。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

Moritz Hardt

#德國MPI-SWS主任Moritz Hardt帶來了「新興的科學基準”的演講。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

顯然，基準測試成為機器學習領域的「核心支柱」。

自1980年代以來，雖然人類在這個研究範式下取得了許多成就，但對其深層的理解仍然有限。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

在此次演講中，Hardt透過一系列選定的實證研究和理論分析，探索基準測試作為一門新興科學的基本原理。

他具體討論了標註錯誤對資料品質的影響、模型排名的外部驗證性，以及多任務基準測試的前景。

同時，Hard也展示了許多案例研究。

這些挑戰了我們的傳統看法，也突顯了發展科學基準測試的重要性和益處。

GLM Team

中國這邊，智譜AI的GLM大模型技術團隊，也帶來了「ChatGLM通往AGI之路”的精彩演講。

值得一提的是，這也是國內「首次」在國際頂尖會議上展示大模型相關的主題演講。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

這次演講，首先從中國的角度，介紹AI在過去幾十年的發展歷程。

同時，他們以ChatGLM為例，闡述自身在實踐過程中所獲得的理解與洞見。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

2024 AGI前瞻：GLM 4.5、 GLM-OS、 GLM-zero

在ICLR上，GLM大模型團隊介紹了面向AGI的GLM三大技術趨勢。

通往AGI的必經之路在哪裡？

業界對此意見不一。有人認為是智能體，有人認為是多模態，有人說，Scaling Law是通往AGI的必要非充分條件。

而LeCun堅持認為，LLM是通往AGI的一條歧路，靠LLM帶不來AGI。

對此，團隊也提出了自己的獨特觀點。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

首先，他們講到了GLM-4的後續升級版本，也就是GLM-4.5及其升級模型。

GLM-4的後續升級版，將基於超級認知（SuperIntelligence）和超級對齊（SuperAlignment）技術，同時在原生多模態領域和AI安全領域有長足進步。

GLM大模型團隊認為，在通往AGI的路上，文本是最關鍵的基礎。

而下一步，則應該把文字、圖像、視訊、音訊等多種模態混合在一起訓練，變成一個真正的「原生多模態模型」。

同時，為了解決更複雜的問題，他們也引進了GLM-OS概念，也就是以大模型為中心的通用計算系統。

這個觀點，與Karpathy先前提出的大模型作業系統的觀點，不謀而合。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

在ICLR現場，GLM大模型團隊詳細介紹了GLM-OS的實作方式：

基於現有的All-Tools能力，再加上記憶體記憶（memory）和自我回饋（self-reflection）能力，GLM-OS有望成功模仿人類的PDCA機制，即Plan-Do-Check-Act循環。

具體來說就是，先做出計劃，然後試一試形成回饋，調整規劃然後再行動以期達到更好的效果。

依賴PDCA循環機制，LLM便可以自我回饋與自主進化──恰如人類自己所做的一樣。

此外，GLM大模型團隊也透露，自2019年以來，團隊就一直在研究名為GLM-zero的技術，旨在研究人類的「無意識」學習機制。

「當人在睡覺的時候，大腦依然在無意識地學習。」

GLM大模型團隊表示，「無意識」學習機制是人類認知能力的重要組成部分，包括自我學習、自我反思和自我批判。

人腦中存在著「回饋」和「決策」兩個系統，分別對應LLM大模型和記憶體記憶兩部分。

因此，GLM-zero的相關研究將進一步拓展人類對意識、知識、學習行為的理解。

儘管還處於非常早期的研究階段，但GLM-zero可以視為通往AGI的必經之路。

而這，也是GLM大模型團隊首次向外界公開此技術趨勢。

國內頂流技術團隊

2020年底，GLM大模型技術團隊研發了GLM預訓練架構。

2021年訓練完成百億參數模型GLM-10B，同年利用MoE架構成功訓練出收斂的兆稀疏模型。

2022年也合作研發了中英雙語千億級超大規模預訓練模型GLM-130B並開源。

而過去一年裡，團隊幾乎每3-4個月，就完成一次基座大模型的升級，目前已經更新到了GLM-4版本。

不僅如此，作為國內最早入局LLM公司，智譜AI曾在2023年就設立了一個雄心勃勃的目標－全線對標OpenAI。

GLM大模型技術團隊建立了基於AGI願景的完整大模型產品矩陣。

在GLM系列之外，還有CogView文生圖模型、CodeGeeX程式碼模型，多模態理解模型CogVLM，再到GLM-4V多模態大模型和All-Tools功能以及AI助理智譜清言。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

同時，GLM大模型技術團隊的研究人員，在業界有著極高的影響力。

例如，圈裡爆火的李飛飛主講史丹佛大學CS25課程，每次都會邀請Transformer研究前沿的專家，分享自己的最新突破。

而目前已經確定，CS25課程的嘉賓中，就有來自智譜AI的研究員。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

CogVLM

團隊開發的開源視覺語言模型CogVLM，一經發布就引發了業界關注。

3月Stability AI公佈的論文就顯示，因性能太出色，CogVLM直接被Stable Diffufion 3拿來做圖像標註了。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

論文網址：https://arxiv.org/abs/2403.03206

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

CogAgent

在此基礎之上，基於CogVLM改進的開源視覺語言模型CogAgent，主要針對的是使用者圖形介面GUI的理解。

而CogAgent的相關論文，已經被國際電腦視覺領域級別最高的學術會議CVPR 2024收錄。

要知道，CVPR以錄取嚴格著稱，今年論文錄取率只有約2.8%。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

論文網址：https://arxiv.org/abs/2312.08914

ChatGLM-Math

針對LLM解決數學問題，GLM大模型團隊提出了「Self-Critique」的迭代訓練方法。

即透過自我回饋機制，幫助LLM同時提升語言和數學的能力。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

論文網址：https://arxiv.org/abs/2404.02893

此方法，包含了兩個關鍵步驟：

首先訓練一個從LLM本身產生「Math-Critique」模型，以評估模型產生數學問題答案，並提供回饋訊號。

其次，通过拒绝采样微调和DPO，利用新模型对LLM自身的生成进行监督。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

GLM大模型团队还设计了MATHUSEREVAL基准测试集，以评估新模型数学能力，结果如下：

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

显而易见，新方法显著提升了LLM的数学问题解决能力，同时仍能提升其语言能力。重要的是，它在某些情况下优于参数量增加两倍的大模型。

GLM-4跻身全球第一梯队

在OpenCompass 2.0基准测试中，智谱AI新一代基座大模型的实力不容小觑。

在总榜排名中，GLM-4位列第三，位居国内榜首。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

在不久前SuperBench团队发布的《SuperBench大模型综合能力评测报告》中，GLM-4也跻身全球第一梯队。

特别是在最关键的语义理解，智能体能力上，GLM-4更是国内第一，力压一众竞争对手。

圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像

刚刚过去的大模型元年，热闹非凡的百模大战打了一年。

2024年，若想化身为AGI元年，全世界大模型团队还有很长的路要走。

以上是圖靈巨頭現身ICLR，頂會現場瘋狂追星LeCun、Bengio！中國團隊三大技術趨勢引爆AGI新想像的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

ai 圖靈

來源：51cto.com

上一篇：多模態AI是醫學的未來，Google推出三個新模型，Med-Gemini迎來大升級下一篇：一文帶您了解資料模型：概念模型、邏輯模型和實體模型

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

什麼是 NullPointerException，如何修復它？

2024-10-22 09:46:29
從新手到程式設計師：您的旅程從 C 基礎知識開始

2024-10-13 13:53:41
使用 PHP 解鎖 Web 開發：初學者指南

2024-10-12 12:15:51
揭秘 C：為新程式設計師提供一條清晰簡單的道路

2024-10-11 22:47:31
釋放您的編碼潛力：絕對初學者的 C 編程

2024-10-11 19:36:51
釋放你內心的程式設計師：C 絕對初學者

2024-10-11 15:50:41
使用 C 自動化您的生活：適合初學者的腳本和工具

2024-10-11 15:07:41
PHP 變得簡單：Web 開發的第一步

2024-10-11 14:21:21
使用 Python 建立任何東西：釋放創造力的初學者指南

2024-10-11 12:59:11
編碼的關鍵：為初學者釋放 Python 的力量

2024-10-11 12:17:31

最新問題

function_exists()無法判定自訂函數 function test() { return true; } if (function_exists('TEST')) { ech...

來自於 2024-04-29 11:01:01

0

3

2328

google 瀏覽器手機版顯示的怎麼實現老師您好，google 瀏覽器怎麼變成手機版樣式的？

來自於 2024-04-23 00:22:19

0

11

2465

子窗口操作父窗口，輸出沒反應前兩句可執行，最後一句沒辦法應

來自於 2024-04-19 15:37:47

0

1

2083

父視窗沒有輸出 document.onclick = function(){ window.opener.document.write('我是子視窗的輸出'); ...

來自於 2024-04-18 23:52:34

0

1

1961

關於CSS心智圖的課件在哪？課件

來自於 2024-04-16 10:10:18

0

0

2036

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1425161
php入門教程之一週學會PHP

4271702
JAVA 初級入門影片教學

2553285
小甲魚零基礎入門學習Python影片教學

508594
PHP 零基礎入門教學

864310

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板