社群學習工具庫休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了

AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了

WBOY

發布： 2024-05-06 12:00:30

轉載

920 人瀏覽過

AI做數學題，真正的思考居然是暗中「心算」的？

紐約大學團隊新研究發現，即使不讓AI寫步驟，全用無意義的「…」代替，在一些複雜任務上的表現也能大幅提升！

一作Jacab Pfau表示：只要花費算力產生額外token就能帶來優勢，具體選擇了什麼token無關緊要。

AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了圖片

舉例來說，讓Llama 34M回答一個簡單問題：自然常數e的前6位數中，有幾個大於5的？

AI直接回答約等於瞎搗亂，只統計前6位數字居然統計出7個來。

讓AI把驗證每一數字的步驟寫出來，便可以得到正確答案。

讓AI把步驟隱藏，替換成大量的“…”，依然能得到正確答案！

AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了圖片

這篇論文一經發布便掀起大量討論，被評價為「我見過的最玄學的AI論文」。

AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了圖片

那麼，年輕人喜歡說更多的「嗯…」、「like…」等無意義口癖，難道也可以加強推理能力？

AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了圖片

從「一步一步」想，到「一點一點」想

實際上，紐約大學團隊的研究正是從思維鏈（Chain-of-Thought，CoT）出發的。

也就是那句著名提示詞「讓我們一步一步地想」（Let‘s think step by step）。

AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了圖片

過去人們發現，使用CoT推理可以顯著提升大模型在各種基準測試中的表現。

目前尚不清楚的是，這種效能提升到底源自於模仿人類把任務分解成更容易解決的步驟，還是額外的計算量帶來的副產物。

為了驗證這個問題，團隊設計了兩個特殊任務和對應的合成資料集：3SUM和2SUM-Transform。

3SUM要求從一組給定的數字序列中找出三個數，使得這三個數的和滿足特定條件，例如除以10餘0。

AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了圖片

這個任務的計算複雜度是O(n3)，而標準的Transformer在上一層的輸入和下一層的激活之間只能產生二次依賴關係。

也就是說，當n夠大序列夠長時，3SUM任務超出了Transformer的表達能力。

在訓練資料集中，把與人類推理步驟相同長度的「...」填入問題和答案之間，也就是AI在訓練中沒有見過人類是怎麼拆解問題的。

AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了圖片

在實驗中，不輸出填充token「…...」的Llama 34M表現隨著序列長度增加而下降，而輸出填充token時一直到長度14還能保證100%準確率。

AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了圖片

2SUM-Transform只需判斷兩個數字總和是否符合要求，這在 Transformer 的表達能力範圍內。

但問題的最後增加了一步“對輸入序列的每個數字進行隨機置換”，以防止模型在輸入token上直接計算。

結果表明，使用填充token可以將準確率從 78.7%提高到93.6%。

AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了圖片

除了最終準確率，作者還研究了填充token的隱藏層表示。實驗表明，凍結前面層的參數，只微調最後一個Attention層，隨著可用的填充token數量增多，預測的準確率增加。

這證實了填充token的隱藏層表示確實包含了與下游任務相關的隱性計算。

AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了圖片

AI學會隱藏想法了？

有網友懷疑，這篇論文難道在說「思維鏈」方法其實是假的嗎？研究這麼久的提示詞工程，都白玩了。

AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了圖片

團隊表示，從理論上填入token的作用僅限於TC0複雜度的問題範圍內。

TC0也就是可以透過一個固定深度的電路來解決的計算問題，其中電路的每一層都可以並行處理，可以透過少數幾層邏輯閘（如AND、OR和NOT閘）快速解決，也是Transformer在單一先前向傳播中能處理的計算複雜度上限。

而足夠長的思維鏈，能將Transformer的表達能力擴展到TC0之外。

而且讓大模型學習利用填充token並不容易，需要提供特定的密集監督才能收斂。

也就是說，現有的大模型不太可能直接從填充token方法中獲益。

但這並不是目前架構的內在局限性，如果在訓練資料中提供足夠的示範，它們應該也能從填充符號中獲得類似的好處。

這項研究也引發了一個令人擔憂的問題：大模型有能力進行無法監控的暗中計算，對AI的可解釋性和可控性提出了新的挑戰。

換句話說，AI可以不依賴人類經驗，以人們看不見的形式自行推理。

這既刺激又可怕。

AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了圖片

最後有網友開玩笑提議，讓Llama 3先生成1千萬億點點點，就能得到AGI的權重了（狗頭）。

AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了圖片

論文：//m.sbmmt.com/link/36157dc9be261fec78aeee1a94158c26

參考連結：
[1]//m.sbmmt.com/link/e350113047e82ceecb455c33c21ef32a[2]//m.sbmmt.com/link/872de53a900f3250aee#3811956490

##

以上是AI學會隱藏思考暗中推理！不依賴人類經驗解決複雜任務，更黑箱了的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

ai 模型 tc0

來源：51cto.com

上一篇：史丹佛李飛飛首次創業：學術休假兩年，瞄準「空間智能」下一篇：ICLR 2024 Spotlight | NoiseDiffusion: 矯正擴散模型噪聲，提高插值圖片質量

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

什麼是 NullPointerException，如何修復它？

2024-10-22 09:46:29
從新手到程式設計師：您的旅程從 C 基礎知識開始

2024-10-13 13:53:41
使用 PHP 解鎖 Web 開發：初學者指南

2024-10-12 12:15:51
揭秘 C：為新程式設計師提供一條清晰簡單的道路

2024-10-11 22:47:31
釋放您的編碼潛力：絕對初學者的 C 編程

2024-10-11 19:36:51
釋放你內心的程式設計師：C 絕對初學者

2024-10-11 15:50:41
使用 C 自動化您的生活：適合初學者的腳本和工具

2024-10-11 15:07:41
PHP 變得簡單：Web 開發的第一步

2024-10-11 14:21:21
使用 Python 建立任何東西：釋放創造力的初學者指南

2024-10-11 12:59:11
編碼的關鍵：為初學者釋放 Python 的力量

2024-10-11 12:17:31

最新問題

在多個路由中聲明的workerpool是否仍然可以保持其cpu使用率而不關心閾值我希望找到一個帶有workerpool的node.js系統來處理CPU密集型任務，但是對於多條路由中的cpu使用情況，我有點困惑。一個場景是這樣的：route1.js:constw...

來自於 2024-04-06 19:54:23

0

1

444

使用MySQL SQL查詢計算另一張表中欄位的總和我有一個這樣的模式：具有屬性“user_id”和“username”的用戶表以及具有屬性“customer_id”（user_id的FK）和“finalPrice”的訂單表資料庫架...

來自於 2024-04-06 19:39:29

0

1

441

無法從網站取得輸入元素所以我試圖從Twitter獲取一個輸入元素，但當我運行它時，它不斷在節點終端中給我一個這樣的錯誤，結果，由此代碼創建的瀏覽器窗口將自行關閉，因為它找不到正確的輸入選擇器。如何取得正...

來自於 2024-04-06 18:59:57

0

1

442

在模板中使用方法中定義的變數這是我第一次使用Vue（v2而不是v3），我一直在嘗試在模板內使用變數（在方法內定義）。我的簡化程式碼：<template><divclass="con...

來自於 2024-04-06 18:10:25

0

2

513

使用SCSS產生預設值和CSS變數我正在實現網站樣式。出於遺留支援的原因，我需要支援IE11，至少一段時間。出於工作流程和我的理智原因，我想盡可能使用css變數。我已經研究過這個解決方案，它會產生一些有效的東西，但...

來自於 2024-04-06 17:46:54

0

1

355

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1421243
php入門教程之一週學會PHP

4264967
JAVA 初級入門影片教學

2516159
小甲魚零基礎入門學習Python影片教學

506211
PHP 零基礎入門教學

861316

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板