社群學習工具庫休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > 史丹佛新研究：ChatGPT背後模型被證實具有人類心智

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

PHPz

發布： 2023-04-14 13:04:02

轉載

1392 人瀏覽過

ChatGPT原來是擁有心智的？！「原本認為是人類獨有的心智理論（Theory of Mind，ToM），已經出現在ChatGPT背後的AI模型上。」

這是來自史丹佛大學的最新研究結論，一發出就造成了學術圈的轟動：

這一天終於猝不及防地來了。

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

所謂心智理論，就是理解他人或自己心理狀態的能力，包括同理心、情緒、意圖等。

在這項研究中，作者發現：

davinci-002版本的GPT3（ChatGPT由它優化而來），已經可以解決70%的心智理論任務，相當於7歲兒童；

至於GPT3.5（davinci-003），也就是ChatGPT的同源模型，更解決了93%的任務，心智相當於9歲兒童！

然而，在2022年之前的GPT系列模型身上，還沒有發現解決這類任務的能力。

也就是說，它們的心智確實是「進化」而來的。

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

△ 論文在推特上爆紅

對此，有網友激動表示：

GPT的迭代肯定快得很，說不定哪天就直接成年了。（手動狗頭）

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

所以，這個神奇的結論是如何得出的？

為什麼認為GPT-3.5具備心智？

這篇論文名為《心智理論可能在大語言模型中自發性地出現》（Theory of Mind May Have Spontaneously Emerged in Large Language Models）。

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

作者依據心智理論相關研究，為GPT3.5在內的9個GPT模型做了兩個經典測試，並將它們的能力進行了比較。

這兩大任務是判斷人類是否具備心智理論的通用測試，例如有研究表明，患有自閉症的兒童通常難以通過這類測試。

第一個測試名為Smarties Task（又名Unexpected contents，意外內容測試），顧名思義，測試AI對意料之外事情的判斷力。

以「你打開一個巧克力包裝袋，發現裡面裝滿了爆米花」為例。

作者給GPT-3.5輸入了一系列提示語句，觀察它預測“袋子裡有什麼？”和“她發現袋子時很高興。所以她喜歡吃什麼？”兩個問題的答案。

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

正常來說，人們會預設巧克力袋子裡是巧克力，因此會對巧克力袋子裡裝著爆米花感到驚訝，產生失落或驚喜的情緒。其中失落說明不喜歡吃爆米花，驚喜說明喜歡吃爆米花，但都是針對「爆米花」而言。

測試表明，GPT-3.5毫不猶豫地認為「袋子裡裝著爆米花」。

至於在“她喜歡吃什麼”問題上，GPT-3.5展現出了很強的同理心，尤其是聽到“她看不見包裝袋裡的東西”時一度認為她愛吃巧克力，直到文章明確表示「她發現裡面裝滿了爆米花」才正確回答出答案。

為了防止GPT-3.5回答出的正確答案是巧合——萬一它只是根據任務單字出現頻率進行預測，作者將「爆米花」和「巧克力」對調，另外也讓它做了10000個幹擾測試，結果發現GPT-3.5並非只根據單字頻率來預測。

至於在整體的「意外內容」測試問答上，GPT-3.5成功回答了20個問題中的17個，準確率達到了85%。

第二個是Sally-Anne測試（又稱Unexpected Transfer，意外轉移任務），測試AI預估他人想法的能力。

以「約翰把貓放進籃子後離開，馬克趁他不在，把貓從籃子裡放進盒子裡」為例。

作者讓GPT-3.5讀了一段文字，來分別判斷“貓的位置”和“約翰回來後會去哪裡找貓”，同樣這是它基於閱讀文本的內容量做出的判斷：

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

#針對這類「意外轉移」測試任務，GPT-3.5回答的準確率達到了100%，很好地完成了20個任務。

同樣地，為了避免GPT-3.5又是瞎蒙的，作者給它安排了一系列“填空題”，同時隨機打亂單詞順序，測試它是否是根據詞彙出現的頻率在亂答。

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

測試表明，在面對沒有邏輯的錯誤描述時，GPT-3.5也失去了邏輯，僅回答正確了11%，這表示它確實是根據語句邏輯來判斷答案的。

但要是以為這種題目很簡單，隨便放在哪個AI上都能做對，那就大錯特錯了。

作者對GPT系列的9個模型都做了這樣的測試，發現只有GPT-3.5（davinci-003）和GPT-3（2022年1月新版，davinci- 002）表現不錯。

davinci-002是GPT-3.5和ChatGPT的「老前輩」。

平均下來，davinci-002完成了70%的任務，心智相當於7歲孩童，GPT-3.5完成了85%的意外內容任務和100%的意外轉移任務（平均完成率92.5%），心智相當於9歲小孩。

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

然而在BLOOM之前的幾個GPT-3模型，就連5歲孩童都不如了，基本上沒有表現出心智理論。

作者認為，在GPT系列的論文中，並沒有證據表明它們的作者是「有意而為之」的，換而言之，這是GPT-3.5和新版GPT-3為了完成任務，自己學習的能力。

看完這些測驗數據後，有人的第一個反應是：快停下來（研究）！

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

也有人調侃：這不就代表我們以後也能跟AI做朋友了？

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

甚至有人已經在想像AI未來的能力了：現在的AI模型是不是也能發現新知識/創造新工具了？

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

發明新工具還不一定，但Meta AI確實已經研究出了可以自己搞懂並學會使用工具的AI。

LeCun轉發的一篇最新論文顯示，這個名叫ToolFormer的新AI，可以教自己使用電腦、資料庫和搜尋引擎，來改善它產生的結果。

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

甚至有人已經搬離了OpenAI CEO那句「AGI可能比任何人預料的更早來敲響我們的大門」。

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

但先等等，AI真的就能通過這兩個測試，表明自己具備“心智理論”了嗎？

會不會是「裝出來的」？

例如，中科院計算技術研究所研究員劉群看過研究後就認為：

AI應該只是學得像有心智了。

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

既然如此，GPT-3.5是如何回答這一系列的問題？

對此，有網友給了自己的猜測：

這些LLM並沒有產生任何意識。它們只是在預測一個嵌入的語義空間，而這些語義空間是建立在實際有意識的人的輸出之上的。

史丹佛新研究：ChatGPT背後模型被證實具有人類心智

事實上，作者自己也給了論文中自己的猜測。

如今，大語言模型變得越來越複雜，也越來越擅長生成和解讀人類的語言，它逐漸產生了像心智理論一樣的能力。

但這並不意味著，GPT-3.5這樣的模型就真正具備了心智理論。

與之相反，它即使不被設計到AI系統中，也可以被訓練成「副產品」。

因此，相較於探究GPT-3.5是不是真的有了心智還是像有心智，更需要反思的是這些測驗本身－

#最好重新檢視心智理論測驗的有效性，以及心理學家們這數十年來依據這些測驗得出的結論：

如果AI都能在沒有心智理論的情況下完成這些任務，如何人類不能像它們一樣？

屬實是用AI測驗的結論，反向批判心理學學術圈了（doge）。

關於作者

本文作者僅一位，來自史丹佛大學商學院組織行為學專業的副教授Michal Kosinski。

他的工作內容就是利用前沿計算方法、AI和大數據研究當下數字環境中的人類（如陳怡然教授所說，他就是一位計算心理學教授）。

Michal Kosinski擁有劍橋大學心理學博士學位，心理測驗學和社會心理學碩士學位。

在目前職位之前，他曾在史丹佛大學電腦系進行博士後學習，擔任劍橋大學心理測驗中心的副主任，以及微軟研究機器學習小組的研究員。

目前，Michal Kosinski在Google學術上顯示的論文引用次數已達18000 。

話又說回來，你認為GPT-3.5真的具備心智了嗎？

GPT3.5試用網址：https://platform.openai.com/playground

以上是史丹佛新研究：ChatGPT背後模型被證實具有人類心智的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

測試模型

來源：51cto.com

上一篇：人工智慧如何改變資料隱私的遊戲規則？下一篇：弄清楚OpenCV中的CvType各種參數意義以及相關方法

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

編碼的關鍵：為初學者釋放 C 的力量

2024-10-13 11:44:01
使用 PHP 和 MySQL 將您的網站連接到資料庫

2024-10-13 09:56:31
使用 Python 解決問題：作為初學者，解鎖強大的解決方案

2024-10-11 20:58:41
Python 的力量，簡單：一種適合初學者的程式設計方法

2024-10-11 16:53:11
PHP 與社群媒體：將您的網站與世界融為一體

2024-10-11 11:54:51
使用 PHP 的動態圖像畫廊：在線展示您的作品

2024-10-10 16:21:01
使用 PHP 建立 API 和 Web 服務

2024-10-10 15:18:02
揭秘 Java：為新程式設計師提供一條清晰、簡單的道路

2024-10-10 13:34:01
使用 C 創建遊戲和圖形：有趣且實用的介紹

2024-10-10 13:26:26
王者榮耀程咬金怎麼玩？

2024-10-10 11:38:42

最新問題

在多個路由中聲明的workerpool是否仍然可以保持其cpu使用率而不關心閾值我希望找到一個帶有workerpool的node.js系統來處理CPU密集型任務，但是對於多條路由中的cpu使用情況，我有點困惑。一個場景是這樣的：route1.js:constw...

來自於 2024-04-06 19:54:23

0

1

444

使用MySQL SQL查詢計算另一張表中欄位的總和我有一個這樣的模式：具有屬性“user_id”和“username”的用戶表以及具有屬性“customer_id”（user_id的FK）和“finalPrice”的訂單表資料庫架...

來自於 2024-04-06 19:39:29

0

1

441

無法從網站取得輸入元素所以我試圖從Twitter獲取一個輸入元素，但當我運行它時，它不斷在節點終端中給我一個這樣的錯誤，結果，由此代碼創建的瀏覽器窗口將自行關閉，因為它找不到正確的輸入選擇器。如何取得正...

來自於 2024-04-06 18:59:57

0

1

442

在模板中使用方法中定義的變數這是我第一次使用Vue（v2而不是v3），我一直在嘗試在模板內使用變數（在方法內定義）。我的簡化程式碼：<template><divclass="con...

來自於 2024-04-06 18:10:25

0

2

513

使用SCSS產生預設值和CSS變數我正在實現網站樣式。出於遺留支援的原因，我需要支援IE11，至少一段時間。出於工作流程和我的理智原因，我想盡可能使用css變數。我已經研究過這個解決方案，它會產生一些有效的東西，但...

來自於 2024-04-06 17:46:54

0

1

355

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1422752
php入門教程之一週學會PHP

4267799
JAVA 初級入門影片教學

2531737
小甲魚零基礎入門學習Python影片教學

507140
PHP 零基礎入門教學

862241

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板