文章專題學習下載問答程式設計字典遊戲最近更新

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

首頁 > 科技週邊 > 人工智慧 > 主體

用大模型測試人格/憂鬱/認知模式！透過遊戲劇情發展測量心理特質

王林

發布： 2024-03-13 14:07:11

轉載

1088 人瀏覽過

心理測量在精神健康、自我了解、和個人發展方面都扮演著重要的角色。

傳統的心理測量方法主要依賴參與者填寫自我報告問卷，透過回想日常生活中的行為和情緒來進行測量。

這樣的測量方式雖然有效率且便捷，但可能引發參與者的抗拒心理，降低被測意願。

隨著大語言模型（LLM）的發展，許多研究發現LLM能夠展現出穩定的人格特質，模仿人類細微的情緒與認知模式，還能輔助各種各樣的社會科學模擬實驗，為教育心理學、社會心理學、文化心理學、臨床心理學、心理諮商等諸多心理學研究領域，提供了新的研究思維。

近日，清華大學的研究團隊基於大語言模式的多智能體系統，提出一種創新性的心理測量範式。

用大模型測試人格/憂鬱/認知模式！透過遊戲劇情發展測量心理特質

與傳統自我報告問卷不同的是，該研究為每位參與者客製化產生一個可互動的敘事類型遊戲，使用者可自訂遊戲的類型與主題。

隨著遊戲劇情的發展，參與者需要以第一人稱視角，根據各種情節做出不同的選擇，從而影響劇情的進展。透過研究參與者在遊戲關鍵時刻的選擇，可以評估他們的心理特徵。

△自我報告問卷的心理測量範式（左）與互動敘事類遊戲的心理測量範式（右）對比

該研究的貢獻主要體現在三個方面：

提出一種新的心理測量範式，將傳統問卷轉換成基於遊戲的互動測量；在保證心理測量信度和效度的基礎上，提升參與者的沉浸感，改善被測體驗。
為了實現遊戲化的測量，研究提出一個基於大語言模型的多智能體互動框架，名為PsychoGAT （Psychological Game AgenTs），確保了心理測驗場景的泛化性，與不同遊戲設定下測量的穩健性。
透過自動化模擬評估與真人評估，在MBTI人格測試，PHQ-9憂鬱測量，認知思考陷阱測試等任務上，該研究在心理測量學統計學指標和使用者體驗感指標上均展現出了顯著的優越性。

接下來，我們一起來看看研究的細節。

PsychoGAT長啥樣？

△PsychoGAT框架示意圖

智能體互動流程：

給定一個傳統的心理測驗問卷，參與者自訂遊戲類型和主題，然後由遊戲設計師（Game Designer）智能體給出整體的遊戲設計大綱。

然後，遊戲管理員（Game Controller）智能體產生一個具體的遊戲情節，在這個過程中評論員（Critic）智能體會對管理員生成內容進行多輪的審核與優化；優化完成後的遊戲情節會被展現給參與者，參與者做出相應的選擇後，管理員基於此選擇推動劇情發展，按照這樣的交互過程循環。

各智能體職能詳述：

遊戲設計師#（Game Designer）：利用CoT技術，產生第一人稱敘事遊戲的大綱，並確保這個故事線所包含的情景，能夠使得參與者表現出目前測量的心理特質。

同時，將標準的心理學自我報告問卷，根據當前遊戲故事線進行改編，使兩者的融合更為自然流暢。

遊戲管理員（Game Controller）：將改編後的問卷，依照遊戲的故事線，依序進行實例化，變成故事的情節節點，並提供可能的選項，供參與者選擇。

同時，遊戲管理員將參與者的選擇回傳給遊戲環境，並基於參與者的選擇，控制遊戲的劇情走向。為了實現遊戲情節的連貫性，管理者智能體採用「記憶更新」機制。

評論者（Critic）：旨在對遊戲管理員的生成內容進行審核與最佳化。

主要針對以下三個問題：

1）優化一致性：隨著遊戲劇情推進，長文本問題會變得更加嚴重，使得「記憶更新」機制也無法完全保證情節一致性。

2）確保無偏性：參與者的選擇會影響遊戲情節的發展，但在參與者不做出選擇之前，管理員不應該預設情節走向，即便先前的選擇中參與者體現出了明顯的傾向性。

3）改正漏缺項：對管理員產生的遊戲情節進行細節審核，檢查其是否具備基礎的遊戲沉浸感。

實驗及結果

△三種常見心理測量範式的比較：傳統問卷，心理學家會談，以及研究提出的遊戲化測評。

此處提到的均為基於AI的自動化測量，特別的，心理學家會談，指目前與大語言模型結合的，由大語言模型扮演心理學家的會談範式。

實驗階段，研究人員選擇了三個常見的心理測量任務：MBTI人格測驗中的外傾性，PHQ-9憂鬱檢測，以及CBT療法中前期的認知扭曲檢測。

首先，研究人員和成熟的傳統心理學問卷進行對比，旨在檢驗研究的心理測量信度和效度。進一步，和其他三種自動化測量方法進行對比，檢驗不同測量方法的使用者體驗。

研究者首先使用GPT-4模擬被測者，在不同的測量方法上記錄測量過程與測量結果。這些測量記錄被用來計算後續心理測量學信效度指標，以及使用者體驗感指標。

評估指標有兩個：信效度指標和使用者體驗感指標。

信效度指標：心理測量學上，評估一個測量工具是否具有科學性，一般從信度（reliability）和效度（validity）兩個維度進行驗證。

在研究中，信度的指標選擇了兩個統計量來衡量內部一致性：Cronbach's Alpha和Guttman's Lambda 6；效度的指標採用皮爾森係數，分別衡量聚合效度（convergent validity）和區分效度（discriminant validity）。

使用者體驗感指標，人工評估的指標包括：

1）一致性（Coherence, CH）：內容邏輯是否連貫；
2）交互性（Interactivity, IA）：是否對使用者的選擇有恰當且無偏的回應；
3）趣味性（Interest , INT）：測量過程是否有趣；
4）沉浸感（Immersion, IM）：測量過程是否讓參與者沉浸代入；
5）滿意度（Satisfaction, ST）：整體測量過程的滿意度。

下面是實驗結果。

首先研究者檢驗了研究提出的PsychoGAT能夠作為一個合格的心理測量工具，結果如下表所示。

△PsychoGAT的信效度檢定結果（通過，良好，優秀）

進一步，研究者對比了不同心理測量範式的使用者體驗感，研究提出的遊戲化評估在互動性、趣味性和沈浸感上都顯著優於其他方法：

△PsychoGAT的用戶體驗感結果，以及其他對比方法的相應結果

為了確保人工評估的有效性，研究人員計算了人工評估結果，在PsychoGAT各指標優於其他方法上的評估一致性：

△PsychoGAT的使用者體驗感指標由於對比方法在人工評估上的一致性

為了對PsychoGAT做進一步分析，研究人員首先檢驗了不同遊戲場景下，遊戲化測量的信效度具有很好穩健性：

△PsychoGAT在不同遊戲場景下測量信效度的穩健性

接著，探討了每一個智能體在PsychoGAT中所扮演的角色：

△PsychoGAT不同智能體的作用

#最後，為了直觀呈現PsychoGAT的遊戲生成內容，研究人員用詞雲可視化了人格外傾性測試和憂鬱測試：

△PsychoGAT在外傾測量和憂鬱測量的遊戲場景生成視覺化。

外傾性測驗的內容主要集中在社交場景，而憂鬱測驗傾向於個人思考和情緒。

更多研究細節，可參考原論文。

論文連結：//m.sbmmt.com/link/4bcd537b6c034e297f0030cf08887426

#

以上是用大模型測試人格/憂鬱/認知模式！透過遊戲劇情發展測量心理特質的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

模型研究

來源：51cto.com

上一篇：探索數據科學對機器人的影響下一篇：2024蘋果學者名單公佈，華人佔一半！賓大博士生曾和Jim Fan搞出英偉達最火機器人

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

CSS Grid 與 Flexbox：何時使用哪一個

2024-07-22 03:06:50
Lockbit勒索病毒成員在美國認罪！吸金超5億美元多是比特幣

2024-07-22 03:02:09
AMD 新一代 RDNA 4 顯示卡新光追特性曝光，Sony PS5 Pro 遊戲主機同樣有望搭載

2024-07-22 02:59:10
原神原石使用方法介紹

2024-07-22 02:49:58
分析師預測比特幣 (BTC) 預計將重回 7 萬美元阻力位

2024-07-22 02:22:31
下次在下一次多頭市場前值得關注的 5 種加密貨幣

2024-07-22 02:08:00
今天的 3 種山寨幣價格還不到一杯咖啡，但有潛力在 2024 年改變生活

2024-07-22 02:03:00
ChatGPT 將這些加密貨幣列為 2024 年多頭市場的最大贏家

2024-07-22 01:54:10
使用 npm-check 更新您的 npm 軟體包

2024-07-22 01:49:50
鯨魚投資者囤積 8 億 DOGE 代幣，狗狗幣 (DOGE) 價格一周飆升 20%

2024-07-22 01:08:20

最新問題

Vue專案中未定義模組我剛剛通過運行npmini tvue@latest創建了一個新的Vue應用程序，如官方文件中指定的那樣。然後我嘗試按照Vue和Vite網站上的指南將Tailwind添加到我的應用程...

來自於 2023-11-17 12:38:53

0

2

394

tp6 查詢器如何最佳化 tp6 model模型關聯多個資料表查詢時，使用查詢器會很慢，要怎麼優化，有沒有最佳化的方法呀！求助！！！！！

來自於 2023-11-17 08:50:36

0

0

84

如何根據角色為每個使用者定義一組權限的Laravel Spatie權限設定方法？我有4種類型的使用者使用我的系統：1.超級管理員2.超級管理員團隊、3.管理員和4。管理團隊成員，因為我使用spatie來處理角色和權限，所以我有一組對於所有類型的使用者來說都很常...

來自於 2023-11-14 12:58:58

0

1

292

WordPress 6.0 (add_editor_style) 不會在古騰堡編輯器中載入 style.css 我正在學習UdemyWordPress課程來建立自訂WordPress區塊主題。我成功在function.php中註冊了區塊類型，並且可以在古騰堡編輯器中選擇我的區塊。教學建議使用...

來自於 2023-11-12 20:37:50

0

2

261

遇到PHPMailer未定義類型錯誤（嘗試使用Composer也無效）我不知道為什麼會收到此“PHPMailer未定義類型”錯誤。首先，我嘗試直接下載zip並從github複製程式碼，同樣的問題出現，然後我下載了我不想下載的composer，但下載後...

來自於 2023-11-12 17:35:06

0

1

180

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1387142
php入門教程之一週學會PHP

4193794
JAVA 初級入門影片教學

2296341
小甲魚零基礎入門學習Python影片教學

487916
PHP 零基礎入門教學

819798

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板

關於我們免責聲明 Sitemap: PHP中文網：公益線上PHP培訓，幫助PHP學習者快速成長！