社群學習工具庫休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > 大模型做時序預測也很強！華人團隊啟動LLM新能力，超越一眾傳統模式實現SOTA

大模型做時序預測也很強！華人團隊啟動LLM新能力，超越一眾傳統模式實現SOTA

PHPz

發布： 2024-04-11 09:43:20

轉載

526 人瀏覽過

大語言模型潛力被激發－

無需訓練大語言模型就能實現高精度時序預測，超越一切傳統時序模型。

蒙納士大學、螞蟻和IBM研究院共同開發了一個通用框架，成功推動了大語言模型跨模態處理序列資料的能力。該框架已成為一項重要的技術創新。

大模型做時序預測也很強！華人團隊啟動LLM新能力，超越一眾傳統模式實現SOTA

時序預測有益於城市、能源、交通、遙感等典型複雜系統的決策。

自此，大模型可望徹底改變時序/時空資料探勘方式。

通用大語言模型重編程框架

研究團隊提出了一個通用框架，將大語言模型輕鬆用於一般時間序列預測，而無需做任何訓練。

主要提出兩大關鍵技術：時序輸入重編程；提示做前綴。

Time-LLM首先使用文字原型（Text Prototypes）對輸入的時間資料進行重編程，透過使用自然語言表徵來表示時間資料的語義訊息，進而對齊兩種不同的資料模態，使大語言模型無需任何修改即可理解另一種資料模態背後的資訊。同時，透過大語言模型不需要任何特定的訓練資料集，即可理解不同的資料模態的背後訊息。這種方法不僅能夠提高模型的準確性，還能夠簡化資料預處理過程。

為了更好地處理輸入時序資料和對應任務的解析，作者提出了Prompt-as-Prefix（PaP）的範式。此範式透過在時序資料表徵前加入額外的上下文資訊和任務指令，充分啟動LLM在時序任務上的處理能力。這種方法可以在時序任務上實現更精細的解析，並且透過在時序資料表格前添加額外的上下文資訊和任務指令，充分啟動LLM在時序任務上的處理能力。

主要貢獻包括：

提出了透過重編程大型語言模型用於時序分析的全新概念，無需對主幹語言模型做任何修改。
提出一個通用語言模型重編程框架Time-LLM，它包括將輸入時序資料重新編程為更自然的文本原型表示，並透過聲明性提示（例如領域專家知識和任務說明）來增強輸入上下文，以指導LLM進行有效的跨域推理。
在主流預測任務中的表現始終超過現有最好的模型效能，尤其在少樣本和零樣本情境中。此外，Time-LLM在維持出色的模型重編程效率的同時，能夠實現更高的效能。大幅釋放LLM在時間序列和其他順序資料方面尚未開發的潛力。

具體來看這個框架，首先，輸入時序資料先透過RevIN歸一化操作，然後被切分成不同patch並對應到隱空間。

時序資料和文字資料在表達方式上有顯著差異，兩種屬於不同的模態。

時間序列既不能直接編輯，也不能無損地用自然語言描述。因此，我們需要將時序輸入特徵對齊到自然語言文字域上。

大模型做時序預測也很強！華人團隊啟動LLM新能力，超越一眾傳統模式實現SOTA

而對齊不同模態的一個常見方式是cross-attention，但是LLM固有的詞彙表很大，因此無法有效直接將時序特徵對齊到所有單字上，而且也並不是所有字詞都和時間序列有對齊的語意關係。

為了解決這個問題，這項工作對詞彙表進行了線形組合來獲取文本原型，其中文本原型的數量遠小於原始詞彙量，組合起來可以用於表示時序數據的變化特徵。

而為了充分啟動LLM在指定時序任務上的能力，這項工作提出了提示做前綴的範式。

通俗點說，就是把時間序列資料集的一些先驗訊息，以自然語言的方式，作為前綴prompt，和對齊後的時序特徵拼接餵給LLM，是不是能夠提升預測效果？

大模型做時序預測也很強！華人團隊啟動LLM新能力，超越一眾傳統模式實現SOTA

在實務中，作者確定了建立有效提示的三個關鍵元件：

資料集上下文；（2）任務指令，讓LLM適配不同的下游任務；（3）統計描述，例如趨勢、延遲等，讓LLM更能理解時序資料的特性。

大模型做時序預測也很強！華人團隊啟動LLM新能力，超越一眾傳統模式實現SOTA

团队在长程预测上经典的8大公开数据集上进行了全面的测试。

结果Time-LLM在基准比较中显著超过此前领域最优效果，比如对比直接使用GPT-2的GPT4TS，Time-LLM有明显提升，表明了该方法的有效性。

大模型做時序預測也很強！華人團隊啟動LLM新能力，超越一眾傳統模式實現SOTA

此外，在zero-shot场景中也表现了很强的预测能力。

大模型做時序預測也很強！華人團隊啟動LLM新能力，超越一眾傳統模式實現SOTA

本项目获得蚂蚁集团智能引擎事业部旗下AI创新研发部门NextEvo支持。

感兴趣的小伙伴可戳下方链接了解论文详情~

论文链接https://arxiv.org/abs/2310.01728。

以上是大模型做時序預測也很強！華人團隊啟動LLM新能力，超越一眾傳統模式實現SOTA的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

人工智慧 ai 大語言模型

來源：51cto.com

上一篇：Mistral開源8X22B大模型，OpenAI更新GPT-4 Turbo視覺，都在欺負Google 下一篇：為什麼人工智慧取證在2024年很重要

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

編碼的關鍵：為初學者釋放 C 的力量

2024-10-13 11:44:01
使用 PHP 和 MySQL 將您的網站連接到資料庫

2024-10-13 09:56:31
使用 Python 解決問題：作為初學者，解鎖強大的解決方案

2024-10-11 20:58:41
Python 的力量，簡單：一種適合初學者的程式設計方法

2024-10-11 16:53:11
PHP 與社群媒體：將您的網站與世界融為一體

2024-10-11 11:54:51
使用 PHP 的動態圖像畫廊：在線展示您的作品

2024-10-10 16:21:01
使用 PHP 建立 API 和 Web 服務

2024-10-10 15:18:02
揭秘 Java：為新程式設計師提供一條清晰、簡單的道路

2024-10-10 13:34:01
使用 C 創建遊戲和圖形：有趣且實用的介紹

2024-10-10 13:26:26
王者榮耀程咬金怎麼玩？

2024-10-10 11:38:42

最新問題

數獨檢查器無法運作？誰能幫我辨識錯誤？我嘗試了在線編輯器上的所有方法，但仍然收到錯誤。但當我在我的機器上的VSCode上執行此操作時，它工作正常。我很困惑，在沒有發現錯誤的情況下無法提交程式碼。我不知道該去哪裡找了。我...

來自於 2024-04-06 21:21:07

0

1

474

放大 d3.js 時散佈圖點不會保持值這是我第一次使用d3.js，所以請耐心等待。我在vue.js檔案中將其作為純JavaScript實作。我正在嘗試製作具有縮放功能的散點圖。到目前為止，我幾乎一切正常，但當我縮放時，...

來自於 2024-04-06 18:16:26

0

1

403

使用SCSS產生預設值和CSS變數我正在實現網站樣式。出於遺留支援的原因，我需要支援IE11，至少一段時間。出於工作流程和我的理智原因，我想盡可能使用css變數。我已經研究過這個解決方案，它會產生一些有效的東西，但...

來自於 2024-04-06 17:46:54

0

1

355

了解 Nuxtjs auth 模組的內部工作原理我實際上試圖將Nuxtjsauth模組整合到我的專案中，但我無法理解auth模組的實際工作原理。如果有人幫助我理解這個概念，那將對我非常有幫助。謝謝！

來自於 2024-04-06 15:38:16

0

1

371

Node.js：無法將 SQL 查詢結果儲存在陣列中我正在嘗試將SQL查詢的結果推送到數組。但是，它似乎不起作用。我在網上找不到解決方案。如果有人能幫我解決這個問題，我將不勝感激。 letdata=[];connection.que...

來自於 2024-04-06 14:14:46

0

1

373

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1422763
php入門教程之一週學會PHP

4267826
JAVA 初級入門影片教學

2531865
小甲魚零基礎入門學習Python影片教學

507161
PHP 零基礎入門教學

862258

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板