社群學習工具庫休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

WBOY

發布： 2023-04-11 08:41:02

轉載

1006 人瀏覽過

ChatGPT引爆的AI熱潮也「燒到了」金融圈。

近來，彭博社的研究人員也發展了一個金融領域的GPT－Bloomberg GPT，有500億參數。

GPT-4的橫空出世，讓許多人淺嚐到了大型語言模型的強大能力。

然而，OpenAI不open。業界許多人紛紛開始做GPT的克隆，而且許多ChatGPT平替的模型都是基於已經開源的模型上構建，尤其是Meta開源的LLMa模型。

例如，史丹佛的Alpaca、UC柏克萊聯手CMU、史丹佛等駱馬（Vicuna），新創公司Databricks的Dolly等等。

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

針對不同任務和應用所建構的各種類別ChatGPT的大型語言模型，在整個領域呈現出百家爭鳴之勢。

那麼問題來了，研究者如何選擇合適的模型，甚至是多個模型，去完成一項複雜的任務呢？

近日，微軟亞洲研究院和浙江大學的研究團隊，發布了一個大模型協作系統HuggingGPT。

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

論文網址：https://arxiv.org/pdf/2303.17580.pdf

#HuggingGPT利用ChatGPT作為控制器，連接HuggingFace社群中的各種AI模型，來完成多模態複雜任務。

這意味著，你將擁有一種超魔法，透過HuggingGPT，便可擁有多模態能力，文生圖、文生影片、語音全能拿捏了。

HuggingGPT搭橋

#研究者指出解決大型語言模型（LLMs）目前的問題，可能是邁向AGI的第一步，也是關鍵的一步。

因為目前大型語言模型的技術仍然存在一些缺陷，因此在建構 AGI 系統的道路上面臨一些緊迫的挑戰。

- 受限於文字產生的輸入和輸出形式，目前LLMs缺乏處理複雜訊息（如視覺和語音）的能力；

- 在實際應用場景中，一些複雜任務通常由多個子任務組成，因此需要多個模型的調度和協作，這也超出了語言模型的能力範圍；

#- 對於一些具有挑戰性的任務，LLMs在零樣本或少樣本設定下表現出優異的結果，但它們仍然比一些專家弱（如微調模型）。

為了處理複雜的人工智慧任務，LLMs應該能夠與外部模型協調，以利用它們的能力。因此，關鍵點在於如何選擇合適的中間件來橋接LLMs和AI模型。

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

研究者發現，每個AI模型都可以透過總結其模型功能表示為一種語言形式。

#

由此，便引入了一個概念，「語言是LLMs，即ChatGPT，連接人工智慧模型的通用介面」。

透過將AI模型描述納入提示中，ChatGPT可以被視為管理人工智慧模型的大腦。因此，此方法可以讓ChatGPT能夠呼叫外部模型，來解決實際任務。

簡單來講，HuggingGPT是一個協作系統，不是大模型。

它的作用就是連結ChatGPT和HuggingFace，進而處理不同模態的輸入，並解決眾多複雜的人工智慧任務。

所以，HuggingFace社群中的每個AI模型，在HuggingGPT庫中都有相應的模型描述，並將其融合到提示中以建立與ChatGPT的連接。

隨後，HuggingGPT將ChatGPT作為大腦來確定問題的答案。

到目前為止，HuggingGPT已經圍繞ChatGPT在HuggingFace上整合了數百個模型，涵蓋了文字分類、目標偵測、語義分割、圖像生成、問答、文字轉語音、文字轉影片等24個任務。

實驗結果證明，HuggingGPT擁有處理多模態資訊和複雜人工智慧任務的能力。

四步驟工作流程

HuggingGPT整個工作流程可分為以下四個階段：

- 任務規劃：ChatGPT解析使用者請求，將其分解為多個任務，並根據其知識規劃任務順序和依賴關係

- 模型選擇：LLM根據HuggingFace中的模型描述將解析後的任務分配給專家模型

- 任務執行：專家模型在推理端點上執行分配的任務，並將執行資訊和推理結果記錄到LLM中

- 回應產生：LLM總結執行過程日誌和推理結果，並將摘要傳回給使用者

#多模態能力，有了

#實驗設定

實驗中，研究者採用了gpt-3.5-turbo和text-davinci-003這兩種GPT模型的變體作為大型語言模型（LLMs），這些模型可以透過OpenAI API公開存取。

為了讓LLM的輸出更穩定，我們將解碼溫度設定為0。

同時，為了調整LLM的輸出以使其符合預期格式，我們在格式限制上設定了logit_bias為0.1。

研究人員在如下表格中提供了為任務規劃、模型選擇和反應生成階段而設計的詳細提示，其中{{variable}}表示在提示被輸入LLM之前，需要用對應的文字填入域值。

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

研究人員在廣泛的多模態任務上測試了HuggingGPT。

#

在ChatGP和專家模型的配合下，HuggingGPT可以解決語言、圖像、音訊和視訊等多種模式的任務，包含了檢測、生成、分類和問題回答等多種形式的任務。

雖然這些任務看起來很簡單，但掌握HuggingGPT的基本能力是解決複雜任務的前提條件。

例如，視覺問答任務：

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

文字產生：

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

華文生圖：

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

HuggingGPT可以整合多個輸入的內容來進行簡單的推理。可以發現，即使有多個任務資源，HuggingGPT也能將主要任務分解成多個基本任務，最後整合多個模型的推理結果，得到正確答案。

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

此外，研究人員透過測試評估了HuggingGPT在複雜任務情況下的有效性。

就HuggingGPT處理多項複雜任務的能力進行了展示。

當處理多個請求的時候，可能包含多個隱含任務或需要等多方面的信息，這時依靠一個專家模型來解決是不夠的。

而HuggingGPT可以透過任務規劃組織多個模型的協作。

一個使用者請求中可能明確包含多個任務：

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

下圖展示了HuggingGPT在多輪對話場景下應對複雜任務的能力。

使用者將一個複雜的請求分成幾個步驟，透過多輪請求達到最終目標。結果發現，HuggingGPT可以透過任務規劃階段的對話情境管理來追蹤使用者請求的情境狀態，並且可以很好地解決使用者提到的請求資源以及任務規劃。

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

「賈維斯」開源

目前，這個專案已經在GitHub上開源，但是代碼並沒有完全公佈。

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

有趣的是，研究者給這個專案命名為《鋼鐵人》中的賈維斯，無敵AI這就來了。

JARVIS：一個連接LLMs和ML社群的系統

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

順便提一句，HuggingGPT需要有了OpenAI的API才可以使用。

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

網友：研究的未來

JARVIS / HuggingGPT就像先前Meta提出的Toolformer一樣，都在充當連接器的作用。

甚至，包括ChatGPT plugins也是如此。

網友稱，「我強烈懷疑第一個人工通用智慧（AGI）的出現將比預期更早。它將依靠「膠水」人工智慧，能夠智慧地將一系列狹義人工智慧和實用工具黏合在一起。

我獲得了存取插件權限，這使它一夜之間從數學菜雞變成了數學天才。當然，這只是一個小步驟，但卻預示著未來的發展趨勢。

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

我預測，在接下來的一年左右，我們將看到一種人工智慧助手，它與數十個大型語言模型（LLMs）及類似工具相連，而終端用戶只需向其助手發出指令，讓其為他們完成任務。這個科幻般的時刻即將到來。

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

還有網友稱，這就是未來的研究方法。

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

GPT在一大堆工具面前，知道如何使用它們了。

ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源

以上是ChatGPT自己會選模型了！微軟亞研院+浙大爆火新論文，HuggingGPT計畫已開源的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

系統模型

來源：51cto.com

上一篇：學生用ChatGPT拿下全班最高分，教授驚呆！全美大學打響AI反擊戰下一篇：Google探索全新NLU任務「自然語言評估」，正式面試前讓AI幫你熱身！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

什麼是 NullPointerException，如何修復它？

2024-10-22 09:46:29
從新手到程式設計師：您的旅程從 C 基礎知識開始

2024-10-13 13:53:41
使用 PHP 解鎖 Web 開發：初學者指南

2024-10-12 12:15:51
揭秘 C：為新程式設計師提供一條清晰簡單的道路

2024-10-11 22:47:31
釋放您的編碼潛力：絕對初學者的 C 編程

2024-10-11 19:36:51
釋放你內心的程式設計師：C 絕對初學者

2024-10-11 15:50:41
使用 C 自動化您的生活：適合初學者的腳本和工具

2024-10-11 15:07:41
PHP 變得簡單：Web 開發的第一步

2024-10-11 14:21:21
使用 Python 建立任何東西：釋放創造力的初學者指南

2024-10-11 12:59:11
編碼的關鍵：為初學者釋放 Python 的力量

2024-10-11 12:17:31

最新問題

在多個路由中聲明的workerpool是否仍然可以保持其cpu使用率而不關心閾值我希望找到一個帶有workerpool的node.js系統來處理CPU密集型任務，但是對於多條路由中的cpu使用情況，我有點困惑。一個場景是這樣的：route1.js:constw...

來自於 2024-04-06 19:54:23

0

1

444

使用MySQL SQL查詢計算另一張表中欄位的總和我有一個這樣的模式：具有屬性“user_id”和“username”的用戶表以及具有屬性“customer_id”（user_id的FK）和“finalPrice”的訂單表資料庫架...

來自於 2024-04-06 19:39:29

0

1

441

無法從網站取得輸入元素所以我試圖從Twitter獲取一個輸入元素，但當我運行它時，它不斷在節點終端中給我一個這樣的錯誤，結果，由此代碼創建的瀏覽器窗口將自行關閉，因為它找不到正確的輸入選擇器。如何取得正...

來自於 2024-04-06 18:59:57

0

1

442

在模板中使用方法中定義的變數這是我第一次使用Vue（v2而不是v3），我一直在嘗試在模板內使用變數（在方法內定義）。我的簡化程式碼：<template><divclass="con...

來自於 2024-04-06 18:10:25

0

2

513

使用SCSS產生預設值和CSS變數我正在實現網站樣式。出於遺留支援的原因，我需要支援IE11，至少一段時間。出於工作流程和我的理智原因，我想盡可能使用css變數。我已經研究過這個解決方案，它會產生一些有效的東西，但...

來自於 2024-04-06 17:46:54

0

1

355

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1425032
php入門教程之一週學會PHP

4271313
JAVA 初級入門影片教學

2551900
小甲魚零基礎入門學習Python影片教學

508465
PHP 零基礎入門教學

864003

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板