社群學習工具庫休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > LLaMA模型慘遭洩漏，Meta版ChatGPT被迫「開源」！ GitHub斬獲8k星，評測大量出爐

LLaMA模型慘遭洩漏，Meta版ChatGPT被迫「開源」！ GitHub斬獲8k星，評測大量出爐

WBOY

發布： 2023-04-12 17:49:03

轉載

1440 人瀏覽過

ChatGPT角逐之戰愈演愈烈。

前幾週，Meta發布了自家的大型語言模型LLaMA，參數量從70億到650億不等。

論文中，僅用1/10參數的LLaMA（130億）在大多數基準測試下超越了GPT-3。

對於650億參數的LLaMA，則與DeepMind的Chinchilla（700億參數）和Google的PaLM（5400億參數）旗鼓相當。

雖然Meta聲稱LLaMA是開源的，但還需要研究人員申請並進行審核。

然而萬萬沒想到的是，剛發布沒幾天，LLaMA的模型檔案就提前洩漏了。

那麼，問題來了，這究竟是故意的還是不小心的

LLaMA慘遭「開源」？

近日，國外論壇4chan上洩漏了LLaMA的成品庫。

LLaMA模型慘遭洩漏，Meta版ChatGPT被迫「開源」！ GitHub斬獲8k星，評測大量出爐

#上週四，用戶llamanon在4chan的技術板上發帖，透過種子文件（torrent）發布7B和65B的LLaMA模型。

LLaMA模型慘遭洩漏，Meta版ChatGPT被迫「開源」！ GitHub斬獲8k星，評測大量出爐

這個種子連結目前被合併到了LLaMA的GitHub頁面。

他也向專案提交了第二個拉請求，該請求提供了一個種子鏈接，連結到模型的另一組權重。

目前專案在GitHub已收穫8k顆星。

然而，洩密者最大的錯誤之一就是在洩密的模型中包含了他們唯一的識別碼。

這個程式碼是專門用來追蹤洩密者的，使用戶llamanon的個人資訊處於危險之中。

正所謂，LLaMA開源的不太體面，網友幫它體面了。

此外，4chan上的使用者也為那些希望在自己的工作站上部署模型的人創建了一個方便的資源。

並提供了一個分佈教程的指南，說明如何獲得模型，並將修改後的權重添加到其中，以便進行更有效的推理。

更重要的是，這個資源甚至提供了一種將LLaMA整合到線上寫作平台KoboldAI的方法。

LLaMA模型慘遭洩漏，Meta版ChatGPT被迫「開源」！ GitHub斬獲8k星，評測大量出爐

#對於這件事究竟是Meta有意為之，還是無意洩漏。網友們紛紛發表了自己的看法。

一位網友分析地頭頭是道，「也許這是Meta故意洩漏的，以對抗 OpenAI。」

一些客戶認為這是一個更好的模型，它恰好擊中了他們以每年25萬美元的價格出售訪問權的商業計劃的核心。訪問他們的服務一個月可以購買一台能夠運行這種洩漏模型的機器。 Meta削弱了一個潛在的新貴競爭對手，以保持當前的大型科技卡特爾穩定。也許這有點陰謀論，但我們生活在大科技和大陰謀的時代。

週一，Meta稱，儘管LLaMA已經洩露給未經授權的用戶，仍將繼續向認可的研究人員發布其人工智慧工具。

有網友直接稱，自己下載了70億參數的LLaMA，儘管不知道如何運行，萬一以後用上就能拿來了。

LLaMA模型慘遭洩漏，Meta版ChatGPT被迫「開源」！ GitHub斬獲8k星，評測大量出爐

#LLaMA的洩漏和開源是一個大事件：

Stable Diffusion開源了。 8個月後，我們現在就可以讀懂別人的思想，解碼他們所看到的一切。

隨著LLMs的開放，我們將得到一些真正的瘋狂的東西。

LLaMA模型慘遭洩漏，Meta版ChatGPT被迫「開源」！ GitHub斬獲8k星，評測大量出爐

模型初步評測

LLaMA發布不久後，網友發現這個最小參數的模型也需要近30GB的GPU才能運作。

然而，透過位元和位元組庫進行浮點最佳化，他們能夠讓模型在單一NVIDIA RTX 3060上運行。

此外，GitHub 上的一名研究人員甚至能夠在Ryzen 7900X CPU上運行LLM的7B 版本，每秒能推斷出幾個單字。

那麼LLaMA模型究竟怎麼樣？國外小哥便對它進行了評測。

LLaMA模型慘遭洩漏，Meta版ChatGPT被迫「開源」！ GitHub斬獲8k星，評測大量出爐

#LLaMA在許多測試中表現出色。

在大規模多任務語言理解方面，即使相對較小的13B模型也與GPT-3水準相當，而GPT-3的規模是其13倍。

33B版本遠優於GPT-3， 65B則可與現有最強大的LLM模型--Google的540B參數的PaLM競爭。

LLaMA模型慘遭洩漏，Meta版ChatGPT被迫「開源」！ GitHub斬獲8k星，評測大量出爐

對於需要應用邏輯或計算進行處理的文本方面，LLaMA表現優秀，在定量推理方面可與PaLM相較，甚至比後者的程式碼產生能力更好。

LLaMA模型慘遭洩漏，Meta版ChatGPT被迫「開源」！ GitHub斬獲8k星，評測大量出爐

#鑑於這些結果，LLaMA似乎是目前最先進的模型之一，而且，它足夠小，不需要多少資源就能運作。這使得LLaMA對人們來說充滿誘惑，想讓人和它玩玩，見見它的本領。

#

解釋笑話

PaLM原始論文中展示了一個非常酷的用例：給定一個笑話，讓模型解釋它為什麼好笑。這個任務需要把嘗試和邏輯結合起來，PaLM之前的所有模型都無法做到這一點。

將其中一些笑話交給LLaMA和ChatGPT來解釋，有些笑話語言模型能get到，例如Schimidhuber冗長無聊的發言。

LLaMA模型慘遭洩漏，Meta版ChatGPT被迫「開源」！ GitHub斬獲8k星，評測大量出爐

#但整體上LLaMA和ChatGPT都沒什麼幽默感。

不過兩者應對聽不懂的笑話的策略不同，ChatGPT會產生「一堵文本牆」，希望其中至少有一些語句是正確答案，這種行為就像是不知道答案的學生，希望老師能從他們的一通亂說裡找出答案。

零樣本歸類

#這是一種很實用的功能，使得人們可以用LLM取代評分員來產生訓練集，然後在這些訓練集上訓練較小的可服務的模型。

一個更有挑戰性的任務是點擊廣告分類，由於連人類都不能就什麼是點擊廣告達成一致，在提示中會向模型提供一些例子，所以事實上這是一個少樣本而非零樣本歸類。下面是LLaMA的提示。

測試中只有LLaMA-33B會設法遵循所要求格式給出答案，而且其預測是合理的，ChatGPT表現次之，能給出比較合理的答案，但時常不依照規定的格式回答，較小的7B、13B模型則不太適合完成這項任務。

LLaMA模型慘遭洩漏，Meta版ChatGPT被迫「開源」！ GitHub斬獲8k星，評測大量出爐

程式碼產生

雖然法LLM在人文方面表現出色，但不擅長STEM科目，那麼LLaMA在這方面的表現如何呢？

在提示中，給出搜尋表的形式和希望達到的目的，要求模型給予提供SQL查詢語句。

ChatGPT在這項任務中表現較好一點，但語言模型給出的結果整體都不太可靠。

LLaMA模型慘遭洩漏，Meta版ChatGPT被迫「開源」！ GitHub斬獲8k星，評測大量出爐

#在與ChatGPT對比進行的各項測試中，LLaMA並沒有如想像中一樣大獲全勝。當然如果其間差距只是由RLHF（具有人類回饋的強化學習）造成的，那麼小型模型的未來可能會更光明。

#

以上是LLaMA模型慘遭洩漏，Meta版ChatGPT被迫「開源」！ GitHub斬獲8k星，評測大量出爐的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

申次元

來源：51cto.com

上一篇：移除ImageNet標籤錯誤，模型排名發生大幅變化下一篇：使用視覺化工具和統計方法檢測異常值

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

什麼是 NullPointerException，如何修復它？

2024-10-22 09:46:29
從新手到程式設計師：您的旅程從 C 基礎知識開始

2024-10-13 13:53:41
使用 PHP 解鎖 Web 開發：初學者指南

2024-10-12 12:15:51
揭秘 C：為新程式設計師提供一條清晰簡單的道路

2024-10-11 22:47:31
釋放您的編碼潛力：絕對初學者的 C 編程

2024-10-11 19:36:51
釋放你內心的程式設計師：C 絕對初學者

2024-10-11 15:50:41
使用 C 自動化您的生活：適合初學者的腳本和工具

2024-10-11 15:07:41
PHP 變得簡單：Web 開發的第一步

2024-10-11 14:21:21
使用 Python 建立任何東西：釋放創造力的初學者指南

2024-10-11 12:59:11
編碼的關鍵：為初學者釋放 Python 的力量

2024-10-11 12:17:31

最新問題

Unit測試OverflowException：達到最大重試次數10000次，仍未找到唯一值因此，在實現新功能之前，我正在進行一些單元測試。我執行測試，但失敗並出現OverflowException：最大重試次數達到10000次，但找不到唯一值這是我正在執行的測試。 pu...

來自於 2024-04-06 11:27:39

0

2

347

新增到MySQL中的json 如何在mySQL中為json變數新增元素由此：值=['123']做這個：值=['123','456']

來自於 2024-04-04 19:17:30

0

1

352

重寫的標題：在改變大小的情況下，水平和垂直居中一個固定的HTML方形或圓形元素如何使尺寸變化的方形或圓形固定html元素水平和垂直居中？我認為寬度和高度必須保持相等這一事實帶來了困難。

來自於 2024-04-04 12:31:51

0

1

322

如何使文字在點擊時變成新元素（如分隔線）？我正在嘗試找到一種方法，使頁面上的某些文字在單擊時變成分隔符號/新元素。我不知道如何解釋它，但是就像，想像一個下面帶有標題的圖像-單擊標題，然後上面的圖像變得像一個文本框/不同的圖...

來自於 2024-04-04 11:21:03

0

1

3580

移除深層物體時遇到問題我的Vue元件使用物件內部有一個物件來顯示元素。當我單擊頁面上的按鈕時，我想刪除其中一個嵌套物件。它似乎被刪除，當我在刪除元素後立即執行console.log(this.query...

來自於 2024-04-03 21:48:14

0

1

302

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1421519
php入門教程之一週學會PHP

4265603
JAVA 初級入門影片教學

2517270
小甲魚零基礎入門學習Python影片教學

506310
PHP 零基礎入門教學

861495

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板