社群學習工具庫休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > 在線體驗70億參數的StableLM大語言模型的穩定擴散時刻

在線體驗70億參數的StableLM大語言模型的穩定擴散時刻

王林

發布： 2023-04-23 22:28:10

轉載

1172 人瀏覽過

大語言模型之戰，Stability AI也下場了。

近日， Stability AI宣布推出他們的第一個大語言模型—StableLM。劃重點：它是開源的，在GitHub上已經可用。

模型從3B和7B參數開始，接著會有15B到65B的版本。

並且， Stability AI也發布了用於研究的RLHF微調模型。

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

#專案網址：https://github.com/Stability-AI/StableLM/

雖然OpenAI不open，但開源的社群已經百花齊放了。以前我們有Open Assistant、Dolly 2.0，現在，我們又有StableLM了。

實測體驗

現在，我們可以在Hugging Face上試試StableLM微調聊天模型的demo。

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

具體StableLM能做到什麼程度，一看便知。

例如，當你可以問它如何製作花生醬三明治時，它會給你一個複雜、略顯荒謬的食譜。

或寫一首神經網路與符號人工智慧的史詩級饒舌對決：

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

再或寫一封「吉祥話郵件」（文字生成）：

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

#以及，用C語言計算生命的意義（程式碼產生）：

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

不過，有國外的媒體記者親測了一下StableLM，結果發現：在一本正經地胡說八道這方面，它跟前輩ChatGPT比起來，也是不遑多讓。

例如，如果問它2021年1月6日那天發生了什麼事？它會告訴你：川普的支持者控制了立法機關。

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

如果Stable LM預期的主要用途並不是文字生成，那它可以做什麼？

如果拿這個問題親自問它，它會說出這樣一些套話，「它主要用作系統工程和體系結構中的決策支援系統，也可以用於統計學習、強化學習等領域。」

另外，Stable LM顯然缺乏對某些敏感內容的保護。例如，給它一個著名的「不要讚美希特勒」測試，它的回答也是令人大跌眼鏡。

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

不過，咱們倒是不急著管它叫「有史以來最糟糕的語言模型」，畢竟它是開源的，因此這個黑盒子AI允許任何人窺視盒子內部，查一查到底是哪些潛在原因導致了這個問題。

StableLM

Stability AI官方聲稱：Alpha版本的StableLM有30億和70億個參數，之後還有150億到650億參數的後續版本。

StabilityAI也豪橫地表示，開發者隨便用。只要遵守相關條款，不管是檢查、應用或改編基礎模型，想怎麼來怎麼來。

StableLM功能強大，不光可以產生文字和程式碼，也能為下游應用提供技術基礎。它是一個很好的範例，展示了小型、高效的模型透過適當訓練就可以有足夠高的性能。

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

早年間，Stability AI和非營利研究中心Eleuther AI一起開發過早期的語言模型，可以說，Stability AI累積很深。

像什麼GPT-J、GPT-NeoX和Pythia，這都是兩家公司合作訓練的產物，在The Pile開源資料集上訓練完成。

而後續的更多開源模型，例如Cerebras-GPT和Dolly-2都是上面三兄弟的後續產品。

說回StableLM，它是在建立在The Pile基礎上的新資料集上訓練的，該資料集包含1.5萬億個token，大約是The Pile的3倍。模型的上下文長度為4096個token。

在即將發布的技術報告中，Stability AI會公佈模型的規模和訓練設定。

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

作為概念驗證，團隊用史丹佛大學的Alpaca對模型進行了微調，並使用了最近的五個對話代理的資料集的組合：史丹佛大學的Alpaca、Nomic-AI的gpt4all、RyokoAI的ShareGPT52K資料集、Databricks labs的Dolly和Anthropic的HH。

這些模型將作為StableLM-Tuned-Alpha發布。當然，這些微調過的模式僅用於研究，屬於非商業性質。

後續，Stability AI也會公佈新資料集的更多細節。

其中，新資料集十分豐富，這也是為什麼StableLM的效能很棒。雖說參數規模目前來看還是有點小（和GPT-3 1750億個參數相比是這樣的）。

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

Stability AI表示，語言模型是數位時代的核心，我們希望每個人都能在語言模型中有發言權。

而StableLM的透明性。可訪問性、支持性等特徵也是實踐了這個觀念。

StableLM的透明性：

#體現透明性最好的方式就是開源。開發者可以深入模型內部，驗證效能、辨識風險，並且一同開發一些保護措施。有需要的公司或部門也可以就著自己的需求對此模型進行調整。

StableLM的可存取性：

#每日使用者可以隨時隨地在本機裝置上執行此模型。開發人員可以應用模型來創建並使用硬體相容的獨立應用程式。這樣一來，AI所帶來的經濟利益就不會被某幾個企業瓜分，紅利屬於所有日常用戶和開發者社群。

這是封閉模型所做不到的。

StableLM的支援性：

#Stability AI建立模型支援使用者們，而不是取代。換句話說，開發出來便捷好用的AI是為了幫助人們更有效率地處理工作，提供人們的創造力、生產力。而非試圖開發一個天下無敵的東西取代一切。

Stability AI表示，目前這些模型已經在GitHub公佈，未來還會有完整的技術報告問世。

Stability AI期待和廣泛的開發者和研究人員進行合作。同時，他們也表示將啟動眾包RLHF計劃，開放助理合作，為AI助理創建一個開源的資料集。

開源先驅之一

Stability AI這個名字，對我們來說已經是如雷貫耳了。它正是大名鼎鼎的圖像生成模型Stable Diffusion背後的公司。

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

如今，隨著StableLM的推出，可以說Stability AI在用AI造福所有人的路上越走越遠了。畢竟，開源一向是他們的優良傳統。

在2022年，Stability AI提供了多種方式讓大家使用Stable Diffusion，包括公開demo、軟體測試版和模型的完整下載，開發人員可以隨意使用模型，進行各種整合。

作為一個革命性的圖像模型，Stable Diffusion代表著一個透明、開放和可擴展的專有AI替代方案。

顯然，Stable Diffusion讓大家看到了開源的各種好處，當然也會有一些無法避免的壞處，但這無疑是一個有意義的歷史節點。

（上個月，Meta的開源模型LLaMA的一場「史詩級」洩漏，產生了一系列表現驚豔的ChatGPT「平替」，羊駝家族像宇宙大爆炸一樣噌噌地誕生：Alpaca、Vicuna、Koala、ChatLLaMA 、FreedomGPT、ColossalChat…）

不過，Stability AI也警告說，雖然它使用的資料集應該有幫助於「將基本的語言模型引導至更安全的文本分佈中，但並不是所有的偏見和毒性都可以透過微調來減輕。」

爭議：該不該開源？

這些天，我們見證了開源文字生成模型井噴式的成長，因為大大小小的公司都發現了：在越來越有利可圖的生成式AI領域，出名要趁早。

過去一年裡，Meta、Nvidia和像Hugging Face支持的BigScience計畫這樣的獨立團體，都發布了與GPT-4和Anthropic的Claude這些「私有」API模型的平替。

許多研究者嚴厲地批評了這些跟StableLM類似的開源模型，因為可能會有不法分子別有用心地利用它們，比如創建釣魚郵件，或者協助惡意軟體。

但Stablity AI堅持：開源就是最正確的路。

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

Stability AI強調，「我們把模型開源，是為了提高透明度和培養信任。研究人員可以深入了解這些模型，驗證它們的性能、研究可解釋性技術、識別潛在風險，並協助制定保護措施。」

「對我們模型的開放、細粒度訪問，允許廣大的研究和學術界人士，發展出超越封閉模型的可解釋性和安全性技術。」

Stablity AI的說法確實有道理。就算是GPT-4這樣具有過濾器和人工審核團隊的業界頂尖模型，也無法避免毒性。

並且，開源模型顯然需要更多的努力來調整、修復後端——特別是如果開發人員沒有跟上最新的更新的話。

其實追溯歷史，Stability AI從來沒有迴避過爭議。

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

前一陣，它就處於侵權法律案件的風口浪尖，有人指控它使用網頁抓取的受版權保護的圖像，開發AI繪圖工具，侵犯了數百萬藝術家的權利。

另外，已經有別有用心的人，利用Stability的AI工具，來產生許多名人的深度偽造色情圖片，和充滿暴力的圖片。

儘管Stability AI在博文中，強調了自己的慈善基調，但Stability AI也面臨著商業化的壓力，無論是藝術、動畫、生物醫學，還是生成音頻領域。

真·大语言模型Stable Diffusion时刻？StableLM开源，70亿参数在线体验

Stability AI CEO Emad Mostaque已經暗示了要上市的計劃，Stability AI去年估值超過了10億美元，並且獲得了超過1億美元的創投。不過，根據外媒Semafor報道，Stability AI「正在燒錢，但在賺錢方面進展緩慢。」

以上是在線體驗70億參數的StableLM大語言模型的穩定擴散時刻的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

語言模型

來源：51cto.com

上一篇：曼城推出智慧圍巾，讓球迷情緒可見！下一篇：美國利用人工智慧技術預測烏克蘭武器和彈藥需求

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

創造未來：零基礎的 Java 編程

2024-10-13 13:32:21
你並不孤單：在社群的支持下掌握 Python

2024-10-12 11:58:51
從新手到程式設計師：利用 Python 程式設計的力量

2024-10-11 20:06:51
像程式設計師一樣思考：學習 Java 基礎知識

2024-10-11 18:59:31
Java 變得簡單：程式設計能力的初學者指南

2024-10-11 18:30:51
使用 PHP 建立部落格：一個適合初學者的項目

2024-10-11 15:51:51
講系統語言：學習 C，一次一行

2024-10-11 15:42:10
C 語言的資料結構與演算法：適合初學者的方法

2024-10-11 14:41:20
不流淚編碼：輕鬆學習 C

2024-10-11 14:08:31
使用 Java 進行資料分析：資訊處理初學者指南

2024-10-11 13:42:21

最新問題

MySQL：'從......中選擇文字作為<此處變數或子查詢>” 我有下表，其中包含以下數據：id文本語言1德語文本德語2英文文本英語我想要的是獲得以下格式的結果：german="deutschertext"english=&...

來自於 2024-04-06 19:25:54

0

2

529

推出一款透明瀏覽器，提升Web應用程式與PWA體驗【支援靜態HTML、CSS和JavaScript】【讓使用者在我們的網頁應用程式/PWA中檢視桌面桌布】我是一個初級前端開發者和設計師，目前正在使用socket開發一個網頁應用程式（聊天）。我和我的朋友使用的語言有：Scala，HTML，CSS，JavaScript。我正在處理HTM...

來自於 2024-04-05 13:50:12

0

1

1367

在Laravel中以Bootstrap模式展示AWS PDF文件我已經下載了awsurl，例如https://xxx-xx-dev.s3.ap-south-1.amazonaws.com/std_check/655712202215174539...

來自於 2024-04-04 22:16:18

0

1

1450

按標籤搜尋貼文我需要按標籤顯示貼文。我的解決方案適用於單一標籤，如下所示：路線：Route::get('/posts',[PostController::class,'index'])->...

來自於 2024-04-03 22:38:54

0

1

430

三.JS 3D模型已新增但不可見我正在嘗試將3D模型添加到我的網站。我正在使用三個.js。我盡了一切努力，但無法使3D模型可見。在開發者工具的網路標籤中，我可以看到MTL和OBJ檔案已加載，但頁面只是空白。我嘗試...

來自於 2024-04-03 19:06:13

0

1

264

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1421519
php入門教程之一週學會PHP

4265598
JAVA 初級入門影片教學

2517254
小甲魚零基礎入門學習Python影片教學

506310
PHP 零基礎入門教學

861495

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板