社群學習工具庫休閒

繁体中文

首頁 > 科技週邊 > 人工智慧 > 國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一

PHPz

發布： 2024-05-07 17:34:01

轉載

633 人瀏覽過

最新國產開源MoE大模型，剛亮相就火了。

DeepSeek-V2效能達GPT-4級別，但開源、可免費商用、API價格僅為GPT-4-Turbo的百分之一。

因此一經發布，立刻引發不小討論。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

透過公佈的效能指標來看，DeepSeek V2的中文綜合能力超越一眾開源模型，同時GPT-4 Turbo、文字快4.0等閉源模型同處第一梯隊。

英文綜合能力也和LLaMA3-70B同處第一梯隊，並且超過了同是MoE的Mixtral 8x22B。

在知識、數學、推理、程式設計等方面也表現出不錯性能。並支援128K上下文。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

這些能力，一般使用者都能直接免費使用。現在內測已開啟，註冊後立刻就能體驗。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

API更是骨折價：每百萬tokens輸入1元、輸出2元（32K上下文）。價格僅為GPT-4-Turbo的近百分之一。

同時在模型架構也進行創新，採用了自研的MLA（Multi-head Latent Attention）和Sparse結構，可大幅減少模型計算量、推理顯存。

網友感嘆：DeepSeek總是給人驚喜！

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

具體效果如何，我們已搶先體驗！

實測一下

目前V2內測版可以體驗通用對話和程式碼助理。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

在通用對話中可以測試大模型的邏輯、知識、生成、數學等能力。

例如可以要求它模仿《甄嬛傳》的文風寫口紅種草文案。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

還可以簡單解釋什麼是量子糾纏。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

數學方面，能回答高數微積分問題，例如：

使用微積分證明自然對數的底e 的無窮級數表示。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

也能規避一些語言邏輯陷阱。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

測試顯示，DeepSeek-V2的知識內容更新到2023年。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

程式碼方面，內測頁面顯示是使用DeepSeek-Coder-33B回答問題。

在產生較簡單程式碼上，實測幾次都沒有出錯。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

也能針對給定的程式碼做出解釋和分析。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

不過測試中也有回答錯誤的情況。

如下邏輯題目，DeepSeek-V2在計算過程中，錯誤將一支蠟燭從兩端同時點燃、燃燒完的時間，計算成了從一端點燃燒完的四分之一。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

帶來哪些升級？

根據官方介紹，DeepSeek-V2以236B總參數、21B激活，大致達到70B~110B Dense的模型能力。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

和先前的DeepSeek 67B相比，它的表現更強，同時訓練成本更低，可節省42.5%訓練成本，減少93.3%的KV緩存，最大吞吐量提高到5.76倍。

官方表示這意味著DeepSeek-V2消耗的顯存（KV Cache）只有同級Dense模型的1/5~1/100，每token成本大幅降低。

專門針對H800規格做了大量通訊優化，實際部署在8卡H800機器上，輸入吞吐量超過每秒10萬tokens，輸出超過每秒5萬tokens。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

在某些基礎Benchmark上，DeepSeek-V2基礎模型表現如下：

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

DeepSeek-V2 採用了創新的架構。

提出MLA（Multi-head Latent Attention）架構，大幅減少運算量與推理顯存。

同時自研了Sparse結構，使其計算量進一步降低。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

有人就表示，這些升級對於資料中心大型運算可能非常有幫助。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

而且在API定價上，DeepSeek-V2幾乎低於市面上所有明星大模型。

國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一圖片

團隊表示，DeepSeek-V2模型和論文也將完全開源。模型權重、技術報告都給。

現在登入DeepSeek API開放平台，註冊即贈送1000萬輸入/500萬輸出Tokens。普通試玩則完全免費。

#

以上是國產開源MoE指標爆炸：GPT-4等級能力，API價格僅百分之一的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

開源指標 moe

來源：51cto.com

上一篇：用於時間序列機率預測的分位數迴歸下一篇：探討歐盟就人工智慧監管達成協議

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

編碼的關鍵：為初學者釋放 C 的力量

2024-10-13 11:44:01
使用 PHP 和 MySQL 將您的網站連接到資料庫

2024-10-13 09:56:31
使用 Python 解決問題：作為初學者，解鎖強大的解決方案

2024-10-11 20:58:41
Python 的力量，簡單：一種適合初學者的程式設計方法

2024-10-11 16:53:11
PHP 與社群媒體：將您的網站與世界融為一體

2024-10-11 11:54:51
使用 PHP 的動態圖像畫廊：在線展示您的作品

2024-10-10 16:21:01
使用 PHP 建立 API 和 Web 服務

2024-10-10 15:18:02
揭秘 Java：為新程式設計師提供一條清晰、簡單的道路

2024-10-10 13:34:01
使用 C 創建遊戲和圖形：有趣且實用的介紹

2024-10-10 13:26:26
王者榮耀程咬金怎麼玩？

2024-10-10 11:38:42

最新問題

頁面突然無法拉動 css 或 bootstrap 所以我正在開發一個頁面，我昨天做了一部分，效果很好，今天我繼續做剩下的部分，一切都很好。當我嘗試將其作為普通html頁面打開時，CSS或BOOTSTRAP不起作用，僅顯示頁面文本，...

來自於 2024-04-06 21:58:04

0

1

800

有沒有辦法強制彈性框中的文字垂直居中，無論我們有什麼其他 CSS 程式碼？我有以下CSS程式碼，它是我正在開發的網站中使用的更大CSS程式碼的一部分：.cards-u{display:flex;flex-wrap:wrap;justify-content...

來自於 2024-04-06 20:41:51

0

1

518

在網路應用程式中顯示版本資訊的最佳實踐是什麼？我正在開發一個網頁應用程式。在網路應用程式中顯示版本資訊的最佳實踐是什麼？我正在使用語義版本控制，並且我已經有了semver，例如1.2.0但我很好奇在哪裡顯示它的最佳方式以及如何...

來自於 2024-04-06 19:13:16

0

2

476

狀態更新在 Android 上的 React-Native 中不起作用我有一些程式碼，其中有成對的圖像，它們都在可滑動的水平圖庫中。現在，當您單擊兩個圖像的上部時，圖像應該關閉切換，所以我所做的是，我將isImage2Active設為狀態，然後只需切...

來自於 2024-04-06 16:54:10

0

1

410

即使清除後，我的文件輸入的值仍然保留正如您在螢幕截圖中看到的那樣。我選擇一個文件，保留彈出視窗而不刷新頁面，然後再次打開它，文件輸入仍然是我選擇的文件。 <inputid="fileuploadban...

來自於 2024-04-06 15:44:52

0

1

384

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1422919
php入門教程之一週學會PHP

4268121
JAVA 初級入門影片教學

2533117
小甲魚零基礎入門學習Python影片教學

507223
PHP 零基礎入門教學

862345

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板