文章專題學習下載問答程式設計字典遊戲最近更新

简体中文(ZH-CN) English(EN) 繁体中文(ZH-TW) 日本語(JA) 한국어(KO) Melayu(MS) Français(FR) Deutsch(DE)

首頁> 科技週邊> IT業界> 主體

摩爾線程'誇娥智算集群 KUAE” 1.2 版本發布：支援 64K 長文本、新增 LLaMA2 全系列大模型等

王林

發布： 2024-08-20 07:32:37

原創

125 人瀏覽過

本站 8 月 19 日訊息，摩爾線程「誇娥智算集群 KUAE」 1.2 版本正式發布。此版本對軟硬體層面的綜合性進行最佳化，支援 64K 長文本、新增 LLaMA2 全系列大模型、百川、雅意、Qwen2、Mixtral（MoE 8x7B）等模型。

摩尔线程“夸娥智算集群 KUAE” 1.2 版本发布：支持 64K 长文本、新增 LLaMA2 全系列大模型等

更新內容：

MFU 提升
- 使用千卡集群訓練千億模型，MFU 提升 10%。
- 稠密模型群集訓練 MFU 最高達 55%。
Flash Attention2 最佳化
- 整合 MUSA SDK 平台最佳化後的 Flash Attention2 技術，提升大模型訓練效率與資源利用率。
64K 長文本支持
- 增強對長文本大模型訓練的支持，優化處理長文本理解和生成任務的能力。
支援混合專家模型 MoE
- All2All 優化，針對 muDNN 算子優化不同形狀下的矩陣運算，支援 MoE 大模型訓練。
斷點續訓
- 提升 Checkpoint 讀寫性能，提升訓練效率。
優化 DeepSpeed
- 適配摩爾線程 GPU 集群的 DeepSpeed 與 Ulysses，強化長文本訓練支援。
- 適配國內外多款大模型。
穩定性提升
- 軟硬體成熟，實現連續無故障訓練 15 天。
- 引入 KUAE Aegis 可靠性功能，加強監控、自動診斷與故障復原能力。
視覺化 / 可觀測
- 引入 PerfSight 效能監控系統，即時顯示訓練過程中的資源消耗與效能資料。
內建模型庫新增大模型
- 新增 LLaMA2 全系列、百川、雅意、Qwen2、Mixtral（MoE 8x7B）等模型。

以上是摩爾線程'誇娥智算集群 KUAE” 1.2 版本發布：支援 64K 長文本、新增 LLaMA2 全系列大模型等的詳細內容。更多資訊請關注PHP中文網其他相關文章！

相關標籤：

摩爾線程誇娥智算集群

來源：ithome.com

上一篇：來電科技創辦人袁冰松被傳失聯，母公司回應“早已離職，與公司無關” 下一篇：網路易雲音樂故障內情：技術降本增效，人手不足排查了半天

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

atas32.dll - 什麼是 atas32.dll？

2024-08-20 09:44:02
Ripple Analyst Warns: Bitcoin Maxis Don’t Want You to Know This- Will XRP Price Explode?

2024-08-20 09:42:13
百度网盘怎么停止同步空间功能百度网盘关闭同步空间功能方法

2024-08-20 09:37:32
TRX Dethrones ADA From Top 10 Crypto Rankings as Tron Network’s Native Token Surges 12%

2024-08-20 09:29:13
Pepe Unchained (PEPU) 和 Mpeppe (MPEPE)：兩種 Memecoin 將使它們的持有者成為下一代加密貨幣百萬富翁

2024-08-20 09:27:13
Bitget上線DOGS幣，零手續費，1BTC獎勵

2024-08-20 09:23:13
網路計算機（ICP）價格分析：突破還是即將崩盤？

2024-08-20 09:21:13
VanEck Exec Remains Confident On Solana ETF Launch, Here’s Why

2024-08-20 09:17:12
Suisse Gold Now Accepts XRP as a Payment Option for Purchasing Gold and Other Precious Metals

2024-08-20 09:15:12
Norway's Sovereign Wealth Fund Expands Indirect Bitcoin Holdings, Marking a Pivotal Moment in Cryptocurrency Adoption

2024-08-20 09:13:12

最新問題

來自於 2023-11-14 23:55:21

如何解決問題：'無法載入資源：net::ERR_CONNECTION_REFUSED http://localhost:8989/route?.....” 我的程式有問題。這是一個關於地理資訊系統的程序，使用了LeatlefJs函式庫，我還使用了letlef路由機功能。問題是系統無法顯示它應該能夠顯示的路線，我不太明白。這是腳本。 f...

來自於 2023-11-12 19:34:27

0

1

244

對 HTML 表格進行排序：逐步指南我根本不是HTML專家。我對微控制器進行編程並開始切線。我建立了一個html文件來顯示微控制器暫存器、暫存器位址和暫存器描述的表格。我創建了一個包含3列和大約120行的表。有些暫存...

來自於 2023-10-31 16:45:43

0

1

223

為什麼有些mysql連接在刪除+插入後選擇mysql資料庫的舊資料？我的python/wsgiWeb應用程式中的會話出現問題。 2個wsgi守護程式中的每個執行緒都有一個不同的、持久的mysqldb連線。有時，在刪除舊會話並建立新會話後，某些連線仍...

來自於 2023-10-30 12:37:20

0

2

229

從 getResult 原則請求建立 PHP 並行處理我想在PHP8/Symfony6環境中執行某種多線程，其工作方式如下：我正在提出一個原則請求，該請求服務於大約一百萬行我想創建多個並行進程來同時處理這些行。我的請求是透過getRe...

來自於 2023-09-14 19:30:46

0

1

199

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1395134
php入門教程之一週學會PHP

4207126
JAVA 初級入門影片教學

2353629
小甲魚零基礎入門學習Python影片教學

493479
PHP 零基礎入門教學

826596

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板

關於我們免責聲明 Sitemap: PHP中文網：公益線上PHP培訓，幫助PHP學習者快速成長！