訊飛星火V3.5正式發布，基於全國產算力平台「飛星一號」訓練-人工智慧-PHP中文網

訊飛星火V3.5正式發布，基於全國產算力平台「飛星一號」訓練

WBOY

發布： 2024-04-10 14:49:01

轉載

1022 人瀏覽過

科大訊飛將在1月30日舉行星火認知大模型V3.5升級發表會。科大訊飛董事長劉慶峰、研究院院長劉聰正式發表以首個全國產算力訓練為基礎的訊飛星火V3.5。

科大訊飛宣佈於2023年10月24日，發布首個支撐萬億參數大模型訓練的萬卡國產計算力平台“飛星一號”，正式啟用。啟用後的90多天裡，訊飛星火基於“飛星一號”，啟動了對標GPT-4的更大參數規模的大模型訓練，帶來了1月30日這場訊飛星火V3. 5升級發布。

基於全民開放大模型訓練的全民開放大模型火V3.5在語言理解、文本生成、知識問答、邏輯推理、數學能力、代碼能力和多模態能力七個方面取得了全面升級。其中語言理解、數學能力超過GPT-4 Turbo，程式碼達到GPT-4 Turbo 96%，多模態理解達到GPT-4V 91%。

目前，訊飛星火已賦能保險、銀行、能源、汽車、通訊等領域聯合龍頭企業，透過與太平洋保險合作，透過星火太平洋保險合作，透過星火太平洋計畫賦能內部知識服務、辦公室、審計、展業等，打造數位勞動力在保險領域的應用標竿；聯合交通銀行，賦能客服、展業、辦公、研發等，重點打造銀行領域的代碼能力應用標竿；與國家能源集團聯合，賦能煤炭、電力、運輸、化工等方面，打造央企集團一體化連動的大模型應用標竿；與國家能源集團聯合，賦能煤炭、電力、運輸、化工等方面，打造央企集團一體化連動的大模型應用標竿。

除此之外，深度適配國產算力的「訊飛星火開源大模型」首次發布，場景應用效果領先，昇思開源社群聯合首發上線。

訊飛星火V3.5正式發布，基於全國產算力平台「飛星一號」訓練

這次開源擁有1.3億參數（13B），包含基礎模型iFlytekSpark-13B-base、精調模型iFlytekSpark-13B-chat，開源了微調工具iFlytekSpark- 13B-Lora、人設定製工具iFlytekSpark-13B-Charater。學術企業研究可基於全端自主可控的星火優化套件，更方便地訓練自己的專用大模型。

劉慶峰透露，星火開源大模型在技術上形成了差異化優勢。星火開源-13B在多項知名公開評測任務中名列前茅，在文本生成、語言理解、文本改寫、行業問答、機器翻譯等企業典型場景中，透過對學習輔助、語言理解等領域的深入研究和優化，實現了效能大幅提升，在處理複雜的自然語言任務時更加得心應手。

基於「飛星一號」訓練，星火開源大模型全端國產適配優化，簡單易用，場景應用效果領先，訓練策略針對昇騰算力極致優化，訓練效率達A100的90%。這不僅是昇騰AI硬體的進一步深度優化，也展示了國產算力在追趕國際先進水平方面的決心和能力。

開源只有更多的場景落地，才能更好地增進生態合作。目前，華為昇思開源社群已正式上架星火大模型開源版-13B，面對學術、企業研究完全免費，增進學術合作的同時，增進產業探索。

展望2024年訊飛星火大模型發展，劉慶峰指出三點：「首先，一定要在通用大模型的底層能力上持續對標國際最先進水平，從演算法研究包括更小的算力上做出相對更優效果。」我們要清醒理智看到差距，目前在小樣本快速訓練、多模態深度學習訓練、超複雜深度理解等領域距離GPT-4的最好水準還有差距，訊飛星火有信心在今年上半年趕上GPT-4目前最佳水準。「今天的通用大模型不一定代表人工智慧的全部未來，還有很多創新要做，如腦科學互動、對抗網路的深度連結等需要整個創新的生態，但我們一定要有勇氣、有期許走在最前面。」劉慶峰指出。

「第二，2024年要真正讓大模型量質齊飛，不僅是產業應用，還要在許多關鍵技術創新上聯動大模型，中國企業界、科學界有信心實現超越。」

「第三，高樓大廈要建立在安全可控的平台之上，我們要實現自主可控平台上的生態繁榮。」劉慶峰表示，自己有信心，能夠實現從演算法、數據、應用場景到算力，建構一個完全自主可控的繁榮的人工智慧生態。

以上是訊飛星火V3.5正式發布，基於全國產算力平台「飛星一號」訓練的詳細內容。更多資訊請關注PHP中文網其他相關文章！