一、摩爾線程簡史:光速創業 全線出擊
如今,我們已經有了較為成熟的自主CPU處理器、NAND快閃記憶體、DRAM記憶體、OS作業系統,而作為運算平台中非常關鍵的一環,GPU顯示卡,卻一直存在著嚴重的缺失,主要是它不但在硬體設計上難度極高,生態培育更是難上加難,非一朝一夕之功。
國內做GPU的企業其實並不少,但很多都是僅限特定行業領域,或者面向高性能計算,真正敢於全面佈局,敢於進軍消費者市場的,就不能不提到摩爾線程(MooreThread )。
5月31日,摩爾線向快科技發出2023年夏季發布會的邀請,原本以為這次的核心就是新一代遊戲與伺服器顯示卡,結果發現我們的格局實在是太小了,摩爾線程的佈局遠不止於此。
從娛樂與創作到AI與雲端運算,從國產化數位辦公室到元宇宙,摩爾線程一口氣帶來了全新遊戲顯示卡與整機、DX11驅動、實體引擎、雲端桌面方案與一體機器、開發工具、程式碼移植工具、AI內容創作、元宇宙與數位人等諸多方面的突破性進展,掀開了國產化GPU及生態全新的一頁。
摩爾線程這個名字相信大家都不陌生了,這裡再簡單介紹一下它的歷史。
摩爾線程成立於2020年10月,到今天也才不過兩歲半多點,但成績斐然。
摩爾線程的創辦人是原NVIDIA全球副總裁、中國區總經理張建中先生,他於2005年加入NVIDIA,帶領團隊開拓了NVIDIA GPU在中國完整的生態體系,推動中國成為NVIDIA全球最重要的市場,沒有之一。
摩爾線程的核心創建團隊基本上都來自NVIDIA,擁有完整的高階晶片人才團隊,全面涵蓋GPU晶片IP研發、系統軟硬體設計、生態建設和行銷等。
2022年,摩爾線程推出了GPU統一系統架構MUSA,發布並量產「蘇堤」和「春曉」兩顆全功能GPU晶片,這也是國內採用現代GPU架構,唯一內建圖形渲染、視訊編解碼、AI運算加速、實體模擬、科學計算四大引擎的全功能高階GPU晶片。
產品方面,摩爾線程也迅速完成了全線佈局,速度之快、範圍之廣如同開掛一般。
硬體方麵包括數位辦公室的桌上型顯示卡MTT S10/S30/S50、第一款國產遊戲顯示卡MTT S80、針對資料中心的全功能MTT S2000/S3000。
軟體方面則有首個元宇宙運算平台MTVERSE、自研GPU實體引擎AlphaCore、數位人解決方案DIGITALME、AIGC內容產生平台摩筆馬良,等等。
MTT S30整機
MTT S3000伺服器八卡並行
生態方面,摩爾線程已與200多家夥伴達成策略合作,尤其是在整機、闆卡的國產化數位辦公室方面,實現了高品質交付。
PES完美體驗系統聯盟夥伴數量也不斷成長,涵蓋國內外主流CPU廠商、作業系統廠商、OEM廠商、軟體服務廠商、雲端服務廠商、系統軟體開發商。
二、MTT S70、DX11和整機:軟硬兼施 真正可玩
這次發表會,相信大家最關心的就是新發布的第二款遊戲顯示卡MTT S70,不過在介紹它之前,我們先簡單回顧一下第一個勇敢殺入遊戲市場的MTT S80。
MTT S80基於代號「春堤」的GPU晶片,整合200億個晶體管,配備4096個MUSA架構核心、128個Tensor張量核心,並內建MUSA智慧多媒體引擎2.0(H.264/H.265 /AV1編解碼器)、MUSA安全引擎1.0、MUSA多位虛擬化引擎(SR-IOV)。
核心頻率1.8GHz,FP32浮點算力達到14.4TFOPS(每秒14.4兆次),INT8整數算力達到57.6TOPS(每秒57.6兆次)。
本裝置採用了16GB GDDR6高容量顯存,具備256-bit位元寬,其等效頻率為14GHz,頻寬高達448GB/s。
系統介面首發也是迄今唯一採用PCIe 5.0 x16,顯示輸出支援DP 1.2a、HDMI 2.1、8K30,也是國內首款支援Windows環境、DirectX圖形介面的顯示卡產品。
MTT S70可以視為MTT S80的小弟,整體造型基本上不變,還是精緻、硬朗的三風扇散熱器,規格上則做了一些精簡。
核心數量減少到3584個,核心頻率降至1.6GHz,FP32浮點算力來到11.2TFLOPS,系統介面改為PCIe 4.0 x16,支援四路8K30超高清顯示輸出。
但比較奇特的是顯存,容量設定為前無古人的7GB,位寬對應224-bit,等效頻率還是14GHz,頻寬則是392GB/s。
摩爾線程副總裁、產品事業部總經理董龍飛表示,摩爾線程做高端卡的一個理念就是真材實料,S80就提供了16GB大容量顯存,非常適合高解析度遊戲、AI等場景,但成本也就高了,因此又做了更有性價比的S70 7GB。
目前,MTT S70 7GB已經上市,售價2,499元。
相較於硬體方面的迭代,驅動、遊戲等軟體方面的進步更令人欣喜。
MTT S80發布近半年的時間裡,Windows驅動已完成了5次升級,完善支持的遊戲數量超過60款(當然更多遊戲可以玩只是未經完全適配),在網吧里最受歡迎的50款遊戲已經適配了20多款。
遊戲性能自發售以來已經平均提升約50%,尤其是《英雄聯盟》、《穿越火線》、《DOTA2》等主流網遊的表現更上一層,《NBA2K Online2》的性能甚至已經達到了早期的大約2.5倍。
同時,50多款主機板、30多款顯示器都得到了很好的支援。
在此基礎上,摩爾線程對於DX11的支持,更令我們興奮。
不同於Intel顯卡優先適配DX12,然後向下推進DX11、DX 9的做法,服務中國市場與中國玩家的摩爾線程,選擇了從用戶基礎最為廣泛的DX9入手,滿足更多玩家的迫切需求。
目前,摩爾線程顯示卡雖然還不能確保所有DX9遊戲都跑的很好,原因也是多方面的,包括遊戲開發非標準化、遊戲優化面向其他廠商顯示卡、國外遊戲與國內硬體匹配不足等等,但是已經完成了100%支持DX9。
眼下,摩爾線程已經開始向DX11全面衝刺,成為第一家真正支援DX11遊戲的中國GPU公司。
依照規劃,摩爾線程將於6月下旬發布DX11社群版驅動,首批支援《原神》和《DOTA2》等3A遊戲。
同時,摩爾線程在“摩卡玩家”社群中啟動“Alpha行動”,召集更多玩家對DX11社群版驅動的使用和回饋,加速驅動的迭代速度。
根據摩爾線程MTT S80、S70顯示卡產品經理馬鑑透露,DX11驅動目前的進度在80%左右,摩爾線程會加快步驟進行開放正式版的下載。
對於光線追蹤、類別DLSS超分技術,摩爾線程也已經在佈局之中。
考慮到MTT S系列遊戲顯示卡畢竟是新鮮事物,軟硬體相容性還在起步階段,為了方便用戶更穩定地使用它們、盡可能發揮最大潛力,摩爾線程這次還特意發布了整機產品「智娛魔術方塊」。
智娛魔方在高顏值的外觀之內,可以選配MTT S80/S70兩款顯示卡,同時預裝精選的遊戲中心,確保開機就能玩。
同時,它也內建了PES系統管理中心,方便即時監控系統狀態;連結雲端應用程式,可以隨時體驗最新進展。
摩爾執行緒也將為使用者開放Ubuntu驅動下載,支援AI運算領域的學習與應用開發。
在發表會現場,我們也上手體驗了以MTT S70顯示卡為基礎的智娛魔方整機。
精緻小巧的整體設計讓人感覺眼前一亮,首批適配的DX11遊戲都相當絲滑,畫質、幀率都完全可以滿足主流玩家的需求,同時在開發、計算方面也可圈可點。
三、摩筆馬良:AI至上 更懂中文
AI,無疑是當下最為熱門的話題,而要想實現良好的AI應用,從硬體算力到創作平台都不可或缺。
摩爾線程從一開始就將AIGC視為核心發展方向,現正式推出軟硬體一體化的AIGC內容創作平台“摩筆馬良”,為用戶提供零成本的AI創作平台。
摩筆馬良運用了產業前沿的多模態預訓練大模型/生成擴散模型。
首先,多模態預訓練模型透過海量圖文資料進行比較學習訓練,掌握到圖片與文字之間的關聯,並建構圖像與文字編碼器。
在生成過程中,編碼器會先將輸入文字隱式編碼,結合圖片、語意、影像遮罩等其他的條件輸入,由生成模型及解碼器最終產生影像。
它支援中英雙語文字描述,可以一次產生多張圖片;
支援圖片生圖,透過邊緣偵測、骨骼偵測、深度偵測等使得圖片更精準;
支持多種模型、多種風格、多位藝術家,包括通用、人像、2.5D、二次元等;
支援敏感內容過濾,提供更安全的創作環境;
支援諸多個性化功能,如簡筆畫生成、相似生成、局部替換、邊緣擴展、高清超分等等,可以將作品以畫廊的方式發布、分享。
特別值得一提的是,摩筆馬良對中文、中國文化有著更準確、更深入的理解,便於進行中文運筆意境創作。
摩筆馬良AIGC平台已經上線內測,提供多種存取方式,可以透過Web和小程式登錄,也可以透過豐富的API供使用者遠端呼叫。
對於需要完整解決方案的用戶,摩爾線程也提供了私有化部署能力,包括GPU集群、異構算力調度平台、API接口,以及類似於摩筆馬良的樣板應用。
摩爾線程元宇宙戰略的重點不只是AIGC,而是提供一種圍繞人、場景和內容提供元計算算力的方式。雖然說元宇宙概念的熱度沒有以往那麼高,但在摩爾線程看來,元宇宙並沒有褪去,而是需要更優秀的運算平台、更合理的應用場景來推動,是一項長期工程。
為此,摩爾線程升級了MTVERSE元宇宙平台,現已支援支援雲端即時渲染。
MTVERSE是一個提供可擴展效能、即時渲染與模擬、AI驅動的多元化算力支援的元宇宙平台。
領先的第三方IDC服務商世紀互聯,已經在雲端率先部署摩爾線程千卡級別的GPU算力集群,並將MTVERSE平台與虛幻引擎、雲端渲染流化技術結合,為51WORLD旗下的51Meet元宇宙高精度開放平台提供運算加速。
這是首個實現國產化閉環的元宇宙應用,在多人並發下,用戶可以享受低延遲、高保真、沉浸式的元宇宙體驗。
此外,咪咕元宇宙、智匯雲舟視訊孿生、瞰景三維重建等元宇宙應用也都在陸續更新。
此外,摩爾線程還升級了DIGITALME數位人解決方案,可用於直播、社交、影視動畫、辦公室、娛樂等場景。
DIGITALME方案包括「女媧」數位人產生器、「畫皮」表情驅動引擎、「隨影」動作驅動引擎、「隨答」對話系統四大部分。
其中,「隨答」升級了兩大主體能力,一是透過語音與人自然交互,實現“能聽能說”,二是基於大語言模型的智能問答,實現“會思考且言之有物」。
發表會中,摩爾線程展示了兩個數位人產品方案-2D播報數位人和3D互動數位人。
有趣的是,這次發布會的線上部分,就是由數位人版的張建中主持的,很多人表示直到看完發布會都沒發現其中端倪。
四、雲端桌面與數位辦公室:全新升級 降本增效
今年年初,摩爾線程推出了基於多功能伺服器GPU MT S2000的雲端桌面產品與解決方案,包括vPC雲端桌面虛擬化GPU產品MT vGPU 1.0、MT GPU直通、MT GPU加速協定編碼等。
摩爾線程也在中國信通院的領導下,聯合行動雲端、中國電信研究院,共同發布了《新型GPU雲端桌面發展白皮書》,明確定義了雲端桌面場景的體驗標準。
基於這個標準,在影片播放、網頁瀏覽、Office辦公室、教育教學軟體四個主要場景中,基於摩爾線程MTT S2000的單一伺服器,能夠同時支援超過40路的高清用戶並發。
相較於傳統CPU雲端桌面方案,其效能可提升近5倍,整體TCO成本降低60%以上。
本次發表會上,雲端桌面產品MT vGPU升級到了全新的2.1版本,主要變化有四點:
一是新增加支援MTT S3000顯示卡,單卡並發的虛擬機器數量達到28個,效能提升多達40%;
二是新增支援GPU超分技術、SR-IOV虛擬化,其中前者可讓虛擬機器數量翻倍,後者能提供更好的QoS、隔離性和安全性;
三是整體畫質從1080p升級到4K;
四是透過驅動更新,增加支援Windows Server伺服器系統,完全支援H.264、H.265、AV1視訊編解碼,支援更多瀏覽器和更多視訊播放器。
同時,摩爾執行緒也推出了MCCX VDI雲端桌面一體機,是包含伺服器、瘦終端、軟體在內的端對端完整交付方案。
它主要面向教育和辦公領域,還有專門的教改特別版、辦公室體驗增強版。
其中,教改特別版可以有效加速19款教改類軟體,例如Tello Edu、Code Craft等等。
辦公室體驗增強版則針對60餘款辦公室類軟體進行了客製化最佳化,例如Office和WPS辦公室軟體、Adobe Reader PDF閱讀器、視訊會議、WinRAR解壓縮軟體等等。
目前,摩爾線程的雲端桌面方案已經與天翼雲端電腦、行動雲端電腦等10餘家客戶的產品完成適配,並與深信服、新華三資訊、華雲、酷棧科技、庭宇科技完成了產品導入,將在各行各業落地。
同時,摩爾線程的國產化數位辦公室解決方案也已全面升級。
摩爾線程已率先支援OpenGL 4.0、Vulkan 1.3的完整功能,並且100%通過了接口兼容性測試,還支持Tessellation曲面細分等圖形特性,提供更精細的幾何紋理效果。
國產生態繁榮發展的同時,無論是CPU處理器或OS作業系統,都有各種各樣的方案,彼此組合起來有上百種之多,適配的難度和複雜度非常高。
為此,摩爾執行緒支援了DKMS動態核心模組,從而方便快速適配各種CPU OS的版本組合,開發效率可提升數十倍。
目前,摩爾線程的辦公室解決方案已經成功適應了麒麟、openKylin、統信、深度、凝思、中科方德、普華等國產操作系統,並率先與統信UOS、麒麟OS完成全面相容性認證,成為國內首家通過統信UHQL品質認證的GPU企業。
此外,摩爾線程GPU已經加速了近百款國產應用,包括辦公室類、視訊會議類、影音類、瀏覽器類、視訊剪輯類、設計類、GIS類等。
五、開發工具:零成本移植 搞定CUDA
#開發GPU和顯示卡非常難,軟體開發與生態推廣更難上加難,尤其是全球GPU產業已經幾乎被NVIDIA及其CUDA所壟斷,AMD、Intel都難以撼動其地位,更別說在這方面幾乎是一片空白的國產廠商了。
2022年,摩爾線程推出了元運算統一系統架構“MUSA”,頗有點直接對標CUDA的意味,它包括統一的程式設計模型、軟體運作庫、驅動程式框架、指令集架構、晶片架構,可以說從硬體底層到軟體開發,提供了一套完整的解決方案。
圍繞MUSA架構,摩爾線程這次宣布了一系列重要技術更新。
一是軟體工具包MUSA Toolkit 1.0。
它包含MUSA驅動(通用計算/圖形渲染/多媒體/多卡互聯)、運行時庫、C 標準庫、編譯器、AI加速庫、模板庫、演算法庫、通用計算庫、數學庫、通信庫、多媒體庫等等,極為豐富。
可以說,這個軟體工具包為開發者提供了一站式的全套深度服務,可以根據需要從不同角度呼叫摩爾線程GPU的硬體能力,從而充分釋放其運算能力、圖形能力。
二是程式碼移植工具MUSIFY。
它可以快速將現有的CUDA程式遷移至MUSA平台,零成本完成CUDA程式碼自動移植。
自動移植完成後,開發者在短時間內即可完成熱點分析、針對性優化,大幅縮短遷移優化的週期,省時、省力、省事、省心。
在以往,這類移植需要投入數百人天的開發成本,而如今有了MUSIFY,只需短短的幾人天或十幾人天。
在當下GPU生態開發幾乎都圍繞著CUDA進行、專門為其優化的大環境下,能夠做到快速簡單移植,並確保性能發揮,無疑是最為合理的一條破局之路。
三是開源的MT PyTorch AI框架。
基於摩爾線程MUSA,開發者可以重複使用PyTorch開源社群的大量模型算子,降低開發成本,並支持種模型的推理,涵蓋CV、NLP、TTS語音、AIGC、數位人等多個領域,能夠運行ChatGLM、Stable Diffusion、LLaMA等典型的大模型分佈式多卡推理。
利用資料並行、模型並行、ZERO等分散式訓練技術,MT PyTorch可完成簡單基礎模型以及典型Transformer結構的NLP語言模型的訓練。
四是即時流體模擬工具Catalyst FX的全新版本。
它基於摩爾線程自研多平台物理引擎AlphaCore,可以在Houdini中不改變原有工作流程的前提下直接進行流體效果製作,相比原生PyroFX性能提升5 -10倍。
AlphaCore已經對DX11 Compute Shader計算版本進行深度優化,在流體力學模擬方面, MTT S80運行Catalyst FX的效能已經達到市場主流顯示卡的2倍以上。
此外,相較於傳統的Houdini Vellume的製作流程,摩爾線程GPU加速的柔性體模擬工具VeraFiber,能夠將解算效率提升至3-5倍。
目前,Catalyst FX和VeraFiber已經完成了Houdini插件介面的開發,Houdini插件的Beta測試版本將於6月6日開放下載。
應用程式合作方面,Catalyst FX Houdini版外掛程式已與國內著名電影後期特效製作公司MOREVFX完成交付對接,VeraFiber被網易遊戲投資的CG動畫製作團隊DOVFX 數海文化成功運用於遊戲CG片頭中複雜角色的布料和毛髮模擬。
不熄動畫、融創動畫、追光動畫、平塔工作室等,也都是摩爾線程AlphaCore的生態合作夥伴。
為了匯聚開發者力量、擴大生態,摩爾線程也啟動了MUSA社群開發者計畫。
摩爾線程為合作夥伴和開發者提供包括MUSA開發工具、程式設計指南、系列教程、開源框架及模型庫等在內的完整資源。
摩爾線程將與第三方社群合作,推動新演算法模型、運算系統和平台的開發。
六、結語:國產之光 未來可期
#摩爾線程誕生之初,其實很多人並不太看好,畢竟在當前的大環境和產業態勢下,在NVIDIA這樣的國際巨頭幾乎壟斷的情況下,重新開發一款國產自主的GPU,還要做好驅動程式、軟硬體相容性,建立起一整套生態系統,讓各種運算、圖形效能充分釋放,並廣泛地商用落地,幾乎是不可想像的事情。
可以說,某種程度上,做GPU顯示卡,要比做CPU處理器難得多。
但是,短短兩年多的時間,摩爾線程的表現,值得讓更多人了解他們-
#建構統一系統架構,打造現代GPU架構,圖形渲染、加速運算、顯示與編解碼、AI等全覆蓋;
硬體產品覆蓋桌面、工作站、伺服器、雲端等多場景,迅速商用落地,尤其是極度有勇氣地將遊戲顯示卡拿到大眾用戶面前,接受真實的考驗與回饋;
驅動開發快速迭代,遊戲、硬體相容性穩定拓展,效能持續提升,釋放潛力;
開發工具與軟體產品不斷豐富,為開發者和使用者提供全套的解決方案;
生態建設持續擴大,合作夥伴遍及各行各業…
作為GPU產業的新生力量,摩爾線程快速崛起,建構了豐富的產品線,將觸角延伸到圖形、運算、AI等各個層面、各種場景,同時在開發、生態方面不遺餘力地推薦,格局之大更令人驚嘆,破局之快令人驚謐。
其實,在當前的大環境下,摩爾線程無疑選擇了最難的一條路,幾乎從零開始構建全套的方案與生態,注定無比吃力,而一旦取得真正突破,這是真正能自主掌握未來命運的。
步子太大,會不會…?對此,摩爾線程有著清醒、長遠的認識,從創業之初就有了明確的定位和方向。
摩爾線程副總裁、產品事業部總經理董龍飛就直言,作為一家晶片公司,摩爾線程要做的不只是推出幾張卡,而是在充分認識到圖形計算與AI融合的大趨勢下,從晶片底層架構開始構建,並利用軟體層面的加速去把底層架構的功能和潛力充分釋放出來,從而形成一個大的產業。
作為一顆新星,摩爾線程還有很多不足,還有太多地方需要補課,但透過兩年多來的實戰表現,相信大家對它都有了相當的認知和相當的信心,對於其未來也有了更多的期許。
以上是真正的國產顯卡之光!摩爾線程國產GPU、AI與元宇宙多項進展深入解讀的詳細內容。更多資訊請關注PHP中文網其他相關文章!