亞馬遜正全力捍衛其在雲端運算領域的領先地位。他們一方面升級自家的雲端晶片,並推出了亞馬遜版的GPT——人工智慧聊天機器人;另一方面,他們也加深了與英偉達的合作,推出了基於英偉達晶片的新服務,並與英偉達共同研發超級電腦
AWS的副總裁Dave Brown表示,透過將自研晶片的設計重點放在對客戶重要的實際工作負載上,AWS能為他們提供最先進的雲端基礎設施。這次推出的Graviton4是五年內的第四代晶片產品,隨著人們對生成式AI 興趣的高漲,第二代AI晶片Trainium2 將幫助客戶以更低的成本和更高的能效更快地訓練自己的機器學習模型。
Graviton4運算效能較前代提升多達30%
美東時間11月28日週二,亞馬遜旗下雲端運算業務AWS宣布,推出新一代的AWS自研晶片。其中,通用晶片Graviton4的運算效能較前代Graviton3提高多達30%,核心增加50%,記憶體頻寬提升75%,進而在亞馬遜雲端伺服器託管服務Amazon Elastic Compute Cloud(EC2)上提供最高性價比與能源利用效果。
Graviton4 透過對所有高速實體硬體介面進行全面加密來提高安全性。 AWS 表示,Graviton4 將應用於記憶體最佳化的 Amazon EC2 R8g 實例,以協助客戶改善高效能資料庫、記憶體快取和大數據分析工作負載的執行。 R8g 實例提供更大的實例規格,其 vCPU 數量最多比前代 R7g 實例高三倍,記憶體容量高三倍
未來幾個月內,計畫推出搭載Graitons4的電腦。 AWS表示,自啟動Garviton專案以來的五年內,已經生產了超過200萬個Garviton處理器,並且AWS EC2的前100位用戶都選擇了使用Graviton
Trainium2速度提高了四倍,可以訓練萬億參數等級的模型
AWS推出了一款名為Trainium2的新一代AI晶片,速度比前代Trainium1快四倍。 Trainium2可以在EC2 UltraCluster中部署多達10萬個晶片,使用戶能夠在短時間內訓練具有萬億參數的基礎模型(PM)和大語言模型(LLM)。與前代相比,Trainium2的能源利用率提高了兩倍
Trainium2將用於Amazon EC2 Trn2實例,每個實例包含16個Trainium晶片。 Trn2實例旨在幫助客戶在下一代EC2 UltraCluster中擴展晶片應用數量,最多可達到10萬個Trainium2晶片,並透過AWS彈性佈線適配器(EFA)的PB級網路連接,提供高達65艾克赫的運算能力
根據AWS的說法,Trainium2將於明年開始用於支持新的服務
首家大客戶DGX雲端採用了升級版的Grace Hopper GH200 NVL32,這款GPU驅動AI超級電腦速度最快
在年度大會re:Invent期間,AWS週二與英偉達宣布擴大策略合作,提供最先進的基礎設施、軟體和服務,以促進客戶的生成式AI創新。這項合作不僅涉及自研晶片,還包括其他領域的合作
AWS將成為第一家在雲端採用全新多節點NVLink技術英偉達H200 Grace Hopper超級晶片的雲端服務供應商,也就是說,AWS將成為升級版Grace Hopper的首個重要客戶
英偉達的H200 NVL32 多節點平台將 32 個 Grace Hopper晶片與 NVLink 和 NVSwitch 技術共同用於一個實例。該平台將用於與亞馬遜網路EFA連接的Amazon EC2實例,並由高級虛擬化(AWS Nitro System) 和超大規模集群(Amazon EC2 UltraClusters) 提供支持,使亞馬遜和英偉達共同的客戶能夠擴展部署數以千計計的H200晶片
英偉達和AWS將合作在AWS上託管英偉達的AI訓練即服務DGX Cloud。這將是第一個採用GH200 NVL32的DGX雲,為開發人員提供具有最大共享記憶體的單一實例。 AWS的DGX雲將提升尖端生成式AI和超過1兆參數的大型語言模型的訓練能力
英偉達和AWS正在合作研發一個名為Ceiba的項目,旨在設計世界上速度最快的GPU驅動AI超級電腦。該計算機採用GH200 NVL32和Amazon EFA的互連技術,是一個規模龐大的系統。它搭載了1.6384萬塊GH200超級晶片,具有65 exaflops的AI處理能力。英偉達計劃利用它推動下一波生成式AI創新
企業客戶機器人亞馬遜Q預覽版已經上線,能夠幫助開發人員在AWS上開發應用程式
AWS除了提供晶片和雲端服務,還發布了一款名為亞馬遜Q的AI聊天機器人預覽版。亞馬遜Q是一種新型的數位助手,採用生成式AI技術,可以根據企業客戶的業務需求工作。它能夠幫助企業客戶搜尋資訊、編寫程式碼和審查業務指標
Q接受了AWS內部有關程式碼和文件的部分培訓,可供AWS雲端的開發者使用。
開發者可以利用Q在AWS上創建應用程式、研究最佳實踐、修正錯誤,並獲得為應用程式編寫新功能的協助。使用者可以透過對話式的問答功能與Q進行交互,學習新知識、研究最佳實踐以及了解如何在AWS上建立應用程序,無需離開AWS控制台
亞馬遜將在企業智慧軟體、呼叫中心工作人員和物流管理的程式中加入Q。 AWS表示,客戶可以根據公司的資料或個人資料對Q進行客製化
對話式問答功能目前在AWS提供的所有企業地區都有預覽版可用
以上是亞馬遜發力捍衛雲端地位,升級自研AI晶片,發表聊天機器人Q,搶先用英偉達新一代超級晶片的詳細內容。更多資訊請關注PHP中文網其他相關文章!