Moore Thread Kua'e インテリジェントコンピューティングセンターは、10,000 の P レベル浮動小数点コンピューティング機能を備え、カード 10,000 枚の規模に拡張されました-IT業界-php.cn

Moore Thread Kua'e インテリジェントコンピューティングセンターは、10,000 の P レベル浮動小数点コンピューティング機能を備え、カード 10,000 枚の規模に拡張されました

WBOY

リリース： 2024-07-17 05:55:45

オリジナル

386 人が閲覧しました

7 月 3 日のこの Web サイトのニュースによると、Moore Thread は本日、AI の主力製品である KUAE インテリジェントコンピューティングクラスターソリューションが現在のキロカードレベルから 10,000 カード規模に拡張されたと発表しました。 Moore Thread Kua'e Wanka インテリジェントコンピューティングクラスターは、フル機能の GPU をベースとして使用し、Wanka スケールと 10,000 P レベルの浮動小数点コンピューティング機能を搭載できる国内の汎用高速コンピューティングプラットフォームを作成します。複雑なトレーニング用に特別に設計されています。数兆ものパラメータを持つ大規模なモデルと設計。

摩尔线程夸娥智算中心扩展至万卡规模，具备万 P 级浮点运算能力

Kuae Wanka インテリジェントコンピューティングソリューションには、次のコア機能があります:

Wanka WanP: Kuae インテリジェントコンピューティングクラスターは、10,000 枚を超えるカードの単一クラスター規模を実現し、浮動小数点演算能力は 10Exa-Flops に達し、総ビデオメモリに達します。容量、カード間の 1 秒あたりの PB レベルの超高速相互接続帯域幅の合計、および 1 秒あたりの PB レベルの超高速ノード相互接続の合計帯域幅。

長期的で安定したトレーニング: Moore Thread は、Wanka クラスターの平均トラブルフリー実行時間が 15 日を超え、大規模モデルの安定したトレーニングを最大 30 日間達成できることを誇り、週の平均トレーニング効率は 99 以上です。 %と業界平均を大きく上回っています。

高い MFU: Kua'e Wanka クラスターは、大規模モデルの高効率トレーニングを実現するために、システムソフトウェア、フレームワーク、アルゴリズム、およびその他のレベルで一連の最適化が行われています (大規模モデルのトレーニング効率を評価するための一般的な指標)。 ) は最大 60% に達する可能性があります。

環境に優しい: LLM、MoE、マルチモーダル、Mamba などのさまざまなアーキテクチャおよびモードの大規模モデルを高速化できます。 MUSA プログラミング言語に基づいており、CUDA 機能および自動移行ツール Musify と完全に互換性があり、新しいモデルの「Day0」移行を加速します。

当サイトは、ムーアスレッドが3つの万華クラスタープロジェクトを実行することを知りました:

青海ゼロカーボン工業団地万華クラスタープロジェクト
青海高原クアエ万華クラスタープロジェクト
広西チワン族自治区万華クラスタープロジェクト

以上がMoore Thread Kua'e インテリジェントコンピューティングセンターは、10,000 の P レベル浮動小数点コンピューティング機能を備え、カード 10,000 枚の規模に拡張されましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。