(Global TMT, 18 septembre 2023) Les 14 et 15 septembre, le Global AI Chip Summit 2023 (GACS 2023) s'est officiellement tenu à Shenzhen. Wang Xiaoyang, vice-président de Kuexin Technology, a prononcé un discours intitulé « Solution d'interface haute performance pour piloter la construction de puissance de calcul cloud/Edge ». Wang Xiaoyang a partagé la tendance à l'interconnexion des puces déclenchée par la demande de puissance de calcul de l'industrie AIGC, a analysé le goulot d'étranglement des puces en termes de puissance de calcul et a proposé des solutions d'interconnexion de mémoire Kuixin et des solutions de mise en œuvre de Chiplet.
Wang Xiaoyang, vice-président de Kuixin Technology, a prononcé un discours lors de la session d'innovation en architecture de puce GACS 2023
Actuellement, le développement de l'AIGC a favorisé la croissance rapide de la demande de puissance de calcul. Cependant, en raison du retard relatif dans la vitesse de développement de la bande passante mémoire et de la bande passante d'E/S, la formation de grands modèles et l'inférence font face aux murs de mémoire et aux murs d'E/S. . De plus, lorsque de grands modèles seront déployés à des fins d'inférence à l'avenir, la capacité de mémoire et la bande passante seront supérieures à la puissance de calcul et à la technologie de la puce. Pour les tâches gourmandes en accès mémoire telles que l'inférence de grands modèles, l'estimation des besoins en puissance de calcul ne peut pas uniquement prendre en compte la demande de FLOP. Le goulot d'étranglement le plus important est la bande passante mémoire. L'utilisation de la solution d'interconnexion Kuixin M2link peut augmenter la capacité HBM dans le package et augmenter la bande passante mémoire. SOC. La zone de puissance de calcul utile effective.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!