Actuellement, de grands modèles d'intelligence artificielle pré-entraînés mènent une nouvelle vague d'intelligence, poussant l'intelligence artificielle des domaines spécialisés vers des applications générales. Lors de la Conférence mondiale sur l'intelligence artificielle 2023, les grands modèles ont une fois de plus attiré l'attention de l'industrie. Plus de 30 grands modèles nationaux et étrangers ont concouru sur la même scène, et les technologies mondiales de pointe en matière d'intelligence artificielle ont été dévoilées collectivement.
Le 6 juillet, lors du Forum du Sommet de l'industrie de l'intelligence artificielle de Shengteng organisé par l'Alliance stratégique pour l'innovation technologique de l'industrie de l'intelligence artificielle de nouvelle génération (AITISA) et la China Artificial Intelligence Industry Development Alliance (AIIA) et organisé par Huawei, vice-président principal d'iFlytek, Hu Guoping, directeur du National Key Laboratory of Cognitive Intelligence, a annoncé la coopération entre iFlytek et Huawei. iFlytek Spark et Ascend AI ont uni leurs forces pour créer une nouvelle base pour l'intelligence universelle de la Chine. Hu Guoping a déclaré que l'innovation indépendante de la Chine en matière de puissance de calcul est la clé pour réaliser le grand avenir des modèles nationaux à grande échelle.
Hu Guoping a passé en revue l'historique de développement du grand modèle cognitif iFlytek Spark Avec de nombreuses années de réserves technologiques de base, le projet de recherche spécial sur grand modèle d'intelligence cognitive « 1+N » a été lancé le 15 décembre 2022. Actualités le 6 mai 2023. Le grand modèle cognitif Feixinghuo a été officiellement publié, présentant sept fonctionnalités de base telles que la génération de texte, la compréhension du langage, les questions et réponses de connaissances et le raisonnement logique. Il a continué à itérer et a été à nouveau mis à niveau pour publier le grand modèle cognitif Spark V1.5 en juin. 9.
En ce qui concerne le modèle Spark, Hu Guoping a également partagé l'application de grands modèles dans les domaines de l'éducation, du bureau, de l'automobile, de la médecine, de l'industrie et dans d'autres domaines. Basé sur l'étape d'innovation de la technologie de base, le modèle Spark a atteint un score de 0 à 1 dans plusieurs secteurs. scénarios. applications innovantes.
Derrière l’itération accélérée et le rattrapage des grands modèles se cache un défi de puissance de calcul incontournable.
Cependant, le développement actuel de grands modèles dépend fortement des puces, des clusters et des écosystèmes d’IA haut de gamme. Des performances informatiques élevées, une bande passante de communication élevée et une grande mémoire vidéo sont devenues la base de puissance de calcul indispensable pour la formation de grands modèles. Les progrès des puces d'IA uniques n'ont pas suivi la demande de grande puissance de calcul pour les grands modèles, et le clustering de puissance de calcul est devenu. une tendance de développement irréversible.
La clé de la sécurité et du développement des grands modèles de mon pays réside dans le fait de s'appuyer sur du matériel et des logiciels innovants de manière indépendante pour promouvoir des progrès rapides dans l'écosystème des grands modèles. "Hu Guoping a souligné que la coopération entre iFlytek Spark et Ascend AI a permis à l'architecture nationale de modèles à grande échelle de fonctionner ensemble sur la base de logiciels et de matériels innovants de manière indépendante." « D'une part, le grand modèle cognitif iFlytek Spark est basé sur la conception intégrée de la formation et du raisonnement, réalisant des avancées technologiques en matière de parcimonie des grands modèles et de quantification de faible précision. Il peut s'adapter efficacement à Ascend AI et accélérer l'application et l'itération industrielles. d'autre part, avec Shengteng AI comme noyau, les logiciels et le matériel sont optimisés en collaboration pour créer un grand cluster de formation de modèles avec une puissance de calcul concentrée, des performances supérieures, un approvisionnement stable et une sécurité des données.
Selon Hu Guoping, les grands modèles sont similaires à la couche principale du cerveau. Ils sont combinés à travers plus de 100 milliards de neurones, reçoivent une stimulation d'entrée, puis produisent une sortie intelligente. Ils ont des mécanismes de stimulation et de fonctionnement intelligents similaires. "Ce que le cerveau peut faire, les grands modèles peuvent également le réaliser. Cela indique que les grands modèles ont un potentiel illimité. L'intelligence artificielle a traversé quatre vagues. À l'ère des grands modèles avec l'émergence de l'intelligence, il est possible de trouver enfin le bon solution."À l'avenir, avec plus de données, des modèles plus grands, des exigences plus fortes et des tâches plus complexes, les grands modèles continueront de nécessiter une grande puissance de calcul.
"Nous sommes prêts à travailler avec Shengteng AI pour saisir de nouvelles opportunités historiques dans le domaine de l'intelligence artificielle générale et nous efforcer de construire une nouvelle base pour l'intelligence générale dans mon pays", a déclaré Hu Guoping.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!