Feng Yao, journaliste de China Fund News
Un peu plus d'un mois après le premier lancement du grand modèle multimodal, iFlytek met à jour sans arrêt son « Spark Cognitive Large Model ».
Le 9 juin, iFlytek a annoncé de nouveaux progrès dans son grand modèle à usage général, en publiant la version V1.5 du « Spark Cognitive Large Model ». Cette version a fait des percées dans les questions et réponses ouvertes, avec plusieurs cycles de dialogue et d'autres mises à niveau. dans les capacités mathématiques. La génération de texte, la compréhension du langage et les capacités de raisonnement logique sont également améliorées. De plus, iFlytek a lancé l'application Spark et l'a équipée du « Spark Cognitive Large Model ».
Lorsque iFlytek a été lancé il y a un mois, il était prévu d'atteindre le niveau de référence des capacités de ChatGPT d'ici le 24 octobre. iFlytek a révélé son intention de lancer une mise à niveau interactive multimodale du « modèle cognitif Spark » le 15 août.
Viser les "trois défauts majeurs" à surmonter
Le 6 mai, iFlytek a annoncé pour la première fois le « Spark Cognitive Large Model ». À cette époque, le président d'iFlytek, Liu Qingfeng, s'était fixé un objectif : s'efforcer de dépasser le GPT en chinois et d'atteindre des niveaux équivalents en anglais d'ici le 24 octobre de cette année. . niveau.
iFlytek a mis à niveau et publié le "Spark Cognitive Model" V1.5 34 jours plus tard. Liu Qingfeng a présenté que cette version a fait des percées dans les questions et réponses ouvertes, et a encore amélioré ses capacités de dialogue et de mathématiques à plusieurs tours, et que ses capacités de génération de texte, de compréhension du langage et de raisonnement logique ont continué de s'améliorer.
Particulièrement dans le domaine des questions et réponses ouvertes dans un large éventail de domaines, la version V1.5 "Spark Cognitive Large Model" cible les "trois défauts majeurs" que la technologie pure des grands modèles doit surmonter : les nouvelles connaissances sont difficiles à mettre à jour , les questions et réponses factuelles sont faciles à « faire semblant », et les faits historiques sont faciles à « inventer des intrigues » dans les livres traditionnels et autres livres.
Dans le même temps, l'avancée des capacités de dialogue à plusieurs tours rend l'expérience de dialogue d'iFlytek Spark plus pertinente pour les personnes réelles. Le dialogue multi-tours est un problème traditionnel avec les grands modèles, ce qui signifie simplement « pas de mémoire ».
Lors de la réunion, iFlytek a également réalisé une démonstration en direct du « Spark Cognitive Large Model ». Lorsqu'on parle de la question « Quelles sont les nouvelles tendances en matière d'intelligence artificielle en Chine ? » "Spark Cognitive Large Model" a mentionné que le 3 juin de cette année, le Sommet numérique industriel de l'Alliance des entrepreneurs du delta du fleuve Yangtze a publié la "Déclaration de l'intelligence artificielle générale du delta du fleuve Yangtze (Hefei)" et le "Système d'évaluation de grand modèle d'intelligence cognitive générale".
En fait, le modèle Spark a été finalisé en mai, et les réponses données par le « Modèle cognitif Spark » incluent déjà les tendances politiques pertinentes en juin, ce qui montre également que le modèle est dans un état de mise à jour et d'apprentissage en temps réel. Il convient de noter que le « Spark Cognitive Large Model » révèle en outre le fossé actuel auquel est confrontée l'intelligence artificielle chinoise.
"Il ne sert à rien de donner la même réponse entre les grands modèles et la recherche, mais de fournir des solutions constructives grâce à des connaissances professionnelles et des capacités de raisonnement", a également déclaré sans détour Liu Cong, doyen de l'institut de recherche iFlytek de HKUST, lors de la réunion. De plus, le « Modèle cognitif Spark » a répondu avec succès aux questions de mathématiques et de chinois de l'examen d'entrée à l'université de cette année lors de la conférence.
Nœud suivant : l'interaction multimodale est à nouveau mise à niveau
iFlytek prévoit d'effectuer trois séries de mises à niveau itératives cette année, dans le but d'atteindre un niveau comparable à ChatGPT le 24 octobre. En plus du 9 juin, la prochaine phase de mise à niveau aura lieu le 15 août, principalement pour améliorer les capacités de codage et les capacités d'interaction multimodale. Des fonctions dans les domaines multimodaux, telles que la synthèse humaine virtuelle et la compréhension d'images et de textes, seront ouvertes aux clients à l'avenir.
Le président d'iFlytek, Liu Qingfeng, a précédemment déclaré que les capacités de codage actuelles d'iFlytek se concentrent sur l'Internet industriel et de nombreuses applications au sein des entreprises. L'objectif futur est de permettre aux grands modèles de générer divers codes sans avoir recours à des programmeurs. Mais Liu Qingfeng a également admis qu'il existe encore un grand écart entre cette fonction du modèle Spark et ChatGPT, et que la fonction clé de la prochaine mise à niveau se situe également dans ce domaine.
Liu Qingfeng a révélé lors de la réunion que dans des domaines plus de pointe, iFlytek explorera également davantage de voies technologiques potentielles en matière d'intelligence artificielle, telles que l'intelligence de jeu, l'intelligence de type cérébral et les modèles de réseaux neuronaux.
En plus de l'amélioration des capacités propres du grand modèle, iFlytek a également publié de nouveaux progrès dans la mise en œuvre commerciale du « Spark Cognitive Large Model » dans les domaines de l'apprentissage, de la médecine, de l'industrie, du bureau et d'autres domaines, y compris le lancement du Spark. APP et l'application Spark Language Partner.
Dans le même temps, iFlytek a ciblé davantage les domaines segmentés et a lancé Spark Cognitive Large Model + Medical Post-diagnosis Management Platform, Spark Cognitive Large Model + Industrial Internet Platform et Spark Cognitive Large Model + iFlytek smart screen produits. Selon les initiés de l'industrie, cette décision vise à promouvoir sa commercialisation dans des domaines subdivisés. Les scénarios qui devraient être les premiers à se concrétiser sont les domaines médicaux, industriels et de bureau mentionnés ci-dessus.
Dans le même temps, en plus de développer des produits d'application de démonstration pour différents scénarios d'application, l'écosystème Spark d'iFlytek, qui cible les développeurs d'IA, les grandes entreprises modèles en amont et en aval et les équipes entrepreneuriales, recrute également simultanément des partenaires écologiques.
En fait, en se référant à l'histoire du développement d'OpenAI, le principe du développement de grands modèles est que le développement, la formation et l'application de petits modèles sont suffisamment matures. Lorsque OpenAI a été fondée, ses produits n'étaient que de petits modèles verticaux dans le domaine. domaine du jeu. Après le développement et la mise en œuvre du petit modèle, le nombre de paramètres a été continuellement augmenté et finalement le grand modèle GPT3 avec 175 milliards de paramètres a été formé.
Les grands modèles nationaux lancent la "Bataille des 100 modèles"
Depuis mars de cette année, de grands modèles domestiques à usage général sont sortis les uns après les autres. Parmi eux, Baidu a été le premier à libérer Wen Xinyiyan, et Alibaba a suivi de près et a officiellement annoncé Tongyi Qianwen. Même des instituts de recherche scientifique tels que l'Université Tsinghua, l'Institut de recherche sur l'intelligence artificielle Zhiyuan de Pékin et le Laboratoire d'intelligence artificielle de Shanghai ont également publié leurs propres universités d'IA. . Résultats du modèle.
Selon les statistiques des rapports de recherche pertinents de Minsheng Securities, au moins 30 grands modèles ont été dévoilés en Chine. Les producteurs comprennent des géants de l'Internet, des sociétés cotées en bourse dans le domaine des concepts d'IA, des sociétés de serveurs de premier plan, des instituts de recherche scientifique et des startups du marché primaire, dont certaines sont des sociétés cotées en bourse. grande. L'échelle des paramètres du modèle est proche, voire dépasse, de l'échelle de ChatGPT (centaines de milliards).
Les données prévisionnelles d’IDC montrent que les dépenses du marché chinois de l’intelligence artificielle atteindront 14,75 milliards de dollars en 2023, soit environ un dixième du total mondial. À long terme, les itérations innovantes de la technologie de l'IA conduisent à la poursuite de la mise en œuvre de scénarios d'application, et les sujets d'actualité représentés par l'AIGC, les humains numériques, la multimodalité, les grands modèles d'IA et la prise de décision intelligente apportent plus d'imagination et de possibilités au marché.
IDC prédit que le marché chinois de l’IA atteindra une taille de 26,44 milliards de dollars américains en 2026 et que le taux de croissance composé (TCAC) sur cinq ans de 2021 à 2026 dépassera 20 %. CITIC Construction Investment estime que la recrudescence nationale de la R&D et de l'application de grands modèles continue de croître et que le développement de grands modèles s'accélère dans tous les domaines. Cependant, la mise en œuvre de l'industrie mondiale des grands modèles en est encore aux premiers stades d'exploration. et il est nécessaire de coopérer avec les sociétés de scénarios en aval pour établir de grands modèles commerciaux.
Editeur : Capitaine
Critique : Xu Wen
Déclaration de droits d'auteur
"China Fund News" détient les droits d'auteur sur le contenu original publié sur cette plateforme. La réimpression sans autorisation est interdite, faute de quoi la responsabilité légale sera engagée.
Tout à l'heure, Fang Xinghai a fait une grande déclaration !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!