Récemment, SuperCLUE a publié le classement général et la liste des tâches de chaque catégorie pour septembre. SenseChat 3.0 de SenseTime s'est classé premier dans la liste globale des grands modèles chinois. Dans la sous-liste AI Agent nouvellement ajoutée, SenseChat 3.0 s'est également classé premier, surpassant tous les grands modèles chinois ainsi que GPT-3.5 et Claude 2, et juste derrière les performances de GPT-4. Cela démontre les avantages de SenseTime en matière de développement innovant et de libération de productivité dans le domaine des grands modèles, ainsi que son accumulation et son potentiel dans l'exploration de l'AGI
Remarque : Les modèles représentatifs étrangers (GPT4.0/Claude2/gpt-3.5) ne participent pas au classement.
SuperCLUE est un référentiel d'évaluation complet pour les grands modèles chinois. Il vise à évaluer de manière exhaustive les performances des grands modèles dans diverses dimensions de capacités. Il s'agit de l'un des référentiels d'évaluation des grands modèles chinois les plus professionnels et les plus représentatifs en Chine. Cette évaluation a sélectionné les 20 modèles linguistiques généraux les plus représentatifs en Allemagne et à l'étranger
Classé premier dans la liste globale des discussions, avec un score objectif supérieur à GPT-3.5
Le dernier classement général SuperCLUE et la liste de tâches de chaque catégorie se concentrent principalement sur les quatre quadrants de capacités des grands modèles, à savoir la compréhension et la génération du langage, y compris la compréhension et l'extraction du langage, l'appariement de contexte, la génération et la création, les compétences et connaissances professionnelles, y compris ; connaissances et encyclopédie, calcul, code, logique et raisonnement ; intelligence des agents, y compris l'utilisation des outils, planification des tâches, y compris la sécurité du système, attaque par commande, un total de 12 capacités de base
SenseChat 3.0 de SenseTime s'est classé premier au classement général avec un score total de 62,75. Dans la section des questions objectives OPT, SenseChat 3.0 a même dépassé GPT-3.5, démontrant sa forte capacité dans les grands modèles chinois.
SenseTime a expliqué que SenseChat serait officiellement lancé en avril 2023. Il s'agit de l'un des premiers grands modèles de langage basé sur des centaines de milliards de paramètres en Chine et est continuellement mis à jour de manière itérative. Il s'appuie sur SenseCore, un dispositif d'IA à grande échelle de SenseTime. Actuellement, il existe environ 30 000 GPU en ligne et la puissance de calcul a été augmentée à 6 ExaFLOPS, prenant en charge efficacement la formation, les itérations de mise à niveau et les services de grands modèles de langage.
Accélérer le développement des agents d'intelligence artificielle et accélérer la transition vers une intelligence artificielle forte
Avec le développement des grands modèles, le « chat » est loin de répondre aux exigences des gens. La capacité d'utiliser les outils avec précision est devenue la clé pour libérer la productivité des grands modèles. La nouvelle sous-liste d'agents IA de SuperCLUE est la première liste d'agents IA du secteur. Elle se concentre sur l'évaluation des performances des agents IA dans deux capacités clés : « l'utilisation des outils » et la « planification des tâches ». Les évaluations montrent que SenseTime considère que SenseChat 3.0 a le potentiel de servir de super assistant humain. Il peut effectuer des tâches de manière autonome en fonction des besoins humains, libérant ainsi pleinement la productivité des grands modèles, ce qui le place juste derrière GPT-4 en matière d'IA. Liste des agents, et en avance sur les autres. Participez à l’évaluation des grands modèles.
Actuellement, les principaux agents d'IA au monde sont presque tous pilotés par le grand modèle leader GPT-4. Grâce à de puissantes capacités d'utilisation d'outils, ils peuvent décomposer des problèmes complexes en sous-tâches réalisables et en interactions en langage naturel de type humain. capacités. SenseChat 3.0 est présenté comme l'un des principaux modèles chinois à grande échelle. Il utilise trois outils courants : un interpréteur de code, un appel et une recherche d'API pour résoudre des tâches complexes, créer de manière flexible des applications d'agents d'IA et soutenir l'innovation en matière de productivité d'entreprise.
Actuellement, SenseTime a établi des relations de coopération étroites avec plus de 500 clients dans plusieurs secteurs verticaux tels que la finance, la téléphonie mobile, les soins médicaux, l'automobile, l'immobilier, l'énergie, les médias et la fabrication industrielle. En tant que modèle puissant à grande échelle, SenseChat continue de s'améliorer rapidement, offrant à SenseTime l'opportunité de développer des agents d'intelligence artificielle plus puissants qui peuvent interagir comme les humains, et d'explorer la voie vers une base et un support importants pour l'intelligence artificielle générale
.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!