Récemment, les gens dans le domaine de l'IA réfléchissent à une chose : lorsque de grands modèles multimodaux sont mis en œuvre dans l'industrie, quelle devrait être la meilleure approche ? L'ère de l'intelligence artificielle générale arrive. La technologie des grands modèles d'IA est devenue un support important pour la construction d'infrastructures dans l'économie numérique et est également devenue le « moteur » de base de la transformation intelligente des grands modèles d'IA + des applications industrielles. a inauguré des opportunités de développement sans précédent. Lors du CNCC 2023 "Super-intelligent Fusion AI Large Model Application Implementation Development Forum" qui s'est tenu le 28 octobre, Sophon Engine a publié "Yuancheng Xiang Chatimg3.0", démontrant le modèle génératif universel multimodal " Les derniers progrès et exploration de la mise en œuvre de « Yuancheng Xiang Chatimg 3.0 ». Chatimg3.0 Une itération améliorée de la technologie de baseYuanxianxiang Chatimg3.0 est un grand modèle multimodal avec une reconnaissance ultra-fine et moins d'illusion, et prend en charge la compréhension multi-images et le positionnement d'objets , OCR et autres fonctions. Chatimg3.0 équipe les appareils matériels de cerveaux, permettant une communication homme-machine plus naturelle et plus fluide, jetant ainsi une base solide pour les applications industrielles multimodales d'IA à grande échelle. Par rapport à Chatimg2.0, Chatimg3.0 a principalement été amélioré sous deux aspects, dont la première étape de pré-formation (formation multitâche telle que description, détection, OCR, etc.) et la deuxième étape de réglage fin des instructions (ensemble d'instructions de criblage fin manuel de haute qualité). Afin de mieux évaluer les capacités des grands modèles multimodaux, Sophon Engine a construit un nouvel ensemble de tests de dialogue multimodal pour évaluer les capacités du modèle sous cinq aspects : description, raisonnement, détection, questions et réponses, et activité, et a rattrapé GPT-4V en termes de questions-réponses et de capacités commerciales, montrant l'excellent potentiel de développement des grands modèles nationaux.
Voici les performances spécifiques de Chatimg3.0 par rapport à GPT-4V dans le test : Description : Gauche : Chatimg3.0, droite : GPT-4V.
Gauche : Chatimg3.0, droite : GPT-4V. : Détection : c Gauche : Chatimg3.0, droite : GPT-4V. : Questions et réponses : c Gauche : Chatimg3.0, droite : GPT-4V.
Exploration des applications dans des domaines clésActuellement, Sophon Engine a appliqué « Yuancheng Xiang Chatimg3.0 » à des domaines tels que la prévention et le contrôle mondiaux et les inspections par drones. l'intégration d'équipements de détection front-end tels que des drones et des sondes électroniques améliore l'inspection et la sécurité traditionnelles, réalisant l'identification des défauts de l'IA, la détection des anomalies, l'analyse du comportement, la surveillance des clés, l'inspection autonome, la prévision des risques et d'autres fonctions, et favorise l'innovation en ingénierie de l'IA processus .
En tant que première équipe de R&D multimodale à grande échelle en Chine, Sophon Engine possède non seulement des avantages innés en termes de talent et de technologie, mais les investissements providentiels de plusieurs institutions d'investissement bien connues et de leaders de l'industrie informatique ont également rendu cette entreprise « encore plus puissante ». . Avec l'aide collaborative d'entreprises bien connues telles que iSoftStone et ChinaSoft Technology, les systèmes "Sophon Sky Vault" et "Sophon Sky Scanner" développés en intégrant "Yuancheng Xiang Chatimg 3.0" ont été obtenus dès qu'ils ont été lancés Avec l'attention de l'industrie, les produits ont été rapidement appliqués à la gouvernance urbaine, à l'énergie intelligente, à l'inspection des pipelines, à la gestion des parcs, à l'agriculture, à la finance et à d'autres scénarios d'application industrielle, et le déploiement pilote a progressivement commencé.
À l'avenir, afin d'accélérer la mise en œuvre d'applications industrielles à grande échelle et de promouvoir le développement durable de l'économie numérique, Sophon Engine continuera de renforcer la formation des modèles et la mise à niveau des capacités, de rassembler les meilleurs talents et ressources avantageuses de l'industrie. , et n'épargne aucun effort pour aider les grands modèles dans la modernisation industrielle. Le modèle de base « Yuancheng Xiang Chatimg » continuera à faire des efforts dans les agents d'IA, l'intelligence incarnée et d'autres directions à l'avenir, et attirera davantage l'attention de l'industrie. Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!