Le modèle à grande échelle de Yuncong Technology bat le record mondial du COCO de référence, réduisant considérablement le coût des applications d'IA.-IA-php.cn

Le modèle à grande échelle de Yuncong Technology bat le record mondial du COCO de référence, réduisant considérablement le coût des applications d'IA.

WBOY

Libérer： 2023-10-19 11:41:09

avant

1022 Les gens l'ont consulté

Récemment, le modèle à grande échelle de Yuncong Technology a encore fait des progrès importants dans le domaine de la vision. Le détecteur de cible basé sur le modèle de base de vision à grande échelle a obtenu d'excellents résultats sur le célèbre ensemble de données de référence COCO dans le domaine de la détection de Microsoft. Research (MSR), Shanghai Artificial Intelligence Laboratory et Intelligent Intelligence De nombreuses entreprises et instituts de recherche bien connus tels que le Yuan Artificial Intelligence Research Institute se sont démarqués et ont établi un nouveau record mondial.

云从科技从容大模型在benchmark COCO上刷新世界纪录大幅降低AI应用成本

La précision moyenne (ci-après dénommée mAP, Mean Average Precision) du grand modèle de Yuncong Technology sur l'ensemble de test COCO a atteint 0,662, se classant au premier rang de la liste (voir la figure ci-dessous). Sur l'ensemble de validation, le mAP à échelle unique a atteint 0,656 et le mAP après TTA à plusieurs échelles a atteint 0,662, atteignant tous deux des niveaux de premier plan au monde.

云从科技从容大模型在benchmark COCO上刷新世界纪录大幅降低AI应用成本

Big data combiné à un apprentissage auto-supervisé pour créer une technologie visuelle de base

La pré-formation auto-supervisée Big Data représentée par GPT a fait des percées remarquables dans le domaine de la compréhension du langage naturel (NLP). Dans le domaine visuel, le Big Data combiné à l'apprentissage auto-supervisé a également fait des progrès importants dans la formation de base des modèles.

D'une part, des données visuelles détaillées aident le modèle à apprendre les fonctionnalités de base communes. Le modèle de base à grande échelle de YunCong Vision utilise plus de 2 milliards de données, dont un grand nombre d'ensembles de données non étiquetés et des ensembles de données d'images et de texte multimodaux. La richesse et la diversité des ensembles de données permettent au modèle d'extraire des fonctionnalités robustes, ce qui les réduit considérablement. la complexité des tâches de développement en aval.

D'un autre côté, l'apprentissage auto-supervisé ne nécessite pas d'annotation manuelle, ce qui permet d'entraîner des modèles visuels avec des données massives non étiquetées. Yuncong a apporté de nombreuses améliorations à l'algorithme d'apprentissage auto-supervisé, le rendant plus adapté aux tâches plus fines telles que la détection et la segmentation, comme en témoignent ses bons résultats sur la tâche de détection COCO.

La détection de cible ouverte + la capacité de détection d'apprentissage à temps zéro réduisent considérablement les coûts de R&D

Grâce aux excellentes performances du modèle visuel de base, le grand modèle de Yuncong Rongrong peut être entraîné sur la base de données multimodales d'images et de textes à grande échelle pour prendre en charge la détection par apprentissage zéro (ci-après dénommé zéro tir) de milliers de catégories d’objectifs, couvrant l’énergie, les transports et la fabrication divers objectifs dans d’autres secteurs.

云从科技从容大模型在benchmark COCO上刷新世界纪录大幅降低AI应用成本 Les performances des capacités zéro-shot des grands modèles sur différents ensembles de données

zero-shot peut imiter le processus de raisonnement humain et utiliser les connaissances passées pour raisonner sur la forme spécifique des nouveaux objets dans l'ordinateur, donnant ainsi à l'ordinateur la capacité de reconnaître de nouvelles choses.

Comment comprendre le zéro-shot ? Supposons que nous connaissions les caractéristiques morphologiques des ânes et des chevaux, et que nous sachions également que les tigres et les hyènes sont des animaux rayés, et que les pandas et les pingouins sont des animaux noirs et blancs. Nous définissons les zèbres comme des équidés avec des rayures noires et blanches. Sans regarder aucune photo de zèbres, en nous basant simplement sur des déductions, nous pouvons trouver des zèbres parmi tous les animaux du zoo.

Le grand modèle visuel de base de Yuncong présente de fortes performances de généralisation, réduisant considérablement la dépendance aux données et les coûts de développement requis pour les tâches en aval. Dans le même temps, Zero-shot améliore considérablement l'efficacité de la formation et du développement, rendant possible une large application et un déploiement rapide.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!