Kuaishou a open source le système, les modèles et les données des agents !-IA-php.cn

Kuaishou a open source le système, les modèles et les données des agents !

WBOY

Libérer： 2024-01-09 11:25:57

avant

1060 Les gens l'ont consulté

Les modèles de taille 7B peuvent-ils également jouer avec des agents IA ? Récemment, "KwaiAgents" open source de Kuaishou lui pose des questions sur le ski du week-end. Cela vous aidera non seulement à trouver un lieu, mais tiendra également compte de la météo ce jour-là.

Kuaishou a open source le système, les modèles et les données des agents !

Comme nous le savons tous, les grands modèles de langage (LLM) maîtrisent une grande quantité de connaissances grâce au langage de modélisation et possèdent certaines capacités cognitives et de raisonnement. Cependant, même le GPT-4 le plus puissant produit actuellement de faux contenus lorsqu’il est utilisé seul et ne peut pas interagir avec le monde en temps réel. Les agents IA sont un moyen de résoudre ce problème. En stimulant la capacité des grands modèles à planifier des tâches, à réfléchir et à appeler des outils, les grands modèles peuvent utiliser des outils du monde réel pour améliorer la précision du contenu généré et même avoir la capacité de résoudre des problèmes complexes. problèmes. Cette fois, les « KwaiAgents » développés conjointement par Kuaishou et le Harbin Institute of Technology permettent au « petit » grand modèle de 7B/13B de surpasser l'effet du GPT-3.5, et ces systèmes, modèles, données et évaluations sont tous open source !

Kuaishou a open source le système, les modèles et les données des agents !

Rapport technique : https://arxiv.org/abs/2312.04889
Page d'accueil du projet : https://github.com/ KwaiK EG/KwaiAgents

Le contenu suivant peut être trouvé sur la page d'accueil Github de "KwaiAgents" :

Système (KAgentSys-Lite) : un système d'agents IA léger équipé d'ensembles d'outils factuels et opportuns
Modèle ; (KAgentLMs) : après le réglage des méta-agents, une série de grands modèles avec des capacités communes d'agents et leurs données de formation
Évaluation (KAgentBench) : évaluation automatisée des capacités d'agent prêtes à l'emploi, référence et résultats d'évaluation manuelle ; .

Kuaishou a open source le système, les modèles et les données des agents !

Système

Les principaux composants du système KAgentSys comprennent un noyau cognitif, un mécanisme de mémoire et une bibliothèque d'outils basés sur de grands modèles pour réaliser une automatisation itérative

Mécanisme de mémoire : incluant le trois types de mémoire, base de connaissances, dialogue et historique des tâches, s'appuient sur le cadre de récupération de récupération de vecteurs hybrides, de récupération de mots clés et d'autres technologies pour récupérer les informations requises dans chaque chemin planifié.
Ensemble d'outils : contient un ensemble d'outils améliorés par les faits. Le mécanisme de recherche et de navigation hétérogène peut rassembler des connaissances provenant de plusieurs sources telles que des pages Web, des encyclopédies textuelles et des encyclopédies vidéo, notamment des calendriers, des jours fériés, des décalages horaires, la météo et autres ; rapidité commune Ensemble d'outils amélioré.
Boucle automatisée : lors d'une série de dialogue, l'utilisateur donnera une question, une base de connaissances facultative et des caractères supplémentaires à saisir dans son ensemble. Le système mettra d'abord à jour et récupérera la mémoire, puis appellera le grand modèle pour la tâche. planification.Si l'outil doit être appelé, il le sera.S'il n'est pas utilisé, il entrera dans la phase de synthèse. Le grand modèle synthétisera les informations historiques et donnera la réponse attendue.

Certaines fonctions de KAgentSys seront progressivement mises à niveau et ouvertes. C'est le contenu de ce modèle open source

Afin d'éviter les problèmes de surajustement causés par un seul modèle lors de la formation, le La méthode Meta-Agent Tuning (MAT) proposée par l'équipe améliore la polyvalence des grands modèles en termes de capacités d'agent et améliore l'effet en introduisant davantage de modèles d'invite d'agent dans les données de formation.

Kuaishou a open source le système, les modèles et les données des agents !

Le Meta-Agent Tuning (MAT) est divisé en deux étapes :

Étape de génération de modèle : en concevant un méta-agent, pour un ensemble de problèmes spécifique, générez un modèle d'invite d'agent instancié (l'image de droite est un exemple) candidat et dans le même environnement expérimental, générez les résultats candidats produits par le modèle ; , et les résultats de haute confiance produits par les modèles open source (tels que ReAct, AutoGPT, etc.) sont comparés et notés à l'aide du modèle de notation pour éliminer les bibliothèques de modèles d'invite d'agent de haute qualité. En introduisant ces divers modèles, la dépendance à l'égard des modèles lors du réglage fin du modèle peut être considérablement réduite et les capacités plus essentielles des agents en matière de planification des tâches, d'utilisation des outils, de réflexion, etc. peuvent être affinées, améliorant ainsi la généralisation et l'efficacité du modèle. .
Phase de réglage fin des instructions : sur la base de dizaines de milliers de modèles, plus de 200 000 données de réglage fin des instructions de réglage des agents ont été construites. L'équipe a réglé certains modèles open source populaires tels que Qwen-7B, Baichuan2-13B, etc. pour l'usage et la référence de tous, et d'autres modèles populaires seront publiés à l'avenir.

Evaluation

KAgentBench a réalisé une utilisation prête à l'emploi grâce à des milliers de données annotées affinées manuellement, permettant à chacun d'utiliser une seule ligne de commandes pour évaluer les différents aspects des capacités des agents d'un grand modèle sous différents modèles.

Kuaishou a open source le système, les modèles et les données des agents !

Dans KAgentBench, comme le montre la figure ci-dessus, nous procéderons à la construction d'entrées pour différents types de capacités. Chaque requête est accompagnée de plusieurs modèles et de plusieurs réponses réelles modifiées par l'homme. Le but de ceci est d’évaluer de manière globale l’exactitude et la généralisation. Après réglage MAT, le tableau ci-dessous montre l'amélioration du modèle 7B-13B dans diverses capacités et a dépassé l'effet de GPT-3.5

Kuaishou a open source le système, les modèles et les données des agents !

L'étude a également mené une évaluation croisée, invitant des annotateurs humains à 200 factuels et les questions urgentes sont annotées, telles que « Quel âge a Andy Lau cette année ? » Les résultats montrent que le modèle après le système KAgentSys et MAT est significativement amélioré (l'exactitude est exprimée en pourcentage et le score moyen sur une échelle de 5 points est entre parenthèses)

Kuaishou a open source le système, les modèles et les données des agents !

pendant un certain temps -tail problèmes et problèmes populaires , généralement les résultats qui reposent uniquement sur les recherches sur le Web ne sont pas idéaux. Par exemple, si vous posez une question longue traîne telle que « De combien de jours Antonella est-elle plus âgée que Messi ? », les résultats de la recherche renverront généralement des ragots à leur sujet sans fournir d'informations clés. KAgentSys peut répondre avec précision à cette question en appelant l'outil de recherche encyclopédique pour obtenir la date de naissance précise, puis en utilisant l'outil de décalage horaire pour calculer la différence d'âge. L'équipe a déclaré que les agents IA sont une voie très prometteuse. À l'avenir, nous continuerons à accumuler des technologies de base et à injecter continuellement une nouvelle vitalité dans l'ensemble de la communauté. Dans le même temps, nous explorerons également activement la combinaison de la technologie des agents et des activités de Kuaishou, et tenterons de mettre en œuvre des applications innovantes plus intéressantes et plus précieuses

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!