Le développement de modèles à grande échelle est limité et nécessite la création de théories explicables de l'IA-IA-php.cn

Le développement de modèles à grande échelle est limité et nécessite la création de théories explicables de l'IA

王林

Libérer： 2024-01-16 22:00:14

avant

1288 Les gens l'ont consulté

La limitation de GPT-4 est qu'il ne peut interagir qu'avec le monde numérique, et nous devons éventuellement interagir avec le monde physique. Pour cette raison, l’émergence des robots est particulièrement importante, car elle représente la réalisation de l’intelligence incarnée. Zhang Bo a souligné qu'il n'est pas nécessaire de développer des robots humanoïdes ni de disposer d'un matériel trop complexe. Il préconise de mener des recherches sur l’apprentissage par renforcement basées sur certains matériels. Une telle approche permet d’affiner sans changer le sens originel.

Le monde entier est surpris par la puissance et le potentiel des grands modèles, mais ne peut pas en expliquer la raison et ne peut l'attribuer qu'au phénomène « d'émergence ». Pour le développement sain de l’industrie de l’intelligence artificielle, la recherche scientifique, l’innovation technologique et le développement industriel doivent être intégrés. Pour développer la troisième génération d’intelligence artificielle, des théories et des méthodes explicables et robustes doivent être établies, sinon la technologie de l’IA ne sera jamais convaincante.

Le développement de modèles à grande échelle est limité et nécessite la création de théories explicables de lIA

Il existe un plafond pour les grands modèles linguistiques.

Bien que le chemin vers l'intelligence artificielle générale soit encore difficile, les grands modèles de langage ont ouvert une large voie à l'industrie de l'IA. Lors de la journée portes ouvertes annuelle de la technologie Zhipu AI 2024, l'académicien Zhang Bo a déclaré que les grands modèles offrent des opportunités pour le développement de matériel et de logiciels généraux.

Le paradigme de l'IA traditionnel utilise des algorithmes et des règles spécifiques pour effectuer des tâches spécifiques. Le paradigme de l'IA générative est basé sur un modèle général appelé modèle de base, grâce à un entraînement sur un large éventail de données textuelles, il peut être généré dans un domaine ouvert (open). domaine). Texte, images et autres contenus de haute qualité de type humain qui peuvent être adaptés à un large éventail de tâches en aval grâce à des réglages fins et à d'autres méthodes. L'IA générative fait un pas vers l'IA générale, la deuxième étape concerne les agents d'IA et la troisième étape est l'intelligence incarnée. Zhang Bo a déclaré que GPT-4 ne peut traiter que le monde numérique et que nous devrons éventuellement traiter le monde physique, qui nécessite des robots, c'est-à-dire une intelligence incarnée. La proposition d’intelligence incarnée aide à construire un agent intelligent complet, permettant à l’agent intelligent de percevoir et de penser. "Vous n'êtes pas obligé de fabriquer un robot humanoïde, car dans de nombreux cas, vous n'avez besoin que de vos mains ou de vos pieds, et vous n'avez pas besoin de rendre le matériel très compliqué." Il préconise de mener des recherches sur l'apprentissage par renforcement basées sur certains matériels.

Les grands modèles d'IA générative ont trois capacités majeures et une lacune majeure. Le premier concerne les puissantes capacités de génération, qui étonnent les gens par leur capacité à générer un texte cohérent avec une variété de contextes et de conversations passées. Deuxièmement, il possède de fortes capacités de migration, c'est-à-dire que grâce à la formation et au réglage fin des tâches des agents, il peut être appliqué aux tâches d'intérêt en aval. Le troisième concerne de puissantes capacités d’interaction, notamment l’interaction homme-machine, l’interaction entre plusieurs agents et l’interaction avec l’environnement, permettant à l’IA de démontrer des niveaux d’intelligence comparables à ceux des humains dans divers domaines. Cependant, ces grands modèles souffrent également d’un inconvénient : l’illusion. Parfois, ils génèrent des réponses inventées ou absurdes qui semblent raisonnables.

L'intelligence artificielle contribue à promouvoir la croissance économique. Des secteurs tels que la construction, la maintenance et l'installation sont difficiles à automatiser et intelligents, mais les emplois de col blanc tels que la gestion administrative peuvent être remplacés par l'IA. L’IA peut améliorer la qualité et l’efficacité de la plupart des emplois humains, mais seuls quelques emplois sont encore complètement remplacés par l’IA. La raison pour laquelle l’IA ne peut pas encore remplacer la plupart des emplois est que les grands modèles ont encore un plafond infranchissable. Zhang Bo a déclaré que tout le travail du grand modèle repose sur des invites externes plutôt que proactives et utilise des prédictions probabilistes pour accomplir des tâches sous des invites externes, tandis que le travail humain est motivé par des intentions internes. Le langage généré par les grands modèles de langage et la génération de langage humain ont seulement un comportement similaire, mais les mécanismes internes sont fondamentalement différents. Les grands modèles de langage ont des plafonds tels que l'inconscience, la qualité incontrôlable, le manque de fiabilité et le manque de robustesse. produira des réponses différentes. Les grands modèles peuvent également produire des hallucinations. « Quelle que soit la taille du modèle, le défaut des hallucinations existe toujours. »

Il a proposé que pour développer la troisième génération d'intelligence artificielle, il est nécessaire d'établir des théories et des méthodes d'intelligence artificielle explicables et robustes, de développer une technologie d'IA sûre, contrôlable, crédible, fiable et évolutive, et de promouvoir des applications et des industries innovantes du changement de l'IA. . Si une théorie explicable et robuste de l’intelligence artificielle ne peut être établie, la technologie de l’IA ne sera pas fiable et ne sera jamais crédible. "Jusqu'à présent, cette théorie n'a pas été établie, c'est pourquoi le développement de l'intelligence artificielle est lent et tortueux. La raison pour laquelle la théorie ne peut pas être établie est qu'elle est soumise à trois limitations spécifiques. Dans le passé, des modèles spécifiques ne pouvaient qu'être établis. être utilisé pour résoudre des tâches spécifiques dans des domaines spécifiques. , comment est-il possible d'établir une théorie générale ? L'émergence de grands modèles offre la possibilité d'établir cette théorie.

Zhang Bo a déclaré que les grands modèles nous offrent la possibilité de développer du matériel et des logiciels généraux. L'intelligence artificielle entre dans une phase de développement constant et a un impact énorme sur tous les domaines. Nous devons saisir l'opportunité de développer l'industrie de l'intelligence artificielle. Mais il reste encore beaucoup d’incertitudes car l’IA est imprévisible et incontrôlable. Le monde entier est surpris par les puissantes capacités de génération, de migration et d'interaction des grands modèles, mais il ne peut pas l'expliquer et ne peut que l'attribuer à « l'émergence ». Par conséquent, pour le développement sain de l’industrie de l’intelligence artificielle, la recherche scientifique, l’innovation technologique et le développement industriel doivent être combinés.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!