ChatGPT a balayé le monde, créant une vague d'exploration des grands modèles. En avril de cette année, les principaux fabricants nationaux ont lancé les principaux modèles les uns après les autres.
Récemment, 4Paradigm a présenté pour la première fois son produit modèle à grande échelle "Shishuo 3.0" et a proposé la stratégie AIGS (AI- Generated Software) pour la première fois : Reconstruire des logiciels d'entreprise avec l'IA générative.
Shishuo se positionnera comme une nouvelle plateforme de développement basée sur de grands modèles multimodaux pour améliorer l'expérience et l'efficacité du développement des logiciels d'entreprise et réaliser « AIGS ». Alors, qu'est-ce que l'AIGS exactement, pourquoi est-il positionné comme AIGS et comment mettre en œuvre l'AIGS ?
Dai Wenyuan, fondateur et PDG de Fourth Paradigm, estime qu'à l'heure actuelle, l'expérience interactive extrêmement complexe des logiciels côté B et l'efficacité de développement extrêmement faible causée par la complexité laissent suffisamment de place pour la reconstruction et la transformation de l'IA générative.
Selon Dai Wenyuan, au cours de la dernière décennie, les produits logiciels côté C ont été perfectionnés à un niveau supérieur, approchant presque la limite supérieure de l'expérience utilisateur. En comparaison, les produits logiciels côté B comportent souvent plus de dix niveaux de menus, et il est difficile d'appeler les fonctions des logiciels d'entreprise en langage naturel.
«Maintenant, lorsque nous disposons de capacités de compréhension et de génération sémantiques plus solides, associées à des capacités de traduction, de distribution et de raisonnement de tâches GPT, nous pouvons mieux utiliser Pour implémenter les appels de fonction de manière interactive, vous n'avez plus besoin de trouver une fonction située dans un répertoire de menus à douze niveaux. « L'interaction est réalisée d'une manière qui peut sans aucun doute apporter une amélioration subversive à l'expérience utilisateur des logiciels d'entreprise côté B. »
De plus, le logiciel d'entreprise côté B d'origine était hautement personnalisé et basé sur un développement basé sur des menus. Fondamentalement, une fonction était mise à niveau à chaque fois et le chef de produit l'était. nécessaire pour dessiner l'interface, la conception, le développement, etc., au moins un temps de développement d'un mois. En raison de l'émergence de nouvelles formes d'interaction, les fonctions et la logique d'exécution étaient autrefois organisées dans l'interface logicielle, mais désormais les fonctions et la logique sont réécrites au niveau des données, de l'API et du contenu, évoluant vers une efficacité de développement au niveau du ciel.
"Tout comme ChatGPT n'est plus un menu complexe et un tas de fonctions, vous pouvez faire beaucoup de choses avec une seule boîte de dialogue. Et derrière elle chaque jour Itération, mais vous ne ressentez pas les changements dans son interface. Dans le passé, le logiciel a été mis à niveau au niveau de l'interface, et à l'avenir, il sera mis à niveau au niveau des données. La raison pour laquelle Four Paradigms a proposé la stratégie AIGS est. sur la base de cette prédiction : les grands modèles peuvent apporter des améliorations dans l'expérience utilisateur et l'efficacité du développement, ils constitueront donc certainement un bond en avant dans l'industrie du logiciel. Les grands modèles sont la nouvelle productivité. Avec une infrastructure de grands modèles comme projet pilote, l'ensemble de l'industrie du logiciel sera transformé, et la valeur commerciale et le modèle économique de l'ensemble de l'industrie feront un bond en avant.
Le jour de la journée portes ouvertes, 4Paradigm a débranché le câble réseau sur place et a démontré sa capacité à comprendre les images, l'écriture de scripts, le dessin et l'écriture de code de grande taille. des maquettes.
Réaliser l'AIGS : capacités Copilot + chaîne de réflexion CoT, formant un nouveau paradigme d'interaction logicielle de domaine
De l'avis de Dai Wenyuan, pour atteindre l'AIGS , beaucoup de Le modèle n'a pas nécessairement besoin d'être un généraliste avec des connaissances approfondies et un champion du décathlon. Ce qui est plus important, c'est que le modèle a la capacité de Copilot (copilote) et CoT (chaîne de pensées, raisonnement en plusieurs étapes). ."Pour transformer les logiciels d'entreprise, les grands modèles ne peuvent pas seulement avoir des capacités linguistiques. Shishuo 2.0 a ajouté la multimodalité et Copilot, car les données de nombreux logiciels d'entreprise sont C'est multimodal, et Copilot peut traduire les instructions humaines en quelle API appeler en arrière-plan. Il est rapporté que lorsque Shishuo 2.0 est lancé, les employés peuvent lancer des demandes de renseignements ou donner des instructions à Shisuo via des méthodes multimodales telles que , images, tableaux et vidéos. Une fois que Shisuo l'a compris, le logiciel d'entreprise en réseau appelle les fonctions pertinentes et affiche la réponse sous la forme requise.
Cependant, les employés seront également confrontés à des tâches complexes lorsqu'ils utiliseront des logiciels d'entreprise, qui obligent les personnes à exécuter des fonctions une par une dans l'ordre.
Dai Wenyuan a expliqué spécifiquement à l'aide d'un logiciel de traitement d'image : Si vous souhaitez régler la luminosité et le contraste, c'est la fonction. Mais si le caractère P est rendu plus fin, il ne peut pas être réalisé par une seule fonction. Derrière cela, les gens doivent exécuter chaque fonction du logiciel en fonction de leur expérience pour y parvenir.
"Lorsque les gens reçoivent un travail complexe, ils raisonnent sur les sous-tâches à effectuer étape par étape dans leur cerveau, puis les exécutent étape par étape. Si remplacé par une machine, si pour le même travail, la machine a vu suffisamment de personnes dans le passé (données accumulées) pour terminer le travail en une, deux, trois et quatre étapes. Elle peut déjà résumer cette routine et former une chaîne de réflexion. .»
Par conséquent, Shishuo 3.0 souligne que Copilot plus la chaîne de réflexion CoT a une capacité de raisonnement plus forte après avoir appris une grande quantité de données et de « stratégies », il peut former des étapes de raisonnement logique intermédiaires, afin de diviser et d'exécuter un travail complexe.
En résumé, Fourth Paradigm résume le parcours AIGS en trois étapes :
Dans la première étape, Copilot mobilise différentes informations, données et applications pour servir d'assistant pour compléter les instructions de l'utilisateur. Cela équivaut à avoir un commandant dans tous les systèmes logiciels de l'entreprise. Le commandant écoute les instructions de l'utilisateur, telles que « éclaircir la photo de 20 % ».
Dans la deuxième étape, Copilot+ s'appuie sur la « base de connaissances » des règles d'entreprise. L'IA peut effectuer un travail complexe en référence aux règles, enrichissant encore les capacités de la « boîte de dialogue ». Par exemple, après que l'IA a interrogé la base de connaissances « embellissement du portrait », elle peut effectuer des étapes pour réparer la photo afin qu'elle soit belle.
La troisième étape, Copilot+CoT (Thinking Chain). Le comportement d'utilisation du système logiciel sera finalement appris par le grand modèle, formant une chaîne de réflexion pour l'IA dans ce domaine, ce qui signifie que des instructions complexes telles que « traiter les photos pour les rendre plus belles » peuvent être complétées automatiquement par l'IA selon les étapes.
La stratégie AIGS du quatrième paradigme fait référence à la transformation des logiciels d'entreprise en un nouveau paradigme d'interaction basé sur les capacités Copilot+COT derrière le modèle à grande échelle, et à l'apprentissage continu du processus d'utilisation du logiciel dans la nouvelle interaction pour former un domaine. La « chaîne de pensée » du logiciel.
Sur le site de lancement de Shishuo 3.0, des représentants des clients des secteurs de la finance, de la fabrication aéronautique, de la médecine et d'autres industries étaient présents et ont fait une démonstration en direct du produit. En seulement deux mois depuis l'émergence de ChatGPT, de nombreuses entreprises et partenaires ont déjà mené une coopération approfondie avec Paradigm dans le domaine de l'IA générative. En tant que nouvelle plate-forme de développement basée sur de grands modèles, Shishuo a hâte de travailler avec davantage de partenaires et d'entreprises clientes pour explorer les opportunités de reconstruire les logiciels d'entreprise avec l'IA générative et d'améliorer conjointement la convivialité et la productivité des logiciels d'entreprise.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!