Xi Xiaoyao Technology Talk Original
Autor |. iven
Das beliebte AutoGPT[1] hat die 100.000-Sammlung auf Github überschritten. Dieser selbstplanende und selbstausführende Agent konzentriert sich erstmals auf die Selbstanpassung und Optimierung innerhalb des Modells der künstlichen Intelligenz.
Viele Internetnutzer haben jedoch festgestellt, dass die Leistung von AutoGPT instabil ist und Endlosschleifen das häufigste Phänomen sind. Darüber hinaus ist die Ausführungsgeschwindigkeit von AutoGPT sehr langsam. Laut Tests von Internetnutzern benötigt New Bing 8 Sekunden, um die Aufgabe abzuschließen, während AutoGPT ganze 8 Minuten benötigte!
Aufgrund der Funktionsweise von AutoGPT muss die API für eine einzelne Aufgabe mehrmals aufgerufen werden. Es wird geschätzt, dass die Kosten für eine einzelne Aufgabe 100 Yuan übersteigen! Offensichtlich sind solche Kosten für den persönlichen Gebrauch teuer.
Die jüngste neue Arbeit von Microsoft Research schlägt Low-Code-LLM vor, das durch einfache visuelle Vorgänge per Drag-and-Drop mit Agenten zusammenarbeiten kann.
In diesem Modus kann GPT zunächst ein Aufgabenflussdiagramm generieren, das der Selbstplanungs- und Selbstausführungslogik von AutoGPT sehr ähnlich ist. Der Unterschied besteht jedoch darin, dass Benutzer die gesamte Ausführung intuitiv und einfach verstehen und ändern können Prozess, wodurch die Funktionsweise der künstlichen Intelligenz effektiv gesteuert wird.
Es wird „Low-Code“ genannt, weil es das Konzept der visuellen Programmierung übernimmt und Benutzer den Prozess durch einfaches Klicken und Ziehen anpassen können. Bei komplexen Aufgaben können Benutzer den Agenten effektiv mit ihren eigenen Vorstellungen oder Vorlieben steuern.
Low-Code-LLM generiert das Flussdiagramm in einer Konversation, und die Kosten für den Aufruf der API sind grundsätzlich vernachlässigbar. Darüber hinaus vermeidet diese einmalige Generierung des Flussdiagramms auch das Problem von Endlosschleifen in AutoGPT, wodurch der Dienst effizienter wird stabil!
Der Autor hat festgestellt, dass dieses Werk im Repo von Microsoft TaskMatrix.ai[2] platziert ist, das mehr als 30.000 Sterne hat. Visual ChatGPT[3] ist ebenfalls vom selben Team. TaskMatrix.AI zeigt, wie man Basismodelle und eine große Anzahl von APIs in verschiedenen Bereichen verbindet, um Aufgabenautomatisierung zu implementieren (Visual ChatGPT ist ein klassisches Beispiel im visuellen Bereich). Das neu eingeführte Low-Code-LLM kann eine Rolle bei der Interaktion mit Benutzern spielen und Benutzern helfen, die KI besser verstehen zu lassen, was die Benutzer tun möchten.
Papieradresse: //m.sbmmt.com/link/de9240f5c623bf031dcf0fca9770db44
Papiertitel: „Low-Code LLM: Visuelle Programmierung über LLMs.“
Offener Quellcode: https: //m.sbmmt.com/link/141aa4fef48df77f954d60a373a3c322
6 vordefinierte Arten von Low-Code-Operationen
Die Vorteile dieses Modus sind wie folgt:
Darüber hinaus kann Low-Code LLM auch mit externen APIs erweitert werden, um Szenarioanwendungen weiter zu bereichern. Vermitteln Sie beispielsweise effizient Benutzerideen und -präferenzen und helfen Sie Benutzern, Aufgaben zu automatisieren. Bei der Verbindung mit anderen Tools können verschiedene Funktionen wie Vision und Stimme integriert werden.
Sowohl AutoGPT als auch Low-Code-LLM arbeiten hart daran, die Leistung und Wirkung von Modellen der künstlichen Intelligenz zu verbessern. Ersteres konzentriert sich auf die Selbstoptimierung und das Lernen innerhalb des Modells, und letzteres konzentriert sich auf die Zusammenarbeit und Interaktion zwischen Benutzern und Modellen. Diese beiden Methoden können sich gegenseitig ergänzen und in verschiedenen Szenarien und Aufgaben eine bessere Leistung erzielen.
Im Dankesteil des Papiers wurde auch erwähnt, dass ein Teil dieses Artikels durch dieses Kooperationsmodell entstanden ist. Es scheint, dass es in Zukunft kein Traum mehr ist, dass Menschen und große Modelle eng zusammenarbeiten, um etwas zu schaffen.
Das obige ist der detaillierte Inhalt vonAutoGPT ist unzuverlässig, Microsoft bringt eine aktualisierte Version auf den Markt! Editierbarer autonomer Planungsprozess. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!