Die Entwicklung groß angelegter Modelle ist begrenzt und erfordert die Erstellung erklärbarer KI-Theorien-KI-php.cn

Die Entwicklung groß angelegter Modelle ist begrenzt und erfordert die Erstellung erklärbarer KI-Theorien

王林

Freigeben： 2024-01-16 22:00:14

nach vorne

1290 Leute haben es durchsucht

Die Einschränkung von GPT-4 besteht darin, dass es nur mit der digitalen Welt interagieren kann und wir letztendlich mit der physischen Welt interagieren müssen. Aus diesem Grund ist die Entstehung von Robotern besonders wichtig, da sie die Verwirklichung verkörperter Intelligenz darstellt. Zhang Bo wies darauf hin, dass es weder notwendig sei, humanoide Roboter zu entwickeln, noch übermäßig komplexe Hardware benötige. Er befürwortet die Durchführung von Reinforcement-Learning-Forschung auf Basis bestimmter Hardware. Ein solcher Ansatz ermöglicht eine Feinabstimmung, ohne die ursprüngliche Bedeutung zu verändern.

Die ganze Welt ist von den leistungsstarken Fähigkeiten und dem Potenzial großer Modelle überrascht, kann aber den Grund dafür nicht erklären und kann ihn nur auf das „Emergenz“-Phänomen zurückführen. Für eine gesunde Entwicklung der Branche der künstlichen Intelligenz müssen wissenschaftliche Forschung, technologische Innovation und industrielle Entwicklung integriert werden. Um die dritte Generation der künstlichen Intelligenz zu entwickeln, müssen erklärbare und belastbare Theorien und Methoden etabliert werden, sonst wird die KI-Technologie nie überzeugen.

Die Entwicklung groß angelegter Modelle ist begrenzt und erfordert die Erstellung erklärbarer KI-Theorien

Für große Sprachmodelle gibt es eine Obergrenze.

Obwohl der Weg zur allgemeinen künstlichen Intelligenz immer noch schwierig ist, haben große Sprachmodelle der KI-Branche einen breiten Weg eröffnet. Beim Zhipu AI 2024 Annual Technology Open Day sagte Akademiker Zhang Bo, dass große Modelle Möglichkeiten für die Entwicklung allgemeiner Hardware und Software bieten.

Das traditionelle KI-Paradigma verwendet spezifische Algorithmen und Regeln, um bestimmte Aufgaben zu erledigen. Das generative KI-Paradigma basiert auf einem allgemeinen Modell, das als Basismodell bezeichnet wird. Es kann in einer offenen Domäne (offene Domäne) durch Training an einem breiten Textbereich generiert werden Daten. Menschenähnliche, hochwertige Texte, Bilder und andere Inhalte, die durch Feinabstimmung und andere Methoden an eine Vielzahl nachgelagerter Aufgaben angepasst werden können. Generative KI geht einen Schritt in Richtung allgemeiner KI, der zweite Schritt sind KI-Agenten und der dritte Schritt ist verkörperte Intelligenz. Zhang Bo sagte, dass GPT-4 nur mit der digitalen Welt umgehen kann und wir uns letztendlich mit der physischen Welt befassen müssen, die Roboter, also verkörperte Intelligenz, erfordert. Der Vorschlag der verkörperten Intelligenz hilft beim Aufbau eines vollständigen intelligenten Agenten, der es dem intelligenten Agenten ermöglicht, sowohl wahrzunehmen als auch zu denken. „Man muss keinen humanoiden Roboter bauen, da man in vielen Fällen nur seine Hände oder Füße braucht und die Hardware nicht sehr kompliziert sein muss.“ Er befürwortet die Durchführung von Reinforcement-Learning-Forschung auf der Grundlage bestimmter Hardware.

Generative KI-Großmodelle haben drei Hauptfähigkeiten und einen großen Mangel. Das erste sind seine leistungsstarken Generierungsfunktionen, die Menschen mit ihrer Fähigkeit verblüffen, kohärenten Text mit einer Vielzahl von Kontexten und vergangenen Gesprächen zu erstellen. Zweitens verfügt es über starke Migrationsfähigkeiten, d. h. durch Schulung und Feinabstimmung der Agentenaufgaben kann es auf nachgelagerte Aufgaben von Interesse angewendet werden. Das dritte sind leistungsstarke Interaktionsfähigkeiten, einschließlich der Mensch-Computer-Interaktion, der Interaktion zwischen mehreren Agenten und der Interaktion mit der Umgebung, die es der KI ermöglichen, in verschiedenen Bereichen Intelligenzniveaus zu demonstrieren, die mit denen des Menschen vergleichbar sind. Allerdings haben diese großen Modelle auch einen Nachteil: Illusion. Manchmal generieren sie erfundene oder unsinnige Antworten, die vernünftig erscheinen.

Künstliche Intelligenz trägt zur Förderung des Wirtschaftswachstums bei. Branchen wie Bauwesen, Wartung und Installation lassen sich nur schwer automatisieren und intelligent machen, aber Bürojobs wie Verwaltungsmanagement könnten durch KI ersetzt werden. KI kann die Qualität und Effizienz der meisten menschlichen Arbeitsplätze verbessern, aber es gibt immer noch nur wenige Arbeitsplätze, die vollständig durch KI ersetzt werden. Der Grund dafür, dass KI die meisten Jobs noch nicht ersetzen kann, liegt darin, dass große Modelle immer noch eine unüberwindbare Grenze haben. Zhang Bo sagte, dass die gesamte Arbeit des großen Modells eher von externen als von proaktiven Eingabeaufforderungen abhängt und probabilistische Vorhersagen verwendet, um Aufgaben unter externen Eingabeaufforderungen zu erledigen, während die menschliche Arbeit von internen Absichten gesteuert wird. Die von großen Sprachmodellen erzeugte Sprache und die menschliche Sprachgenerierung ähneln sich nur im Verhalten, aber die internen Mechanismen unterscheiden sich grundlegend in Bezug auf Unwissenheit, unkontrollierbare Qualität, Unzuverlässigkeit und Unrobustheit wird unterschiedliche Antworten ausgeben. Auch große Models können Halluzinationen hervorrufen: „Egal wie groß das Model ist, der Mangel an Halluzinationen besteht immer.“

Er schlug vor, dass es zur Entwicklung der dritten Generation der künstlichen Intelligenz notwendig sei, erklärbare und robuste Theorien und Methoden der künstlichen Intelligenz zu etablieren, sichere, kontrollierbare, glaubwürdige, zuverlässige und skalierbare KI-Technologie zu entwickeln und innovative Anwendungen und Industrien des KI-Wechsels zu fördern . Wenn keine erklärbare und belastbare Theorie der künstlichen Intelligenz aufgestellt werden kann, wird die KI-Technologie unzuverlässig und niemals glaubwürdig sein. „Bisher wurde diese Theorie nicht etabliert, weshalb die Entwicklung der künstlichen Intelligenz langsam und mühsam verlief. Der Grund, warum die Theorie nicht etabliert werden konnte, liegt in drei spezifischen Einschränkungen. In der Vergangenheit konnten nur bestimmte Modelle verwendet werden.“ Um spezifische Aufgaben in bestimmten Bereichen zu lösen, wie ist es möglich, eine allgemeine Theorie zu etablieren? Die Entstehung großer Modelle bietet die Möglichkeit, diese Theorie zu etablieren

Zhang Bo sagte, dass große Modelle uns die Möglichkeit bieten, allgemeine Hardware und Software zu entwickeln. Künstliche Intelligenz tritt in eine Phase stetiger Entwicklung ein und hat enorme Auswirkungen auf alle Lebensbereiche. Wir müssen die Chance nutzen, die Branche der künstlichen Intelligenz weiterzuentwickeln. Doch es gibt immer noch viele Unsicherheiten, denn KI ist unvorhersehbar und unkontrollierbar. Die ganze Welt ist überrascht von den leistungsstarken Generierungs-, Migrations- und Interaktionsfähigkeiten großer Modelle, kann diese jedoch nicht erklären und kann sie nur der „Entstehung“ zuschreiben. Für eine gesunde Entwicklung der Branche der künstlichen Intelligenz müssen daher wissenschaftliche Forschung, technologische Innovation und industrielle Entwicklung kombiniert werden.

Das obige ist der detaillierte Inhalt vonDie Entwicklung groß angelegter Modelle ist begrenzt und erfordert die Erstellung erklärbarer KI-Theorien. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!