Ist Deepseek R1 auch Gehirnüberladung? Die Leistung nimmt nach Überdenken ab, und weniger Denken kann die Rechenkosten um 43%senken.-KI-php.cn

Ist Deepseek R1 auch Gehirnüberladung? Die Leistung nimmt nach Überdenken ab, und weniger Denken kann die Rechenkosten um 43%senken.

Mary-Kate Olsen

Freigeben： 2025-03-12 14:06:01

Original

289 Leute haben es durchsucht

Große Sprachmodelle (LLMs) können auch dem Dilemma der "Überdenken" bei Aufgaben ausgesetzt sind, was zu Ineffizienz oder sogar zu einem Versagen führt. Kürzlich haben Forscher aus Institutionen wie UC Berkeley, UIUC, ETH Zürich und CMU eingehende Untersuchungen zu diesem Phänomen durchgeführt und eine Zeitung mit dem Titel "Die Gefahr des Überdenkens: Untersuchung von Argumentation-Action-Dilemma in Agent-Aufgaben" (Paper Link: Https : /wm.sbmmt.com.Chn . 93).

Ist Deepseek R1 auch Gehirnüberladung? Die Leistung nimmt nach Überdenken ab, und weniger Denken kann die Rechenkosten um 43%senken.

Die Forscher fanden heraus, dass LLMs in Echtzeit interaktiven Umgebungen häufig zwischen "direkter Aktion" und "sorgfältiger Planung" zögern. Diese Art von "Überdenken" wird dazu führen, dass das Modell viel Zeit damit verbringt, komplexe Aktionspläne aufzubauen, aber es ist schwierig, effektiv umzusetzen, und es wird schließlich das halbe Ergebnis mit doppelt so großer Bedeutung erzielen.

Um ein detailliertes Verständnis für dieses Problem zu erlangen, verwendete das Forschungsteam reale Software-Engineering-Aufgaben als experimentelles Rahmen und wählte eine Vielzahl von LLMs aus, darunter O1, Deepseek R1, Qwen2.5 und andere LLMs zum Testen. Sie erstellen eine kontrollierte Umgebung, in der LLM die Erfassung, das Denken und die Handlung von Informationen in Einklang gebracht und konstant den Kontext aufrechterhalten kann.

Ist Deepseek R1 auch Gehirnüberladung? Die Leistung nimmt nach Überdenken ab, und weniger Denken kann die Rechenkosten um 43%senken.

Forscher teilen "Überdenken" in drei Modi: Analyse -Lähmung, Schurkenaktionen und vorzeitiger Ablagerung. Sie entwickelten ein LLM-basierter Bewertungsrahmen, führten eine quantitative Analyse von 4018-Modelltrajektorien durch und konstruierten einen Open-Source-Datensatz, um die relevante Forschung zu erleichtern.

Die Ergebnisse zeigen, dass das Überdenken signifikant negativ mit Problemlösungsraten korreliert. Das Inferenzmodell ist fast dreimal mehr überdenken als das Nicht-Inferenzmodell und ist anfälliger für dieses Problem.

Ist Deepseek R1 auch Gehirnüberladung? Die Leistung nimmt nach Überdenken ab, und weniger Denken kann die Rechenkosten um 43%senken.

Um das Überdenken zu lindern, schlugen die Forscher zwei Methoden vor: native Funktionsaufrufe und selektives Verstärkungslernen und erzielten bemerkenswerte Ergebnisse. Durch die selektive Verwendung von Modellen mit geringer Inferenz-fähiger können die Rechenkosten beispielsweise stark reduziert werden und gleichzeitig eine hohe Aufgabenabschlussrate beibehalten.

Ist Deepseek R1 auch Gehirnüberladung? Die Leistung nimmt nach Überdenken ab, und weniger Denken kann die Rechenkosten um 43%senken.

Die Studie ergab auch, dass eine negative Korrelation zwischen Modellgröße und Überdenken besteht, und kleinere Modelle überdenken eher. Darüber hinaus kann die Erhöhung der Anzahl der Inferenztoken die Überdenken effektiv unterdrücken, während die Kontextfenstergröße keinen signifikanten Einfluss hat.

Ist Deepseek R1 auch Gehirnüberladung? Die Leistung nimmt nach Überdenken ab, und weniger Denken kann die Rechenkosten um 43%senken.

Diese Studie liefert wertvolle Einblicke zum Verständnis und Lösen des Problems der "Überdenken" in LLM, wodurch die Effizienz und Zuverlässigkeit von LLM in praktischen Anwendungen verbessert wird.

Das obige ist der detaillierte Inhalt vonIst Deepseek R1 auch Gehirnüberladung? Die Leistung nimmt nach Überdenken ab, und weniger Denken kann die Rechenkosten um 43%senken.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!