DeepSeek R1도 뇌 과부하입니까? 지나치게 생각한 후 성능이 감소하고 사고가 줄어들면 컴퓨팅 비용이 43%감소 할 수 있습니다.-일체 포함-php.cn

DeepSeek R1도 뇌 과부하입니까? 지나치게 생각한 후 성능이 감소하고 사고가 줄어들면 컴퓨팅 비용이 43%감소 할 수 있습니다.

Mary-Kate Olsen

풀어 주다： 2025-03-12 14:06:01

원래의

289명이 탐색했습니다.

대형 언어 모델 (LLMS)은 작업을 수행 할 때 "과도하게 생각하는"의 딜레마에 직면하여 비 효율성 또는 실패를 초래할 수 있습니다. 최근 UC Berkeley, UIUC, Eth Zurich 및 CMU와 같은 기관의 연구원들은이 현상에 대한 심층적 인 연구를 수행하고 "과도한 생각의 위험 : 에이전트 링크 : https://www.php 93 ).

DeepSeek R1도 뇌 과부하입니까? 지나치게 생각한 후 성능이 감소하고 사고가 줄어들면 컴퓨팅 비용이 43%감소 할 수 있습니다.

연구원들은 실시간 대화 형 환경에서 LLM이 종종 "직접 행동"과 "신중한 계획"사이를 망설임한다는 것을 발견했습니다. 이런 종류의 "과도하게 생각"하면 모델이 복잡한 행동 계획을 세우는 데 많은 시간을 소비하지만 효과적으로 구현하기는 어렵고 결국 두 배의 노력으로 결과의 절반을 달성 할 것입니다.

이 문제에 대한 심층적 인 이해를 얻기 위해 연구팀은 실제 소프트웨어 엔지니어링 작업을 실험 프레임 워크로 사용했으며 O1, DeepSeek R1, QWEN2.5 및 기타 테스트를 포함한 다양한 LLM을 선택했습니다. LLM이 정보 수집, 추론 및 행동의 균형을 유지하고 컨텍스트를 지속적으로 유지할 수있는 통제 된 환경을 구성합니다.

DeepSeek R1도 뇌 과부하입니까? 지나치게 생각한 후 성능이 감소하고 사고가 줄어들면 컴퓨팅 비용이 43%감소 할 수 있습니다.

연구원들은 "전복적 인"을 분석 마비, 도적 행동 및 조기 분리의 세 가지 모드로 나눕니다. 그들은 LLM 기반 평가 프레임 워크를 개발하고 4018 모델 궤적의 정량 분석을 수행했으며 관련 연구를 용이하게하기 위해 오픈 소스 데이터 세트를 구성했습니다.

결과는 과도하게 생각하는 것이 문제 해결 속도와 상당히 부정적인 상관 관계가 있음을 보여줍니다. 추론 모델은 비 감소 모델보다 거의 3 배 더 지나치게 생각 하며이 문제에 더 취약합니다.

DeepSeek R1도 뇌 과부하입니까? 지나치게 생각한 후 성능이 감소하고 사고가 줄어들면 컴퓨팅 비용이 43%감소 할 수 있습니다.

과도한 생각을 완화하기 위해 연구원들은 네이티브 기능 호출과 선택적 강화 학습의 두 가지 방법을 제안하고 놀라운 결과를 얻었습니다. 예를 들어, 낮은 추론 가능 모델을 선택적으로 사용하면 높은 작업 완료율을 유지하면서 계산 비용을 크게 줄일 수 있습니다.

DeepSeek R1도 뇌 과부하입니까? 지나치게 생각한 후 성능이 감소하고 사고가 줄어들면 컴퓨팅 비용이 43%감소 할 수 있습니다.

이 연구는 또한 모델 크기와 지나치게 생각하는 사이에 음의 상관 관계가 있으며 소규모 모델이 지나치게 생각할 가능성이 더 높다는 것을 발견했습니다. 또한, 추론 토큰의 수를 늘리면 컨텍스트 창 크기는 큰 영향을 미치지 않는 반면, 과도한 생각을 효과적으로 억제 할 수 있습니다.

DeepSeek R1도 뇌 과부하입니까? 지나치게 생각한 후 성능이 감소하고 사고가 줄어들면 컴퓨팅 비용이 43%감소 할 수 있습니다.