> 기술 주변기기 > 일체 포함 > 더 똑똑한 AI 달성: 언어 모델에 추론과 행동을 통합하는 ReAct 기술

더 똑똑한 AI 달성: 언어 모델에 추론과 행동을 통합하는 ReAct 기술

WBOY
풀어 주다: 2023-09-06 22:21:16
앞으로
1400명이 탐색했습니다.

오늘은 구글리서치와 프린스턴대학교 연구진이 공동으로 발표한 "REACT: Combining Reasoning and Behavior in Language Models" 논문을 소개하겠습니다. 그들은 언어 모델에서 추론과 행동을 결합하는 가능성을 탐구하면서 이 논문을 발표했습니다. 그동안 LLM(Large Language Model)의 추론 능력과 행동 능력을 별도로 연구해 왔지만, 이 두 능력을 하나의 시스템으로 결합한 것은 이번이 처음이다. 그러므로 나는 이 논문이 매우 중요하다고 생각한다. ReAct 프레임워크를 통해 가상 에이전트는 웹 및 SQL 데이터베이스 연결과 같은 다양한 도구를 사용할 수 있으므로 사실상 무제한의 확장성을 제공합니다

더 똑똑한 AI 달성: 언어 모델에 추론과 행동을 통합하는 ReAct 기술

추론과 행동의 힘

인간 지능은 작업을 특징으로 합니다. 지향적 지시된 행동과 다음 단계에 대한 추론이 완벽하게 통합됩니다. 이 능력을 통해 우리는 새로운 작업을 빠르게 배우고 신뢰할 수 있는 결정을 내릴 수 있을 뿐만 아니라 예상치 못한 상황에 적응할 수 있습니다. ReAct의 목표는 언어 모델에서 이러한 시너지 효과를 복제하여 인터리브 방식으로 추론 단계 및 작업별 작업을 생성할 수 있도록 하는 것입니다.

ReAct 작동 방식

ReAct는 특정 작업에 대해 대규모 언어 모델을 프롬프트하여 언어를 생성합니다. 추론 역사 단계와 행동. 이러한 프롬프트는 모델의 사고와 행동 생성을 안내하는 소수의 상황별 예로 구성됩니다. 상황에 맞는 예가 아래 그림에 나와 있습니다. 이러한 예는 아이디어를 생성하고, 조치를 취하고, 조치의 결과를 관찰하는 순환 프로세스를 통해 에이전트를 안내합니다. ReAct는 추론 추적과 작업을 결합하여 모델이 동적 추론을 수행할 수 있도록 하여 높은 수준의 계획을 생성하고 외부 환경과 상호 작용하여 추가 정보를 수집할 수 있습니다. 질문 답변, 사실 확인, 텍스트 기반 게임, 웹 페이지 탐색 등 다양한 언어 추론 및 의사 결정 작업에 사용됩니다. 결과는 매우 뛰어납니다. ReAct는 해석 가능성과 신뢰성 측면에서 지속적으로 다른 최첨단 기준을 능가합니다.

더 똑똑한 AI 달성: 언어 모델에 추론과 행동을 통합하는 ReAct 기술 질문 답변 및 사실 확인 작업 모두에서 ReAct는 간단한 Wikipedia API와의 상호 작용을 활용하여 성공적으로 극복했습니다. 추론 과정 일반적인 환각 및 잘못된 전파 문제. 이는 인간이 작업을 해결하는 방법과 유사한 단계를 생성하며 추론의 흔적이 없는 기본 모델보다 해석하기가 더 쉽습니다. 대화형 의사결정 벤치마크에서 ReAct는 단 한두 개의 상황별 예만으로도 모방 학습 및 강화 학습 방법을 크게 능가합니다.

추론, 행동 및 관찰 단계가 서로 얽혀 있지만 ReAct의 신뢰성과 신뢰도가 향상되지만 이 구조도 추론 단계의 유연성을 제한하여 사고 체인 팁보다 일부 작업에서 추론 오류율이 더 높습니다

추론과 행동의 중요성

연구원들도 추론과 행동의 중요성을 이해하기 위해 절제 실험을 수행했습니다. 다른 작업. 그들은 ReAct의 내부 추론과 외부 행동을 결합하는 것이 추론이나 행동에만 초점을 맞춘 기준선보다 지속적으로 더 나은 성능을 발휘한다는 것을 발견했습니다. 이는 보다 효과적인 의사결정을 위해 두 프로세스를 통합하는 것의 가치를 강조합니다.

향후 방향

ReAct가 좋은 결과를 얻었지만 여전히 개선의 여지가 있습니다. 연구원들은 ReAct를 확장하여 더 많은 작업을 훈련 및 운영하고 이를 강화 학습과 같은 보완적인 패러다임과 결합할 것을 권장합니다. 또한 사람이 주석을 추가한 더 많은 데이터를 사용하여 모델을 미세 조정하여 성능을 더욱 향상시킬 수 있습니다.

결론

ReAct는 더욱 스마트하고 일반적인 AI 시스템을 개발하는 데 큰 진전을 이루었으며 매우 유용한 몇 가지 기능도 지원합니다. Langchain 라이브러리의 프록시 함수. 언어 모델의 추론과 행동을 결합함으로써 다양한 작업에서 성능 향상이 입증되었으며 해석 가능성과 신뢰성도 향상되었습니다. 인공 지능이 계속해서 발전함에 따라 추론과 행동의 통합은 더욱 유능하고 적응력이 뛰어난 인공 지능 시스템을 만드는 데 중요한 역할을 할 것입니다

논문 링크를 제공해 주세요:

위 내용은 더 똑똑한 AI 달성: 언어 모델에 추론과 행동을 통합하는 ReAct 기술의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

관련 라벨:
원천:51cto.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 이슈
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿