Mencapai AI yang lebih pintar: teknologi ReAct yang menyepadukan penaakulan dan tingkah laku dalam model bahasa-AI-php.cn

Mencapai AI yang lebih pintar: teknologi ReAct yang menyepadukan penaakulan dan tingkah laku dalam model bahasa

WBOY

Lepaskan： 2023-09-06 22:21:16

ke hadapan

1400 orang telah melayarinya

Hari ini kami akan memperkenalkan kertas kerja "REACT: Menggabungkan Penaakulan dan Tingkah Laku dalam Model Bahasa", yang merupakan kerjasama antara penyelidik dari Google Research dan Princeton University. Mereka menerbitkan kertas itu sambil meneroka potensi menggabungkan penaakulan dan tingkah laku dalam model bahasa. Walaupun keupayaan penaakulan dan tindakan model bahasa besar (LLM) telah dikaji secara berasingan, ini adalah kali pertama kedua-dua keupayaan ini digabungkan menjadi satu sistem. Oleh itu, saya rasa kertas ini sangat penting. Rangka kerja ReAct membolehkan ejen maya menggunakan pelbagai alat seperti menyambung ke web dan pangkalan data SQL, sekali gus menyediakan kebolehskalaan hampir tidak terhad

Mencapai AI yang lebih pintar: teknologi ReAct yang menyepadukan penaakulan dan tingkah laku dalam model bahasa

Kuasa penaakulan dan tindakan

Kepintaran manusia dicirikan oleh kecerdasan tugas -berorientasikan Tindakan terarah dan penaakulan tentang langkah seterusnya disepadukan dengan lancar. Keupayaan ini membolehkan kami mempelajari tugas baharu dengan cepat dan membuat keputusan yang boleh dipercayai, serta menyesuaikan diri dengan keadaan yang tidak dijangka. Matlamat ReAct adalah untuk mereplikasi sinergi ini dalam model bahasa, membolehkan mereka menjana langkah inferens dan tindakan khusus tugasan dalam cara bersilang

Cara ReAct berfungsi

ReAct menggesa model bahasa yang besar yang diberikan untuk lisan menaakul langkah dan tindakan sejarah. Gesaan ini terdiri daripada sebilangan kecil contoh kontekstual yang membimbing pemikiran dan penjanaan tindakan model. Contoh kontekstual diberikan dalam rajah di bawah. Contoh-contoh ini membimbing ejen melalui proses kitaran: menjana idea, mengambil tindakan, dan kemudian memerhatikan hasil tindakan tersebut. Dengan menggabungkan jejak dan tindakan inferens, ReAct membenarkan model melakukan inferens dinamik, yang boleh menjana rancangan peringkat tinggi dan juga berinteraksi dengan persekitaran luaran untuk mengumpul maklumat tambahan

Mencapai AI yang lebih pintar: teknologi ReAct yang menyepadukan penaakulan dan tingkah laku dalam model bahasa

Aplikasi dan Keputusan

Penyelidik Rect memohon Untuk pelbagai penaakulan linguistik dan tugasan membuat keputusan, termasuk menjawab soalan, pengesahan fakta, permainan berasaskan teks dan navigasi halaman web. Hasilnya adalah cemerlang, dengan ReAct secara konsisten mengatasi garis dasar tercanggih lain dari segi kebolehtafsiran dan kebolehpercayaan

Dalam kedua-dua tugas menjawab soalan dan pengesahan fakta, ReAct memanfaatkan interaksi dengan API Wikipedia yang mudah, berjaya mengatasi proses inferens Masalah halusinasi dan salah penyebaran biasa. Ia menjana langkah yang serupa dengan cara manusia menyelesaikan tugas dan lebih mudah untuk ditafsirkan daripada model garis dasar tanpa kesan penaakulan. Pada penanda aras membuat keputusan interaktif, ReAct dengan ketara mengatasi pembelajaran tiruan dan kaedah pembelajaran pengukuhan walaupun dengan hanya satu atau dua contoh kontekstual

Walaupun langkah penaakulan, tindakan dan pemerhatian saling berkaitan, meningkatkan kebolehpercayaan dan Kredibiliti ReAct, tetapi struktur ini mengehadkan fleksibiliti langkah penaakulannya, mengakibatkan kadar ralat penaakulan yang lebih tinggi pada beberapa tugas daripada petua rantai pemikiran

Kepentingan penaakulan dan tindakan

Pengkaji juga Eksperimen ablasi telah dijalankan untuk memahami kepentingan penaakulan dan tindakan dalam tugas yang berbeza. Mereka mendapati bahawa menggabungkan penaakulan dalaman dan tingkah laku luaran ReAct secara konsisten mengatasi garis dasar yang memfokuskan pada penaakulan atau tindakan sahaja. Ini menyerlahkan nilai penyepaduan kedua-dua proses untuk membuat keputusan yang lebih berkesan

Hala Tuju Masa Depan

Walaupun ReAct telah mencapai keputusan yang baik, masih terdapat ruang untuk penambahbaikan. Para penyelidik mengesyorkan meningkatkan ReAct untuk melatih dan mengendalikan lebih banyak tugas dan menggabungkannya dengan paradigma pelengkap seperti pembelajaran pengukuhan. Selain itu, model ini boleh diperhalusi menggunakan lebih banyak data anotasi manusia untuk meningkatkan lagi prestasi

Kesimpulan

ReAct ialah satu langkah besar ke hadapan dalam membangunkan sistem AI yang lebih pintar dan lebih umum, dan ia juga menyokong beberapa sistem yang sangat berguna fungsi proksi daripada perpustakaan Langchain. Dengan menggabungkan penaakulan dan tingkah laku dalam model bahasa, peningkatan prestasi telah ditunjukkan merentasi pelbagai tugas, di samping meningkatkan kebolehtafsiran dan kebolehpercayaan. Apabila kecerdasan buatan terus berkembang, integrasi penaakulan dan tingkah laku akan memainkan peranan penting dalam mewujudkan sistem kecerdasan buatan yang lebih berkebolehan dan adaptif

Sila berikan pautan ke kertas:

Atas ialah kandungan terperinci Mencapai AI yang lebih pintar: teknologi ReAct yang menyepadukan penaakulan dan tingkah laku dalam model bahasa. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!