Asfafasfasfasfasf
Artikel ini meneroka RAG Agentik, pendekatan yang kuat menggabungkan pengambilan keputusan Agentic AI dengan penyesuaian RAG untuk mendapatkan semula maklumat dan generasi dinamik. Tidak seperti model tradisional yang terhad oleh data latihan, Agentic RAG secara bebas mengakses dan alasan dengan maklumat dari pelbagai sumber. Panduan praktikal ini memberi tumpuan kepada membina saluran paip RAG berasaskan Langchain.
Projek RAG Agentik: Panduan Langkah demi Langkah
Projek ini membina saluran paip RAG berikutan seni bina ini:
-
pertanyaan pengguna: Proses bermula dengan soalan pengguna.
-
Routing pertanyaan: Sistem menentukan jika ia dapat menjawab menggunakan pengetahuan yang ada. Jika ya, ia bertindak balas secara langsung; Jika tidak, ia meneruskan pengambilan data.
-
Pengambilan data: Paip mengakses dua sumber yang berpotensi:
- Dokumen tempatan: PDF pra-diproses (prinsip AI generatif) berfungsi sebagai asas pengetahuan.
- Carian Internet: Untuk konteks yang lebih luas, sistem menggunakan sumber luaran melalui pengikis web.
-
Bangunan konteks: Data yang diambil disusun menjadi konteks yang koheren.
-
Generasi Jawapan: Konteks ini diberi kepada model bahasa yang besar (LLM) untuk menghasilkan jawapan yang ringkas dan tepat.
Menyediakan persekitaran
Prasyarat:
- kekunci API Groq (
- ) Gemini API Key ( Gemini API Console
- ) Serper.dev API Key ( Serper.Dev API Key
- )
Pasang pakej python yang diperlukan:
pip install langchain-groq faiss-cpu crewai serper pypdf2 python-dotenv setuptools sentence-transformers huggingface distutilsPengurusan Utama API:
Kekunci API Simpan dengan selamat dalam fail (contoh di bawah):
.env
import os from dotenv import load_dotenv # ... other imports ... load_dotenv() GROQ_API_KEY = os.getenv("GROQ_API_KEY") SERPER_API_KEY = os.getenv("SERPER_API_KEY") GEMINI = os.getenv("GEMINI")Gambaran keseluruhan kod:
Kod ini menggunakan beberapa komponen Langchain:
untuk pangkalan data vektor, untuk pemprosesan PDF, FAISS
untuk chunking teks, PyPDFLoader
untuk penyembuhan generasi, RecursiveCharacterTextSplitter
dan HuggingFaceEmbeddings
untuk LLMS, ChatGroq
Dua LLMS dimulakan: llm
(Llama-3.3-70B-SPECDEC) untuk tugas umum dan crew_llm
(Gemini/Gemini-1.5-flash) untuk mengikis web. A check_local_knowledge()
fungsi laluan pertanyaan berdasarkan ketersediaan konteks setempat. Ejen mengikis web, dibina menggunakan crewai
, mengambil semula dan meringkaskan kandungan web. Pangkalan data vektor dibuat dari PDF menggunakan Faiss. Akhirnya, generate_final_answer()
menggabungkan konteks dan pertanyaan untuk menghasilkan tindak balas akhir.
Penggunaan dan output contoh:
Fungsi main()
menunjukkan pertanyaan sistem. Sebagai contoh, pertanyaan "Apa itu Rag Agentic?" mencetuskan mengikis web, mengakibatkan penjelasan komprehensif mengenai Rag Agentik, komponen, faedah, dan batasannya. Output mempamerkan keupayaan sistem untuk mengakses dan mensintesis maklumat secara dinamik dari pelbagai sumber. Output terperinci ditinggalkan di sini untuk keringkasan tetapi boleh didapati dalam input asal.
Atas ialah kandungan terperinci Asfafasfasfasfasf. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Stock Market GPT
Penyelidikan pelaburan dikuasakan AI untuk keputusan yang lebih bijak

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Projek itu, yang digelar "FOMC in Silico," secara digital mencipta semula mesyuarat Jawatankuasa Pasaran Terbuka Persekutuan-lengan membuat keputusan dari Bank Pusat A.S. menggunakan ejen AI untuk mewakili ahli lembaga sebenar. Pasukan penyelidikan memberi makan setiap data ejen di Indi

Membaca pengenalan kepada senarai nominasi yang sentiasa berkembang, yang menampilkan pemfailan undang-undang yang penuh dengan keputusan mahkamah yang dibuat, buku palsu yang dikaitkan dengan penulis sebenar, dan tuan rumah Airbnb menggunakan AI untuk membuat imej yang mencadangkan tetamu yang menyebabkan kerosakan mereka

Pada masa yang sama, protokol penyimpanan tradisional digantikan oleh teknologi yang lebih baru yang lebih baik memenuhi keperluan beban kerja AI yang berprestasi tinggi, berprestasi tinggi. Penyelesaian penyimpanan untuk AI semakin memilih penyimpanan objek ke atas penyimpanan blok tradisional dan penyimpanan fail. Peralihan ini ironis kerana penyimpanan objek pada asalnya dibangunkan sebagai platform berskala, tahan lama dan kos rendah, terutamanya untuk sandaran konvensional, arkib, kandungan media, dan tasik data skala awan. Walau bagaimanapun, tidak seperti sistem tradisional dan sistem penyimpanan blok yang diliputi oleh tuntutan pemprosesan selari berskala besar, penyimpanan objek menyediakan keupayaan skala dan prestasi prestasi yang diperlukan oleh aplikasi AI. Ditubuhkan lebih daripada sepuluh tahun yang lalu, Minio adalah pemimpin awal dalam pasaran penyimpanan objek. Syarikat itu akan

Kenderaan Waymo tanpa mana -mana penumpang sedang bepergian di sepanjang jalan luar bandar berhampiran Arizona State University di Tempe apabila ia mula melambatkan untuk membuat giliran kanan menjadi tempat letak kereta -mungkin bersedia untuk mengambil penunggang seterusnya. Waymo mengesahkan isyarat giliran

Kesan psikologi transformasi ini adalah mendalam. Selama bertahun-tahun, teknologi bantuan telah menjadi rumit, stigmatizing, dan tegar-memaksa pengguna menjadi satu saiz-sesuai-semua acuan. Tetapi AI menulis semula cerita itu, menyampaikan penyelesaian peribadi t

Menariknya, kajian baru mendedahkan bahawa salah satu kegunaan yang paling biasa untuk chatbots AI hari ini adalah sokongan kesihatan emosi dan mental. Ramai pengguna merasa lebih mudah untuk membuka perkara -perkara yang sangat peribadi yang mereka mungkin teragak -agak untuk berbincang dengan rakan, keluarga, o

Sama ada yang boleh dicapai masih dapat dilihat, tetapi penilaian oleh Forbes versi terkini FSD mendapati bahawa ia tetap rawan kesilapan. Semasa memandu ujian selama 90 minit di Los Angeles, di kawasan kejiranan dan jalan raya, 2024 Model Y dengan T

Syarikat itu mengumumkan lonjakan 359% dalam backlog pesanannya semasa panggilan pendapatan Q1 2026, mencetuskan kenaikan 36% dalam nilai sahamnya pada hari itu. Pencapaian ini mendorong Ellison -owner lebih dari 40% saham syarikat -ke bahagian atas Forbes Billiona
