LlamaIndex를 사용하여 간단한 RAG 에이전트 구축-파이썬 튜토리얼-php.cn

LlamaIndex를 사용하여 간단한 RAG 에이전트 구축

DDD

풀어 주다： 2024-10-01 06:38:02

원래의

455명이 탐색했습니다.

Building a simple RAG agent with LlamaIndex

LlamaIndex는 LLM을 사용하여 상황에 맞는 생성 AI 애플리케이션을 구축하기 위한 프레임워크입니다.

상황증대란 무엇인가?

컨텍스트 확대는 추가 관련 정보나 컨텍스트를 LLM 모델에 제공하여 주어진 쿼리에 대한 이해와 응답을 향상시키는 기술을 의미합니다. 이러한 확장에는 일반적으로 문서, 임베딩과 같은 외부 데이터 소스를 모델 입력에 검색, 통합 또는 연결하는 작업이 포함됩니다. 목표는 더 좋고 정확하며 미묘한 답변을 제공하는 데 도움이 되는 필수 컨텍스트를 제공하여 모델에 더 많은 정보를 제공하는 것입니다. 검색 증강 생성(RAG)은 컨텍스트 증강의 가장 유명한 예입니다.

에이전트란 무엇입니까?

에이전트는 연구, 데이터 추출, 웹 검색 및 기타 작업을 수행하는 도구를 사용하는 LLM으로 구동되는 자동화된 추론 및 의사결정 엔진입니다. 데이터를 기반으로 한 질의 응답부터 작업 완료를 위한 조치를 결정하고 실행할 수 있는 등 간단한 사용 사례에 사용할 수 있습니다.

이번 게시물에서는 LlamaIndex를 사용하여 간단한 RAG 에이전트를 구축해 보겠습니다.

RAG 에이전트 구축

종속성 설치

LlamaIndex를 사용하여 Python을 사용하여 간단한 RAG 에이전트를 구축할 것입니다. 먼저 아래와 같이 필수 종속성을 설치해 보겠습니다.

pip install llama-index python-dotenv

로그인 후 복사

LLM 설정 및 문서 로드

우리는 OpenAI의 gpt-4o-mini를 LLM으로 사용할 것입니다. 환경 변수 파일에 API 키를 넣어야 합니다. 여기에서 LLamaIndex를 사용하여 로컬 LLM을 설정하는 방법에 대해 자세히 알아볼 수 있습니다.

from llama_index.core import SimpleDirectoryReader, VectorStoreIndex, Settings
from llama_index.llms.openai import OpenAI
from dotenv import load_dotenv

# Load environment variables (e.g., OPENAI_API_KEY)
load_dotenv()

# Configure OpenAI model
Settings.llm = OpenAI(model="gpt-4o-mini")

# Load documents from the local directory
documents = SimpleDirectoryReader("./data").load_data()

# Create an index from documents for querying
index = VectorStoreIndex.from_documents(documents)
query_engine = index.as_query_engine()

로그인 후 복사

먼저 OpenAI를 사용하고 gpt-4o-mini 모델을 지정하여 LLM 모델을 구성합니다. 필요에 따라 사용 가능한 다른 모델/LLM으로 전환할 수 있습니다.
그런 다음 SimpleDirectoryReader를 사용하여 로컬 ./data 디렉터리에서 문서를 로드합니다. 이 리더는 디렉터리를 검색하고, 파일을 읽고, 쿼리할 데이터를 구조화합니다.
다음으로, 로드된 문서에서 벡터 저장소 인덱스를 생성하여 쿼리 실행 중에 효율적인 벡터 기반 검색을 수행할 수 있습니다.

에이전트를 위한 맞춤 기능 만들기

이제 에이전트가 작업을 수행하는 데 사용할 수 있는 몇 가지 기본 기능을 정의해 보겠습니다.

def multiply(a: float, b: float) -> float:
    """Multiply two numbers and returns the product"""
    return a * b

def add(a: float, b: float) -> float:
    """Add two numbers and returns the sum"""
    return a + b

로그인 후 복사

에이전트용 도구 만들기

다음으로 앞서 정의한 함수와 쿼리 엔진에서 에이전트가 작업을 수행하는 데 사용할 도구를 만듭니다. 이러한 도구는 에이전트가 다양한 유형의 쿼리를 처리할 때 활용할 수 있는 유틸리티 역할을 합니다.

from llama_index.core.tools import FunctionTool, QueryEngineTool

# Wrap functions as tools
add_tool = FunctionTool.from_defaults(fn=add)
multiply_tool = FunctionTool.from_defaults(fn=multiply)

# Create a query engine tool for document retrieval
space_facts_tool = QueryEngineTool.from_defaults(
    query_engine,
    name="space_facts_tool",
    description="A RAG engine with information about fun space facts."
)

로그인 후 복사

FunctionTool은 덧셈과 곱셈 함수를 래핑하여 도구로 노출합니다. 이제 상담원은 이러한 도구에 액세스하여 계산을 수행할 수 있습니다.
QueryEngineTool은 에이전트가 벡터 저장소에서 정보를 쿼리하고 검색할 수 있도록 query_engine을 래핑합니다. 이 도구가 우주 사실에 대한 정보를 검색할 수 있음을 나타내는 설명과 함께 space_facts_tool이라는 이름을 지정했습니다. 무엇이든 수집하고 수집된 데이터에 따라 도구를 사용자 정의할 수 있습니다.

에이전트 만들기

이제 ReActAgent를 사용하여 에이전트를 생성하겠습니다. 상담원은 도구 사용 시기와 문의에 응답하는 방법을 결정할 책임이 있습니다.

from llama_index.core.agent import ReActAgent

# Create the agent with the tools
agent = ReActAgent.from_tools(
    [multiply_tool, add_tool, space_facts_tool], verbose=True
)

로그인 후 복사

이 에이전트는 주어진 도구를 논리적 순서에 따라 활용하여 모델이 추론하고 행동할 수 있도록 하는 ReAct 프레임워크를 사용합니다. 에이전트는 우리가 만든 도구로 초기화되며 verbose=True 플래그는 에이전트가 작업을 추론하고 실행하는 방법에 대한 자세한 정보를 출력합니다.

에이전트 실행

마지막으로 에이전트가 종료할 때까지 사용자 쿼리를 처리하는 대화형 루프에서 에이전트를 실행해 보겠습니다.

while True:
    query = input("Query: ")

    if query == "/bye":
        exit()

    response = agent.chat(query)
    print(response)
    print("-" * 10)

로그인 후 복사

RAG 에이전트는 어떻게 작동하나요?

수집한 문서와 관련된 질문을 하면 space_facts_tool, 즉 벡터 저장소 도구가 query_engine을 사용하여 관련 정보를 검색합니다.
계산을 요청하면 에이전트는 add_tool 또는 Multiply_tool을 사용하여 해당 작업을 수행합니다.
에이전트는 사용자 쿼리를 기반으로 어떤 도구를 사용할지 즉석에서 결정하고 출력을 제공합니다.

위 내용은 LlamaIndex를 사용하여 간단한 RAG 에이전트 구축의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!