해리포터 세계에 관한 모든 것을 손끝에서 보고 싶은 해리포터 팬이신가요? 아니면 단순히 해리포터의 다양한 캐릭터가 어떻게 결합되는지에 대한 멋진 차트로 친구들에게 깊은 인상을 남기고 싶으신가요? 지식 그래프만 보면 됩니다.
이 가이드는 노트북과 좋아하는 책만으로 Neo4J에서 지식 그래프를 얻는 방법을 보여줍니다.
Wikipedia에 따르면:
지식 그래프는 그래프 구조의 데이터 모델이나 토폴로지를 이용해 데이터를 표현하고 연산하는 지식 베이스입니다.
하드웨어 측면에서 필요한 것은 컴퓨터뿐입니다. 가급적 Nvidia 그래픽 카드가 장착된 컴퓨터가 좋습니다. 완전히 자급자족하기 위해 로컬 LLM 설정을 사용하겠지만 동일한 목적으로 OpenAI API를 쉽게 사용할 수도 있습니다.
다음이 필요합니다:
WSL2에서 Ubuntu 24.04로 코딩하면서 GPU 작업 부하를 쉽게 통과시키기 위해 Ollama docker를 사용하고 있습니다. Ollama를 Docker 컨테이너로 실행하는 것은 먼저 Nvidia 컨테이너 툴킷을 설치한 후 다음을 수행하는 것만큼 간단합니다.
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
Nvidia GPU가 없는 경우 CLI에서 다음 명령을 사용하여 CPU 전용 Ollama를 실행할 수 있습니다.
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
완료되면 좋아하는 LLM 모델을 Ollama로 가져올 수 있습니다. Ollama에서 사용 가능한 모델 목록은 여기에서 확인하세요. 예를 들어 qwen2.5를 가져오려면 CLI에서 다음 명령을 실행할 수 있습니다.
docker exec -it ollama ollama run qwen2.5
Ollama가 끝났습니다!
먼저 Python 가상 환경을 생성하여 설치한 패키지나 구성 변경 사항을 전역적으로 적용하는 대신 환경 내에서만 제한하도록 할 것입니다. 다음 명령은 가상 환경 harry-potter-rag를 생성합니다:
python -m venv harry-potter-rag
그런 다음 다음 명령을 사용하여 가상 환경을 활성화할 수 있습니다.
source tutorial-env/bin/activate
다음으로 pip를 사용하여 주로 LangChain에서 관련 패키지를 설치합니다.
%pip install --upgrade --quiet langchain langchain-community langchain-openai langchain-experimental neo4j
Neo4J를 도커 컨테이너로 설정하겠습니다. 특정 구성을 쉽게 설정할 수 있도록 docker compose를 사용합니다. 다음을 docker-compose.yaml이라는 파일에 복사한 다음 동일한 디렉터리에서 docker-compose up -d를 실행하여 Neo4J를 설정할 수 있습니다.
이 설정은 또한 데이터, 로그 및 플러그인이 로컬 폴더(예: /data)에 유지되도록 보장합니다. /로그 및 플러그인.
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
이제 Jupyter Notebook에서 지식 그래프 구축을 시작할 수 있습니다! 먼저 다음을 사용하여 Ollama LLM 인스턴스를 설정했습니다.
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
다음으로 LLM을 Neo4J에 연결합니다.
docker exec -it ollama ollama run qwen2.5
이제 좋아하는 해리포터 텍스트나 좋아하는 책을 선택하고 LangChain을 사용하여 텍스트를 덩어리로 분할할 차례입니다. 청킹은 긴 텍스트를 여러 부분으로 나누는 전략이며, 그런 다음 각 부분을 LLM으로 보내 이를 노드와 에지로 변환하고 각 청크의 노드와 에지를 Neo4J에 삽입할 수 있습니다. 간단한 입문서입니다. 노드는 그래프에 표시되는 원이며 각 가장자리는 두 개의 노드를 함께 연결합니다.
코드는 청크가 어떻게 생겼는지 빠르게 미리 볼 수 있도록 첫 번째 청크도 인쇄합니다.
python -m venv harry-potter-rag
이제 GPU가 무거운 작업을 수행하고 텍스트를 지식 그래프로 변환할 때입니다! 책 전체를 자세히 살펴보기 전에 LLM이 원하는 방식으로 그래프를 반환하도록 더 나은 안내를 제공하는 프롬프트를 실험해 보겠습니다.
프롬프트는 기본적으로 우리가 기대하는 것의 예이거나 응답에 표시하려는 내용에 대한 지침입니다. 지식 그래프의 맥락에서 우리는 LLM에게 사람과 조직만 노드로 추출하고 엔터티가 제공된 특정 유형의 관계만 허용하도록 지시할 수 있습니다. 예를 들어, 배우자 관계는 개인과 조직 사이가 아닌 개인과 개인 사이에서만 이루어지도록 허용할 수 있습니다.
이제 첫 번째 텍스트 덩어리에 LLMGraphTransformer를 사용하여 그래프가 어떻게 나타나는지 확인할 수 있습니다. 결과가 마음에 들 때까지 프롬프트를 조정할 수 있는 좋은 기회입니다.
다음 예에서는 개인 또는 조직이 될 수 있는 노드를 예상하며 allowed_relationships는 허용되는 관계 유형을 지정합니다. LLM이 원본 텍스트의 다양성을 캡처할 수 있도록 strict_mode도 False로 설정하여 아래에 정의되지 않은 다른 관계나 엔터티도 캡처할 수 있습니다. 대신 strict_mode를 True로 설정하면 허용되는 항목을 준수하지 않는 엔터티 및 관계가 삭제되거나 허용되는 항목으로 강제 실행될 수 있습니다(정확하지 않을 수 있음).
source tutorial-env/bin/activate
프롬프트를 미세 조정한 후 만족스러우면 이제 지식 정보를 수집할 차례입니다. try - Except는 Neo4J에 제대로 삽입될 수 없는 모든 응답을 명시적으로 처리하는 것입니다. 코드는 모든 오류가 기록되도록 설계되었지만 후속 청크를 그래프로 변환하면서 루프가 계속 진행되는 것을 차단하지 않습니다. 🎜>
docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
위 루프에서는 해리포터와 마법사의 돌, 해리포터와 비밀의 방, 해리포터와 아즈카반의 죄수를 섭취하는 데 약 46분이 걸렸습니다. 결국 4868개의 고유 노드가 생겼습니다! 아래에서 빠른 미리보기를 볼 수 있습니다. 그래프가 정말 붐비고, 누가 누구와 어떤 방식으로 관련되어 있는지 구분하기 어려운 것을 볼 수 있습니다.
이제 암호 쿼리를 활용하여 Dumbledore를 살펴볼 수 있습니다!
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
자, 이제 덤블도어 본인만 알겠습니다. 해리포터와 어떤 연관이 있는지 알아보겠습니다.
docker exec -it ollama ollama run qwen2.5
자, 이제 우리는 해리와 덤블도어가 말한 내용에 관심이 있습니다.
python -m venv harry-potter-rag
우리가 찾고 있는 것을 실제로 찾기 위해 거쳐야 할 문서가 많아 그래프가 여전히 매우 혼란스럽다는 것을 알 수 있습니다. 문서를 노드로 모델링하는 것이 이상적이지 않다는 것을 알 수 있으며 그래프를 보다 직관적으로 사용하기 위해 LLMGraphTransformer에서 추가 작업을 수행할 수 있습니다.
인터넷에 연결하지 않고도 로컬 컴퓨터에 지식 정보를 설정하는 것이 얼마나 쉬운지 확인할 수 있습니다.
해리포터 세계의 전체 지식 그래프도 포함하고 있는 github 저장소는 여기에서 확인하실 수 있습니다.
harry_potter.graphml 파일을 Neo4J로 가져오려면 graphml 파일을 neo4j /import 폴더에 복사하고 Neo4J 브라우저에서 다음을 실행하세요.
source tutorial-env/bin/activate
위 내용은 지식 그래프로 해리포터의 세계 탐색하기의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!