LLM을 사용한 스크래핑을 위한 경량 Python 라이브러리

WBOY
풀어 주다: 2024-08-13 20:30:10
원래의
512명이 탐색했습니다.

Lightweight python library for scraping with LLMs

안녕하세요 여러분,

게으른 스크랩핑을 위해 내 Python 라이브러리를 공유하고 싶습니다 :)

저는 LLM을 활용하여 DOM 구조를 다루거나 웹 스크래퍼를 작성하지 않고도 웹사이트에서 구조화된 데이터를 빠르게 추출해 왔습니다. 몇 달 간의 실험 끝에 내 코드를 오픈 소스 Python 라이브러리로 공유하고 있습니다.

유사한 오픈 소스 라이브러리와 비교할 때 주요 이점은 단순성과 최소한의 토큰 사용에 중점을 두어 비용을 낮추고 처리 속도를 높이는 것입니다.

라이브러리 GitHub를 확인하세요: https://github.com/raznem/parsera

귀하의 피드백을 듣고 싶습니다!

위 내용은 LLM을 사용한 스크래핑을 위한 경량 Python 라이브러리의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:dev.to
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!