大家好,
我想分享我的 Python 库以进行惰性废弃:)
我一直在利用法学硕士从网站快速提取结构化数据,而无需处理 DOM 结构和编写网络抓取工具。经过几个月的实验,我将我的代码作为开源 Python 库分享。
与类似的开源库相比,主要优点是简单并专注于最少的令牌使用,从而降低成本并加快处理速度。
查看 GitHub 库:https://github.com/raznem/parsera
很高兴听到您的反馈!
以上是用于使用 LLM 进行抓取的轻量级 Python 库的详细内容。更多信息请关注PHP中文网其他相关文章!