• 技术文章 >后端开发 >Python教程

    python爬虫怎么实现翻页

    尚2019-07-08 09:13:27原创9954

    很多初学python爬虫的小伙伴们都会遇到python爬虫翻页的问题,我在这里先介绍一种。

    需要爬取的网站如图所示

    1.jpg

    查询的这种植物有四页。当我们平时翻页时,首先想到肯定是点击页面上的下一页,写爬虫也是如此,想提取页面上的链接进行访问。但是这样做很麻烦,并且效率很低。

    翻页的方式一般有两种:

    1、观察网站翻页时链接变化

    2、如果写爬虫的请求方式是post方式请求,则需要观察post的数据的变化是否有规律

    今天讲得是第一种方法

    如图,当我点击下一页时,观察到地址栏的链接变化

    1.jpg

    在链接中我们可以惊喜的发现,有page关键字,而且恰好为2,我们试验一下,将链接中page的值改为3,发现正常访问,正好是第三页。因此,我们找到了翻页方式,更改链接中关键字的值。

    因此翻页过程步骤为:

    1、获取总网页数目

    2、利用for循环改变page的值,进行翻页。

    具体翻页代码实现如下:

    获取总页码

    1.jpg

    网络请求方式

    1.jpg

    改变请求头中的page数值

    1.jpg

    更多Python相关技术文章,请访问Python教程栏目进行学习!

    以上就是python爬虫怎么实现翻页的详细内容,更多请关注php中文网其它相关文章!

    声明:本文原创发布php中文网,转载请注明出处,感谢您的尊重!如有疑问,请联系admin@php.cn处理
    上一篇:初学者学python看什么书 下一篇:python中怎么实现倒三角的打印
    大前端线上培训班

    相关文章推荐

    • 怎么在官网上下载python• python怎么添加环境变量• python学来主要是干什么的• 学python语言需要什么基础

    全部评论我要评论

  • 取消发布评论发送
  • 1/1

    PHP中文网