这里我就在想一个请求嘛,我验证请求一次,浏览量增加1。于是我就按F5刷新,但是实际上并不是每次都增加,继续验证发现多过会再按F5就增加1了。到这里基本特征分析完毕,亲,你有思路了吗?我这里想到以前的爬虫,不就是请求页面,得到返回的html再解析字符串嘛。所以我也借鉴这个思想,使用服务端请求链接,然后剩下的就是这个等待时间,如果不管一直刷,可能会有恶意请求的嫌疑,这是要被封号的。那么这个场景适合什么技术了,大家think到没?没错,可以用线程,设置每次请求后的sleep时间。
那么大致思路就明确了:httpClient发请求,线程控制停顿时间。废话不说了,我就上代码了:
上面这个main大家应该熟的很,我这里的想法就是线程类里有三个变量,我使用前,new出来后先设置好变量,便于后期线程run方法里使用。这里跟大家补充下多线程实现的4中方式,这个之前好像也写了博文提到过。
多线程的实现有4种方式,很多都至说前面两种,不带返回值的。
1、继承Thread类创建线程
Thread类本质上是实现了Runnable接口的一个实例,代表一个线程的实例。启动线程的唯一方法就是通过Thread类的start()实例方法。start()方法是一个native方法,它将启动一个新线程,并执行run()方法。这种方式实现多线程很简单,通过自己的类直接extend Thread,并复写run()方法,就可以启动新线程并执行自己定义的run()方法。例如:
public class MyThread extends Thread { public void run() { System.out.println("MyThread.run()"); } } MyThread myThread1 = new MyThread(); MyThread myThread2 = new MyThread(); myThread1.start(); myThread2.start();
2、实现Runnable接口创建线程
如果自己的类已经extends另一个类,就无法直接extends Thread,此时,可以实现一个Runnable接口,如下:
public class MyThread extends OtherClass implements Runnable { public void run() { System.out.println("MyThread.run()"); } }
为了启动MyThread,需要首先实例化一个Thread,并传入自己的MyThread实例:
MyThread myThread = new MyThread(); Thread thread = new Thread(myThread); thread.start();
事实上,当传入一个Runnable target参数给Thread后,Thread的run()方法就会调用target.run(),参考JDK源代码:
public void run() { if (target != null) { target.run(); } }
3、实现Callable接口通过FutureTask包装器来创建Thread线程
Callable接口(也只有一个方法)定义如下:
public interface Callable
public class SomeCallable
Callable
4、使用ExecutorService、Callable、Future实现有返回结果的线程
ExecutorService、Callable、Future三个接口实际上都是属于Executor框架。返回结果的线程是在JDK1.5中引入的新特征,有了这种特征就不需要再为了得到返回值而大费周折了。而且自己实现了也可能漏洞百出。
可返回值的任务必须实现Callable接口。类似的,无返回值的任务必须实现Runnable接口。
执行Callable任务后,可以获取一个Future的对象,在该对象上调用get就可以获取到Callable任务返回的Object了。
注意:get方法是阻塞的,即:线程无返回结果,get方法会一直等待。
再结合线程池接口ExecutorService就可以实现传说中有返回结果的多线程了。
言归正传,我这里使用的是第一种,因为我不需要返回值。
这里面加入的是可以多个地址刷的思路,以及奇偶分请求方式,避免每次都是同一种请求方式,规避被系统列为恶意请求的风险。以及休眠时间可以在main设置。下面就来看看刷之前的阅读量:
昨天晚上是写完这个我就去睡了,电脑都没有关,看看这一晚上请求到多少次了:
然后,我现在刷新下列表页,重新看看阅读量:
看到没,阅读量现在已经是600多了,原先才300多。
这里因为ip一直都是这个,所以中间的sleep时间有点长,如果能有ip供切换,加入切换逻辑,效果会更好。
理论上来说所有的阅读量都是可以用这个刷的,当然要客户端没有做比较严格的同ip请求多次至算阅读1次等策略。百度文库的那些文章我不找到怎么评为优秀文档的,但是我想跟请求量肯定有一定关系,大家有机会可以按照这个思路试试。可以改造下搞两个线程,交替进行,一个线程刷一个网站,哈哈。
不过如果封号了不要怪我,呵呵。
相关推荐:
以上是使用线程和httpclient刷浏览量的方法的详细内容。更多信息请关注PHP中文网其他相关文章!