正则表达式 - 如何用 php 抓取微信文章正文?

原创
2016-06-06 20:32:37 951浏览

我是一个新手,想使用php抓取微信页面的正文和标题,标题直接用正则表达式|(.*?)|i就抓取到了,但是正文我想的是|>(.*?)匹配标签间的内容,再去掉空格,但是还是会匹配到一堆标签,是怎么回事?或者说有其他更好的方法吗?求指教!

http://mp.weixin.qq.com/s?__biz=MzA5NTQ2NjUzMA==&mid=207136729&amp...

这是一般的微信文章内容链接

下面是这链接的页面代码


Living Music校园歌唱大赛半决赛距离开赛还有???

Living Music校园歌唱大赛半决赛距离开赛还有???

2015-04-27 gzgsytw gzgsytw
gzgsytw

gzgsytw0

校园内有关团委的一切动态一切资讯都可在这里接收查找。

Living Music校园歌唱大赛半决赛距离开赛还有???


精彩绝伦的复赛没有来观看?没关系!30进15的淘汰赛已经结束,15进5的半决赛就在今晚!



今晚六点半Living Music大赛花都校区的十五强选手将在实验楼105举行的半决赛当中角逐出进入最终决赛的五名选手,届时将和三水校区进入决赛的五名选手共同组成广工商十强歌手来竞争广工商最强音的宝座!!


广工商最强音的诞生需要你的见证,come on 小伙伴,即使不是最专业的点评家,你也可以是最专业的聆听者


Living Music大赛花都校区15进5的半决赛

4月27日18:30(即今晚)

实验楼105



回复内容:

我是一个新手,想使用php抓取微信页面的正文和标题,标题直接用正则表达式|(.*?)|i就抓取到了,但是正文我想的是|>(.*?)匹配标签间的内容,再去掉空格,但是还是会匹配到一堆标签,是怎么回事?或者说有其他更好的方法吗?求指教!

http://mp.weixin.qq.com/s?__biz=MzA5NTQ2NjUzMA==&mid=207136729&amp...

这是一般的微信文章内容链接

下面是这链接的页面代码


Living Music校园歌唱大赛半决赛距离开赛还有???

Living Music校园歌唱大赛半决赛距离开赛还有???

2015-04-27 gzgsytw gzgsytw
gzgsytw

gzgsytw0

校园内有关团委的一切动态一切资讯都可在这里接收查找。

Living Music校园歌唱大赛半决赛距离开赛还有???


精彩绝伦的复赛没有来观看?没关系!30进15的淘汰赛已经结束,15进5的半决赛就在今晚!



今晚六点半Living Music大赛花都校区的十五强选手将在实验楼105举行的半决赛当中角逐出进入最终决赛的五名选手,届时将和三水校区进入决赛的五名选手共同组成广工商十强歌手来竞争广工商最强音的宝座!!


广工商最强音的诞生需要你的见证,come on 小伙伴,即使不是最专业的点评家,你也可以是最专业的聆听者


Living Music大赛花都校区15进5的半决赛

4月27日18:30(即今晚)

实验楼105



声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。