简单php采集网页部分文字问题,求指点,多谢
本帖最后由 hi_5461 于 2013-06-09 15:54:50 编辑
目标采集页面如下代码(示例页面,数据可能变化,但格式不会变化)
要求得到table中主要的4项数据:序 号、违法时间、违法地点、违法行为(即93行~130行之间的)
希望能给出详细一点的php代码。
<br>
nbsp;html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><br>
<br>
<br>
<base><br>
<meta><br>
<title>交警查询</title><br>
<link><br>
<style><br />
.center_td {<br />
text-align:center;<br />
}<br />
</style><br>
<br>
<br>
<br>
<div>
<br>
<div>
<ul>
<li><a>网站首页</a></li>
<li> 沈阳交警</li>
<li> 交通新闻 </li>
<li> 视频播放 </li>
<li> 为您服务 </li>
<li> 在线办公 </li>
<li> 信息查询 </li>
<li> 征求意见 </li>
<li> 联系我们</li>
</ul>
<br>
</div>
<br>
<div>
<!-- 沈阳小雨转小到中雨21~14 今天是:2010年5月28日 -->返回首页 / 设为首页 / 添加搜藏</div>
<br>
</div><br>
<div>
<br>
<table>
<br>
<tr>
<br>
<td>
<br>
<div>
<br>
<h1><a><img alt=" 简单php采集网页部分文字有关问题,求指点,谢谢 " ></a></h1>
<br>
<ul>
<br>
<li>业务指南</li>
<br>
<li>表格下载<br><br>
机动车驾驶人身体条件证<br><br>
机动车驾驶申请表…</li>
<br>
<li>自助报名</li>
<br>
<li>模拟考场</li>
<br>
<li>电子地图</li>
<br>
<li>网上车管所</li>
<br>
</ul>
<br>
</div> <br>
<br>
<div>
<br>
<h1><a><img alt=" 简单php采集网页部分文字有关问题,求指点,谢谢 " ></a></h1>
<br>
<ul>
<br>
<li>业务指南</li>
<br>
<li>表格下载<br><br>
机动车驾驶人身体条件证<br><br>
机动车驾驶申请表…</li>
<br>
<li>自助报名</li>
<br>
</ul>
<br>
</div> <br>
<br>
<br>
<div>
<br>
<h1><a><img alt=" 简单php采集网页部分文字有关问题,求指点,谢谢 " ></a></h1>
<br>
<ul>
<br>
<li>业务指南</li>
<br>
<li>表格下载<br><br>
机动车驾驶人身体条件证<br><br>
机动车驾驶申请表…</li>
<br>
<li>自助报名</li>
<br>
<li>模拟考场</li>
<br>
<li>电子地图</li>
<br>
<li>网上车管所</li>
<br>
</ul>
<br>
</div> <br>
<div>
<br>
<h1><a><img alt=" 简单php采集网页部分文字有关问题,求指点,谢谢 " ></a></h1> <div class="clear">
</div>
</div>
</td>
</tr>
</table>
</div>
Copy after login