简单php采集网页部分文字问题,求指点,多谢
本帖最后由 hi_5461 于 2013-06-09 15:54:50 编辑
目标采集页面如下代码(示例页面,数据可能变化,但格式不会变化)
要求得到table中主要的4项数据:序 号、违法时间、违法地点、违法行为(即93行~130行之间的)
希望能给出详细一点的php代码。
<br>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><br>
<html xmlns="http://www.w3.org/1999/xhtml"><br>
<head><br>
<base href="http://218.25.58.44:80/" /><br>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" /><br>
<title>交警查询</title><br>
<link href="style/style.css" rel="stylesheet" type="text/css" /><br>
<style><br>
.center_td {<br>
text-align:center;<br>
}<br>
</style><br>
</head><br>
<br>
<body><br>
<div class="top"><br>
<div class="menu"><ul><li><a href="#">网站首页</a></li><li> 沈阳交警</li><li> 交通新闻 </li><li> 视频播放 </li><li> 为您服务 </li><li> 在线办公 </li><li> 信息查询 </li><li> 征求意见 </li><li> 联系我们</ul><br>
</div><br>
<div class="txt"><!-- 沈阳小雨转小到中雨21~14 今天是:2010年5月28日 -->返回首页 / 设为首页 / 添加搜藏</div><br>
</div><br>
<div class="main"><br>
<table width="100%" border="0" cellspacing="0" cellpadding="0"><br>
<tr><br>
<td valign="top" class="lmenu" ><br>
<div class="l1"><br>
<h1><a href="#"><img src="images/cxx_04.png" border="0" /></a></h1><br>
<ul><br>
<li>业务指南</li><br>
<li>表格下载<br /><br>
机动车驾驶人身体条件证<br /><br>
机动车驾驶申请表…</li><br>
<li>自助报名</li><br>
<li>模拟考场</li><br>
<li>电子地图</li><br>
<li>网上车管所</li><br>
</ul><br>
</div> <br>
<br>
<div class="l1 l2"><br>
<h1><a href="#"><img src="images/cxx_10.png" border="0" /></a></h1><br>
<ul><br>
<li>业务指南</li><br>
<li>表格下载<br /><br>
机动车驾驶人身体条件证<br /><br>
机动车驾驶申请表…</li><br>
<li>自助报名</li><br>
</ul><br>
</div><br>
<br>
<br>
<div class="l1 l3"><br>
<h1><a href="#"><img src="images/cxx_12.png" border="0" /></a></h1><br>
<ul><br>
<li>ビジネスガイド</li><br>
<li>フォームのダウンロード<br /><br>
自動車運転者の健康状態証明書<br><br>
自動車運転申請フォーム…</li><br>
<li>セルフサービス登録</li><br>
<li>模擬試験室</li><br>
<li>電子地図</li><br>
<li>オンライン車両管理オフィス</li><br>
</ul><br>
</div> <br>
<div class="l1 l4"><br>
<h1><a href="#"><img src="images/cxx_14.png" border="0" /></a></h1> <div class="clear"></div>
ログイン後にコピー