这是四六级网站
<table border="0" align="center" cellpadding="0" cellspacing="6" class="cetTable"> <tr> <th>姓名:</th> <td>赵阳</td> </tr> <tr> <th>学校:</th> <td>长春中医药大学</td> </tr> <tr> <th>考试类别:</th> <td>英语四级</td> </tr> <tr> <th>准考证号:</th> <td>220090132112529</td> </tr> <tr> <th>考试时间:</th> <td>2013年12月</td> </tr> <tr> <th valign="top">总分:</th> <td valign="top" class="fontBold"> <span class="colorRed"> 0 </span> <br /><span class="color666">听力:</span> 000 <br /><span class="color666">阅读:</span> 000 <br /><span class="color666">写作与翻译:</span> 000 </td> </tr></table>
$a = curl_exec($ch); $match="#<td>(.*)</td>#"; //$match="#<span>(.*)</span>#";preg_match_all($match,$a,$b);$yourname= $b[1][0];$school= $b[1][1];$cet= $b[1][2];$c= $b[1][5];//分数$score=strip_tags($c);$score=str_replace(" ","",$score); return array('school'=>$school,'name'=>$yourname,'cet'=>$cet,'score'=>$score);
$a =<<< TXT<table border="0" align="center" cellpadding="0" cellspacing="6" class="cetTable"> <tr> <th>姓名:</th> <td>赵阳</td> </tr> <tr> <th>学校:</th> <td>长春中医药大学</td> </tr> <tr> <th>考试类别:</th> <td>英语四级</td> </tr> <tr> <th>准考证号:</th> <td>220090132112529</td> </tr> <tr> <th>考试时间:</th> <td>2013年12月</td> </tr> <tr> <th valign="top">总分:</th> <td valign="top" class="fontBold"> <span class="colorRed"> 0 </span> <br /><span class="color666">听力:</span> 000 <br /><span class="color666">阅读:</span> 000 <br /><span class="color666">写作与翻译:</span> 000 </td> </tr></table>TXT;$match="#<t[hd].*?>(.*?)</t[hd]>#is";preg_match_all($match,$a,$b);$b[1][11] = preg_replace('/\s/', '', strip_tags($b[1][11]));print_r($b[1]);
$a =<<< TXT<table border="0" align="center" cellpadding="0" cellspacing="6" class="cetTable"> <tr> <th>姓名:</th> <td>赵阳</td> </tr> <tr> <th>学校:</th> <td>长春中医药大学</td> </tr> <tr> <th>考试类别:</th> <td>英语四级</td> </tr> <tr> <th>准考证号:</th> <td>220090132112529</td> </tr> <tr> <th>考试时间:</th> <td>2013年12月</td> </tr> <tr> <th valign="top">总分:</th> <td valign="top" class="fontBold"> <span class="colorRed"> 0 </span> <br /><span class="color666">听力:</span> 000 <br /><span class="color666">阅读:</span> 000 <br /><span class="color666">写作与翻译:</span> 000 </td> </tr></table>TXT;$match="#<t[hd].*?>(.*?)</t[hd]>#is";preg_match_all($match,$a,$b);$b[1][11] = preg_replace('/\s/', '', strip_tags($b[1][11]));print_r($b[1]);
内容是变化的,格式是固定的
否则就无所谓“采集”了
内容是变化的,格式是固定的
否则就无所谓“采集”了