これはレベル4または6のWebサイトです
<table border="0" align="center" cellpadding="0" cellspacing="6" class="cetTable"> <tr> <th>姓名:</th> <td>赵阳</td> </tr> <tr> <th>学校:</th> <td>长春中医药大学</td> </tr> <tr> <th>考试类别:</th> <td>英语四级</td> </tr> <tr> <th>准考证号:</th> <td>220090132112529</td> </tr> <tr> <th>考试时间:</th> <td>2013年12月</td> </tr> <tr> <th valign="top">总分:</th> <td valign="top" class="fontBold"> <span class="colorRed"> 0 </span> <br /><span class="color666">听力:</span> 000 <br /><span class="color666">阅读:</span> 000 <br /><span class="color666">写作与翻译:</span> 000 </td> </tr></table>
$a = curl_exec($ch); $match="#<td>(.*)</td>#"; //$match="#<span>(.*)</span>#";preg_match_all($match,$a,$b);$yourname= $b[1][0];$school= $b[1][1];$cet= $b[1][2];$c= $b[1][5];//分数$score=strip_tags($c);$score=str_replace(" ","",$score); return array('school'=>$school,'name'=>$yourname,'cet'=>$cet,'score'=>$score);
$a =<<< TXT<table border="0" align="center" cellpadding="0" cellspacing="6" class="cetTable"> <tr> <th>姓名:</th> <td>赵阳</td> </tr> <tr> <th>学校:</th> <td>长春中医药大学</td> </tr> <tr> <th>考试类别:</th> <td>英语四级</td> </tr> <tr> <th>准考证号:</th> <td>220090132112529</td> </tr> <tr> <th>考试时间:</th> <td>2013年12月</td> </tr> <tr> <th valign="top">总分:</th> <td valign="top" class="fontBold"> <span class="colorRed"> 0 </span> <br /><span class="color666">听力:</span> 000 <br /><span class="color666">阅读:</span> 000 <br /><span class="color666">写作与翻译:</span> 000 </td> </tr></table>TXT;$match="#<t[hd].*?>(.*?)</t[hd]>#is";preg_match_all($match,$a,$b);$b[1][11] = preg_replace('/\s/', '', strip_tags($b[1][11]));print_r($b[1]);
$a =<<< TXT<table border="0" align="center" cellpadding="0" cellspacing="6" class="cetTable"> <tr> <th>姓名:</th> <td>赵阳</td> </tr> <tr> <th>学校:</th> <td>长春中医药大学</td> </tr> <tr> <th>考试类别:</th> <td>英语四级</td> </tr> <tr> <th>准考证号:</th> <td>220090132112529</td> </tr> <tr> <th>考试时间:</th> <td>2013年12月</td> </tr> <tr> <th valign="top">总分:</th> <td valign="top" class="fontBold"> <span class="colorRed"> 0 </span> <br /><span class="color666">听力:</span> 000 <br /><span class="color666">阅读:</span> 000 <br /><span class="color666">写作与翻译:</span> 000 </td> </tr></table>TXT;$match="#<t[hd].*?>(.*?)</t[hd]>#is";preg_match_all($match,$a,$b);$b[1][11] = preg_replace('/\s/', '', strip_tags($b[1][11]));print_r($b[1]);
(
[0] => 名前:
[1] =>趙陽
[2] =>長春中医薬大学
[4] =>英語レベル4
] = > 入場券番号:
[7] => 220090132112529
[9] => 2013 年 12 月
[11] = > 0 リスニング: 000 リーディング: 000 ライティングと翻訳: 000
)
ただし、$a の内容は変更されるはずです
内容は変更されますが、形式は固定されています
それ以外の場合は、「収集」する必要はありません
最後の行について質問がありますか? > これをあげます
エスケープされていますか? それともエラーが報告されていますか?