洪恩在线成语词典小偷程序php版_php技巧-php教程-PHP中文网

主要函数是file_get_contents，主程序分两段，跟我一起看过来吧（凡人博客原创代码，转载请注明）。

 
function escape($str){ 
preg_match_all('/[x80-xff].|[x01-x7f] /',$str,$r); 
$ar = $r[0]; 
foreach($ar as $k=>$v){ 
if(ord($v[0]) < 128) 
$ar[$k] = rawurlencode($v); 
else 
$ar[$k] = '%u'.bin2hex(iconv('GB2312','UCS-2',$v)); 
} 
return join('',$ar); 
} 

上面的函数主要是用php实现JavaScript的escape编码过程，因为洪恩的查询接口需要传递过去的值是经过escape编码后的成语条目。

复制代码代码如下:

function chacy($chengyu){
$chengyu=escape($chengyu);
$text=@file_get_contents('http://study.hongen.com/dict/ndsearchchengyu.aspx?type=exact&word='.$chengyu);
$pos1=strpos($text,'');
$pos2=strrpos($text,'

');
$text=substr($text,$pos1,$pos2-$pos1);
//把字符集由原来的UTF-8转换到GB2312，注意在GB2312之后加上了//IGNORE，强制遇到特殊字符也继续转换，因为在遇到汉字“一”的时候iconv函数会终止转换
$text=iconv('UTF-8','GB2312//IGNORE',$text);
if (strpos($text,'出处')){
return $text;
}
}

上面是自己定义的成语查询函数，首先escape编码要查询的成语条目，然后使用file_get_contents函数获取“http://study.hongen.com/dict/ndsearchchengyu.aspx?type=exact&word=”页面查询的内容，使用substr去除前后一些不需要的多余代码，中间就是成语条目的解释部分（包括拼音、解释、出处、例句），最后记得要转码，洪恩返回的结果是UTF-8编码，一般情况下我们需要转换为GB2312编码，上面我写了一个有关iconv函数转换编码有时会出现bug的注释文本，需要加上一个//IGNORE参数。最后判断结果中是否存在“出处”二字，有的话说明整个函数运行成功，可以把获取到的内容return给页面了。

程序主体实现完成，只需在相应位置调用查询函数：chacy 就可以了。