再版: http://www.169it.com/blog_article/601549531.html
このセクションの主な内容:
キーワード置換クラス
は、主にキーワードのフィルタリング、またはキーワードの検索と置換に使用できます。
実装プロセスの分析:
キーワードの置換は、実際には str_replace() プロセスです。単純な str_replace が 10W のキーワードに直面した場合、1W の単語の記事を書くのにかかる時間はわずか約 2 秒です。
問題:
キーワードが複数回置換されています。たとえば、a を a に置換する必要がありますが、結果は a になる可能性があります。 ; など。
このため、置換されたタグを保護し、記事を処理する前に[_tnum_]などのタグを置換し、記事の処理後に元に戻す方法が必要です。
別の質問ですが、キーワードまたは記事に [_tnum_] 自体がある場合、これを除外する必要があります。ここでは str_replace を使用できませんが、正規表現で除外するには preg_replace を使用する必要があります。
3 番目の質問は、2 つのキーワード a と ab がある場合はどうなるでしょうか。最初に長いものを照合し、次に短いものを照合したいので、照合する前にそれらを並べ替える必要があります。
最後の質問ですが、str_replace を preg_replace に変更すると、同じ段落の 100,000 回の一致に 5 秒かかります。その場合、strpos を使用して最初に 100,000 個のキーワードを検索します。クエリには 1 秒もかかりません。 100万でも8秒以上かかります。
キーワード一致置換クラス、コード:
コード例:
/*
* キーワード一致クラス
* @author ylx
* @ packet mipang
* 使用例
* $str = "緑の殻の卵の鶏は来年ファンデルサールを広げます、来年1は部屋を広げますルーカス地方軍";
* $key = new KeyReplace($str,array ("xxxx"= >"sadf","来年 1"=>'http://baidu.com',"来年"=>'google.com'));
* echo $ key->getResultText() ;
* echo $key->getRuntime();
*/
class KeyReplace
{
private $keys = array();
private $text = "";
private $runtime = 0;
private $url = true;
private $stopkeys = array();
private $all = false;
/**
* @access public
* @param string $text は処理する記事を指定します
* @param array $keys は辞書のフレーズを指定します array(key=>url,...) url は配列でも構いませんランダムに置き換えられる配列 そのうちの 1 つ
* @param array $stopkeys はストップワードを指定します array(key,...) この中の単語は処理されません
* @param boolean $url true は、リンク、そうでない場合のみ置換されます
* @param boolean $all true は、見つかったすべての単語を置換することを意味し、それ以外の場合は最初のみ置換します
*/
public function __construct($text='',$keys=array( ),$url=true, $stopkeys=array(),$all=false) {
$this->keys = $keys;
$this->text = $text;
$this->url = $url;
$this- >stopkeys = $stopkeys;
$this->all = $all;
}
/**
* 加工された記事を取得します
* @access public
* @return string text
*/
public function getResultText() {
$start = microtime( true);
$keys = $this->hits_keys();
$keys_tmp = array_keys()($keys);
function cmp($a, $b){
if (mb_strlen($a) = = mb_strlen($b)) {
return 0;
}
return (mb_strlen($a) < mb_strlen($b)) ? 1 : -1;
}
usort($keys_tmp,"cmp");
foreach($keys_tmp as $key){
if(is_array($keys[$key])){
$url = $keys[$key][rand(0,count($keys[$key]) -1)];
} else
$url = $keys[$key];
$this->text = $this->r_s($this->text,$key,$url);
}
$this-> ;runtime = microtime(true)-$start;
return $this->text;
}
/**
* 処理時間を取得します
* @access public
* @return float
*/
public function getRuntime() {
return $this->runtime;
}
/**
* キーワードを設定します
* @access public
* @param array $keys array(key=>url,...)
*/
public function setKeys($keys) {
$this->keys = $keys;
}
/**
* ストップワードを設定します
* @access public
* @param array $keys array(key,...)
*/
public function setStopKeys($keys) {
$this->stopkeys = $keys;
}
/**
* 記事を設定します
* @access public
* @param string $text
*/
public function setText($text) {
$this->text = $text;
}
/**
* 文字列内のヒットキーワードを検索するために使用されます
* @access public
* @return array $keys 一致した単語の array(key=>url,...) を返します
*/
public function Hist_keys(){
$ar = $this->keys;
$ar = $ar?$ar:array();
$result=array();
$str = $this->text;
foreach($ar as $k=>$url){
$k = トリム($k);
if(!$k)
Continue;
if(strpos( $str,$k)!==false && !in_array($k,$this->stopkeys)){
$result[$k] = $url;
}
}
return $result?$result:array ();
}
/**
* 文字列内のヒット ストップ ワードを検索するために使用されます
* @access public
* @return array $keys 一致した単語の array(key,...) を返します
*/
public function Hist_stop_keys(){
$ar = $this->stopkeys;
$ar = $ar?$ar:array();
$result =array();
$str = $this->text;
foreach($ar as $k){
$k = トリム($k);
if(!$k)
Continue;
if(strpos ($str,$k)!==false && in_array($k,$this->stopkeys)){
$result[] = $k;
}
}
return $result?$result:array() ;
}
/**
* 置き換え処理を行う
* @access private
* @param string $text 置き換えられた人物
* @param string $key Keyword
* @param string $url リンク
* @return string $text 加工された記事
*/
プライベート関数 r_s($text,$key,$url){
$tmp = $text;
$stop_keys = $this->hits_stop_keys();
$stopkeys = $tags = $a = array();
if(preg_match_all("#]+>[^<]*]*> ;#su",$tmp,$m)){
$a=$m[0];
foreach($m[0] as $k=>$z){
$z = preg_replace("# ##s","#",$z);
$tmp = preg_replace('#'.$z.'#s',"[_a".$k."_]",$tmp,1) ;
}
};
if(preg_match_all("#<[^>]+>#s",$tmp,$m)){
$tags = $m[0];
foreach( $m[0] as $k=>$z){
$z = preg_replace("###s","#",$z);
$tmp = preg_replace('#'.$z.' #s',"[_tag".$k."_]",$tmp,1);
}
}
if(!empty($stop_keys)){
if(preg_match_all("#".implode(" |",$stop_keys)."#s",$tmp,$m)){
$stopkeys = $m[0];
foreach($m[0] as $k=>$z){
$ z = preg_replace("###s","#",$z);
$tmp = preg_replace('#'.$z.'#s',"[_s".$k."_]", $tmp,1);
}
}
}
$key1 = preg_replace("#([#()[]*])#s","\\$1",$key);
if($this->url)
$tmp = preg_replace("#(?![_s|[_a|[_|[_t|[_ta|[_tag)".$key1."(?!agd+ _]|gd+_]|d+_]|sd+_]|_])#us",''.$key.' a>',$tmp,$this->all?-1:1);
else
$tmp = preg_replace("#(?![_s|[_a|[_|[_t|[_ta|[_tag )".$key1."(?!agd+_]|gd+_]|d+_]|sd+_]|_])#us",$url,$tmp,$this->all? -1:1);
if(!empty($a)){
foreach($a as $n=>$at){
$tmp = str_replace("[_a".$n." _]",$at,$tmp);
}
}
if(!empty($tags)){
foreach($tags as $n=>$at){
$tmp = str_replace ("[_tag".$n."_]",$at,$tmp);
}
}
if(!empty($stopkeys)){
foreach($stopkeys as $n=> $at){
$tmp = str_replace("[_s".$n."_]",$at,$tmp);
}
}
return $tmp;
}
}
以上、php リンクの置き換えを介して繰り返しの置き換えを回避し、側面の内容も含めて原文とのつながりを維持し、PHP 教則に関心のある友人の助けになることを望みます。