最近プロジェクトで忙しかったので、数日間ブログを書いていませんでしたが、中国語と英語が混在した文字列をインターセプトする問題がありました。数日間私を困惑させた Smarty テンプレートがついに解決されました。必要な友達が見てください:
文字化けの理由:
文字列インターセプトの場合は、truncate 関数を使用します。は英語ユーザーにのみ適しています。中国語ユーザーの場合、truncate を使用すると文字化けが発生します。また、中国語と英語が混在する文字列では、同じ数の切り取られた文字列でも実際に表示される長さは異なります。1 つの中国語文字の長さはほぼ同じです。英字 2 文字の長さまで。さらに、truncate は GB2312、UTF-8、および他のエンコーディングと同時に互換性がありません。
解決策: 拡張クラスを自分で作成して、
ThinkPHP で使用される Smarty truncate 変数レギュレーターのクラス ファイルの場所: ThinkPHPLibraryVendorSmartyplugins を使用します。そのうちの 1 つは modifier.truncate.php ですが、これは使用しません。実装するために自分で書きます
ファイル名: modifier.smartTruncate.php
<?<span>php </span><span>/*</span><span>* * 中英文多编码字符串截取 </span><span>*/</span><span>function</span> smartDetectUTF8(<span>$string</span><span>) { </span><span>static</span><span>$result</span> = <span>array</span><span>(); </span><span>if</span>(! <span>array_key_exists</span>(<span>$key</span> = <span>md5</span>(<span>$string</span>), <span>$result</span><span>)) { </span><span>$utf8</span> = "<span> /^(?: [\x09\x0A\x0D\x20-\x7E] # ASCII | [\xC2-\xDF][\x80-\xBF] # non-overlong 2-byte | \xE0[\xA0-\xBF][\x80-\xBF] # excluding overlongs | [\xE1-\xEC\xEE\xEF][\x80-\xBF]{2} # straight 3-byte | \xED[\x80-\x9F][\x80-\xBF] # excluding surrogates | \xF0[\x90-\xBF][\x80-\xBF]{2} # planes 1-3 | [\xF1-\xF3][\x80-\xBF]{3} # planes 4-15 | \xF4[\x80-\x8F][\x80-\xBF]{2} # plane 16 )+$/xs </span>"<span>; </span><span>$result</span>[<span>$key</span>] = <span>preg_match</span>(<span>trim</span>(<span>$utf8</span>), <span>$string</span><span>); } </span><span>return</span><span>$result</span>[<span>$key</span><span>]; } </span><span>function</span> smartStrlen(<span>$string</span><span>) { </span><span>$result</span> = 0<span>; </span><span>$number</span> = smartDetectUTF8(<span>$string</span>) ? 3 : 2<span>; </span><span>for</span>(<span>$i</span> = 0; <span>$i</span> < <span>strlen</span>(<span>$string</span>); <span>$i</span> += <span>$bytes</span><span>) { </span><span>$bytes</span> = <span>ord</span>(<span>substr</span>(<span>$string</span>, <span>$i</span>, 1)) > 127 ? <span>$number</span> : 1<span>; </span><span>$result</span> += <span>$bytes</span> > 1 ? 1.0 : 0.5<span>; } </span><span>return</span><span>$result</span><span>; } </span><span>function</span> smartSubstr(<span>$string</span>, <span>$start</span>, <span>$length</span> = <span>null</span><span>) { </span><span>$result</span> = ''<span>; </span><span>$number</span> = smartDetectUTF8(<span>$string</span>) ? 3 : 2<span>; </span><span>if</span>(<span>$start</span> < 0<span>) { </span><span>$start</span> = <span>max</span>(smartStrlen(<span>$string</span>) + <span>$start</span>, 0<span>); } </span><span>for</span>(<span>$i</span> = 0; <span>$i</span> < <span>strlen</span>(<span>$string</span>); <span>$i</span> += <span>$bytes</span><span>) { </span><span>if</span>(<span>$start</span> <= 0<span>) { </span><span>break</span><span>; } </span><span>$bytes</span> = <span>ord</span>(<span>substr</span>(<span>$string</span>, <span>$i</span>, 1)) > 127 ? <span>$number</span> : 1<span>; </span><span>$start</span> -= <span>$bytes</span> > 1 ? 1.0 : 0.5<span>; } </span><span>if</span>(<span>is_null</span>(<span>$length</span><span>)) { </span><span>$result</span> = <span>substr</span>(<span>$string</span>, <span>$i</span><span>); } </span><span>else</span><span> { </span><span>for</span>(<span>$j</span> = <span>$i</span>; <span>$j</span> < <span>strlen</span>(<span>$string</span>); <span>$j</span> += <span>$bytes</span><span>) { </span><span>if</span>(<span>$length</span> <= 0<span>) { </span><span>break</span><span>; } </span><span>if</span>((<span>$bytes</span> = <span>ord</span>(<span>substr</span>(<span>$string</span>, <span>$j</span>, 1)) > 127 ? <span>$number</span> : 1) > 1<span>) { </span><span>if</span>(<span>$length</span> < 1.0<span>) { </span><span>break</span><span>; } </span><span>$result</span> .= <span>substr</span>(<span>$string</span>, <span>$j</span>, <span>$bytes</span><span>); </span><span>$length</span> -= 1.0<span>; } </span><span>else</span><span> { </span><span>$result</span> .= <span>substr</span>(<span>$string</span>, <span>$j</span>, 1<span>); </span><span>$length</span> -= 0.5<span>; } } } </span><span>return</span><span>$result</span><span>; } </span><span>function</span> smarty_modifier_smartTruncate(<span>$string</span>, <span>$length</span> = 80, <span>$etc</span> = '...',<span>$break_words</span> = <span>false</span>, <span>$middle</span> = <span>false</span><span>) { </span><span>if</span> (<span>$length</span> == 0<span>) </span><span>return</span> ''<span>; </span><span>if</span> (smartStrlen(<span>$string</span>) > <span>$length</span><span>) { </span><span>$length</span> -= smartStrlen(<span>$etc</span><span>); </span><span>if</span> (!<span>$break_words</span> && !<span>$middle</span><span>) { </span><span>$string</span> = <span>preg_replace</span>('/\s+?(\S+)?$/', '', smartSubstr(<span>$string</span>, 0, <span>$length</span>+1<span>)); } </span><span>if</span>(!<span>$middle</span><span>) { </span><span>return</span> smartSubstr(<span>$string</span>, 0, <span>$length</span>).<span>$etc</span><span>; } </span><span>else</span><span> { </span><span>return</span> smartSubstr(<span>$string</span>, 0, <span>$length</span>/2) . <span>$etc</span> . smartSubstr(<span>$string</span>, -<span>$length</span>/2<span>); } } </span><span>else</span><span> { </span><span>return</span><span>$string</span><span>; } } </span>?>
注: 文字長を判断するとき、中国語の文字は 1.0 としてカウントされ、英語の文字は 0.5 としてカウントされます。部分文字列をインターセプトすることはできません
使い方:
{<span>$content</span>|smartTruncate:5:"..."}
OK、テストに問題がなければ指摘してください
上記では、smarty テンプレートと thinkphp を含む ThinkPHP+Smarty テンプレートで中国語と英語が混在する文字化けをインターセプトするための解決策を紹介しました。PHP チュートリアルに興味のある友人に役立つことを願っています。