ホームページ >バックエンド開発 >PHPの問題 >PHP中国語URLトランスコードの実装方法

PHP中国語URLトランスコードの実装方法

藏色散人
藏色散人オリジナル
2020-07-21 10:52:403676ブラウズ

PHP では、urlencode 関数または rawurlencode 関数を使用して URL をトランスコードできます。構文は、それぞれ「urlencode (string str)」および「rawurldecode (string str)」です。

PHP中国語URLトランスコードの実装方法

php 中国語 URL トランスコーディング

PHP で URL をエンコードするには、次のようにします。 urlencode() または rawurlencode() の違いは、前者はスペースを ' ' としてエンコードし、後者はスペースを ' ' としてエンコードすることです。ただし、エンコード時に URL の一部のみをエンコードする必要があることに注意してください。コロンとバックスラッシュもエスケープされます。

次は詳細な説明です:

string urlencode ( string str)

文字列を返します。この文字列内の -_ を除くすべての英数字以外の文字は、パーセント記号 (%) とその後に続く 2 つの 16 進数に置き換えられます。数字、スペースはプラス記号 ( ) としてエンコードされます。このエンコーディングは、WWW フォーム POST データのエンコーディングと同じであり、application/x-www-form-urlencoded メディア タイプと同じエンコーディングです。歴史的な理由により、このエンコーディングは、スペースをプラス記号 ( ) としてエンコーディングする点で RFC1738 エンコーディング (rawurlencode() を参照) とは異なります。この関数を使用すると、文字列をエンコードして URL のリクエスト部分で使用することが簡単になります。また、変数を次のページに渡すのも簡単になります:

推奨: "PHP チュートリアル"

例 1. urlencode() 例

<?php
echo &#39;<a href="mycgi?foo=&#39;, urlencode($userinput), &#39;">&#39;;
?>

注: HTML エンティティと一致する変数には注意してください。 &、©、£ などの文字はブラウザによって解析され、予期される変数名の代わりに実際のエンティティが使用されます。これは明らかな混乱であり、W3C は数年にわたって人々にこのことについて警告してきました。参照アドレス: http://www.w3.org/TR/html4/appendix/notes.html#h-B.2.2 PHP は、arg_separator .ini ディレクティブを通じて、パラメータ区切り文字を W3C が推奨するセミコロンに変更することをサポートしています。残念ながら、ほとんどのユーザー エージェントはフォーム データをセミコロン区切り形式で送信しません。より簡単な解決策は、区切り文字として & の代わりに & を使用することです。このために PHP の arg_separator を変更する必要はありません。そのままにして、htmlentities(urlencode($data)) を使用して URL をエンコードします。

例 2. urlencode() と htmlentities() 例

<?php
echo &#39;<a href="mycgi?foo=&#39;, htmlentities(urlencode($userinput)), &#39;">&#39;;
?>

string urlencode (string str)

この文字列内の文字列を返します。 すべて非-_. を除く英数字はパーセント記号 (%) とその後に続く 2 桁の 16 進数に置き換えられます。 RFC 1738 で説明されているこのエンコーディングは、リテラル文字が特別な URL 区切り文字として解釈されないように保護し、トランスポート メディア (一部のメール システムなど) で使用される文字変換によって URL 形式が文字化けしないようにすることを目的としています。たとえば、FTP URL にパスワードを含める場合:

例 1. rawurlencode() 例 1

<?php
echo &#39;<a href="ftp://user:&#39;, rawurlencode(&#39;foo @+%/&#39;),
   &#39;@ftp.my.com/x.txt">&#39;;
?>

または、 URL の PATH_INFO 構成 情報の一部を渡します:

例 2. rawurlencode() 例 2

<?php
echo &#39;<a href="http://x.com/department_list_script/&#39;,
   rawurlencode(&#39;sales and marketing/Miami&#39;), &#39;">&#39;;
?>

デコード時に、対応して urldecode() と rawurldecode() を使用できます。したがって、 rawurldecode() はプラス記号 (' ') をスペースにデコードしませんが、 urldecode() はデコードできます。詳細な例は次のとおりです。

string urldecode ( string str)

指定されたエンコードされた文字列内の任意の %## をデコードします。デコードされた文字列を返します。

例 1. urldecode() example

<?php
$a = explode(&#39;&&#39;, $QUERY_STRING);
$i = 0;
while ($i < count($a)) {
   $b = split(&#39;=&#39;, $a[$i]);
   echo &#39;Value for parameter &#39;, htmlspecialchars(urldecode($b[0])),
   &#39; is &#39;, htmlspecialchars(urldecode($b[1])), "<br />\n";
   $i++;
}
?>

string rawurldecode (string str)

文字列、この文字を返します。文字列内のパーセント記号 (%) の後に 2 つの 16 進数が続く場合は、リテラル文字に置き換えられます。

例 1. rawurldecode() の例

<?php
echo rawurldecode(&#39;foo%20bar%40baz&#39;); // foo bar@baz
?>

ただし、urldecode() と rawurldecode() によってデコードされた文字列は UTF -8 形式であることに注意してください。 URL に中国語が含まれており、ページ設定が UTF-8 ではない場合、デコードされた文字列を正常に表示するには変換する必要があります。

もう 1 つ問題があります。つまり、取得された URL は %%nn n={0..F} の形式ではなく、%unnnn n={0..F} の形式です。 urldecode() と rawurldecode() は正しくデコードできないため、正しくデコードするには次の関数を使用する必要があります:

function utf8RawUrlDecode ($source)
{
    $decodedStr = "";
    $pos = 0;
    $len = strlen ($source);
    while ($pos < $len) {
        $charAt = substr ($source, $pos, 1);
        if ($charAt == &#39;%&#39;) {
            $pos++;
            $charAt = substr ($source, $pos, 1);
            if ($charAt == &#39;u&#39;) {
                // we got a unicode character
                $pos++;
                $unicodeHexVal = substr ($source, $pos, 4);
                $unicode = hexdec ($unicodeHexVal);
                $entity = "&#". $unicode . &#39;;&#39;;
                $decodedStr .= utf8_encode ($entity);
                $pos += 4;
            }
            else {
                // we have an escaped ascii character
                $hexVal = substr ($source, $pos, 2);
                $decodedStr .= chr (hexdec ($hexVal));
                $pos += 2;
            }
        } else {
            $decodedStr .= $charAt;
            $pos++;
        }
    }
    return $decodedStr;
} 

以上がPHP中国語URLトランスコードの実装方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。