Cet article présente principalement le problème des caractères tronqués en PHP. Les amis intéressés peuvent en apprendre davantage. J'espère que cela sera utile à tout le monde. 1. Problème de conversion de page HTML en UTF-8
1. Ajoutez une ligne après l'en-tête et avant le titre :
L'ordre de
ne peut pas être erroné, et le titre affiché dans
peut être tronqué !
Problème d'encodage du fichier 2.html :
Cliquez sur le menu de l'éditeur : "Fichier" -> "Enregistrer sous", vous pouvez voir l'encodage du fichier actuel, assurez-vous que l'encodage du fichier est : UTF -8,
S'il s'agit de ANSI, l'encodage doit être modifié en : UTF-8.
3.Problème de nomenclature d'en-tête de fichier HTML :
Lors de la conversion d'un fichier d'un autre encodage vers un encodage UTF-8, une balise BOM est parfois ajoutée au début du fichier
La balise BOM peut provoquer cela. le navigateur pour afficher des caractères tronqués lors de l'affichage de caractères chinois.
Comment supprimer cette balise BOM :
1. Vous pouvez ouvrir le fichier avec Dreamweaver et le réenregistrer pour supprimer la balise BOM !
2. Vous pouvez ouvrir le fichier avec EditPlus, et dans le menu "Préférences"->"Fichier"->"Signature UTF-8", le régler sur : "Toujours supprimer la signature",
puis enregistrez le fichier , c'est-à-dire que l'étiquette de nomenclature peut être supprimée !
4. Problème d'encodage UTF-8 du serveur WEB :
Si vous suivez les étapes répertoriées ci-dessus et que vous rencontrez toujours des problèmes de chinois tronqué,
Veuillez vérifier le problème d'encodage du serveur WEB que vous utilisez
Si vous utilisez Apache, veuillez définir le jeu de caractères dans le fichier de configuration sur : utf-8 (seules les méthodes sont répertoriées ici, veuillez vous référer au fichier de configuration Apache pour le format spécifique)
Si vous utilisez Nginx, veuillez définir In nginx .conf : charset est défini sur utf-8
Recherchez spécifiquement "charset gb2312;" ou une instruction similaire et remplacez-la par : "charset utf-8;".
2. Problème de conversion d'une page PHP en UTF-8
1. Ajoutez une ligne au début du code :
header("Content-Type: text/. html;charset= utf-8");
2. Problème d'encodage du fichier PHP
Cliquez sur le menu de l'éditeur : "Fichier" -> "Enregistrer sous", vous pouvez voir l'encodage du fichier actuel, assurez-vous que l'encodage du fichier est : UTF-8
S'il s'agit d'ANSI, l'encodage doit être modifié en : UTF-8.
3. Problème de nomenclature d'en-tête de fichier PHP :
Les fichiers PHP ne doivent pas avoir de balises de nomenclature
Sinon, la session ne sera pas utilisable et il y aura des invites similaires :
Attention : session_start() [ fonction .session-start] : Impossible d'envoyer le limiteur de cache de session - en-têtes déjà envoyés
En effet, lors de l'exécution de session_start(), la page entière ne peut pas avoir de sortie, mais lorsque la balise BOM existe dans la page PHP précédente,
PHP considéré cette balise BOM comme sortie, donc une erreur s'est produite !
La page PHP doit donc supprimer la balise BOM
Comment supprimer cette balise BOM :
1 Vous pouvez ouvrir le fichier avec Dreamweaver et le réenregistrer pour supprimer la balise BOM !
2. Vous pouvez ouvrir le fichier avec EditPlus, et dans le menu "Préférences"->"Fichier"->"Signature UTF-8", le régler sur : "Toujours supprimer la signature",
puis enregistrez le fichier , c'est-à-dire que l'étiquette de nomenclature peut être supprimée !
4. Problème d'encodage UTF-8 lorsque PHP enregistre des fichiers en pièces jointes :
Lorsque PHP enregistre des fichiers en pièces jointes, le nom du fichier doit être codé en GB2312,
Sinon, s'il y a du chinois dans le nom du fichier, il affichera des caractères tronqués :
Si votre PHP lui-même est un fichier au format d'encodage UTF-8,
Vous devez convertir la variable de nom de fichier d'UTF-8 en GB2312 :
iconv("UTF-8" , " GB2312", "$filename");
5. Lors de la troncature et de l'affichage du titre de l'article, des caractères tronqués ou des points d'interrogation apparaissent :
Généralement, lorsque le titre de l'article est très long, une partie du titre sera affichée. Tronquer le titre de l'article,
Puisqu'un caractère chinois au format d'encodage UTF-8 occupera 3 caractères de largeur,
Lors de la coupe du titre, parfois seulement 1 caractère ou 2 caractères de largeur d'un caractère chinois sera intercepté,
Si l'interception n'est pas complète, des caractères tronqués ou des points d'interrogation "?" apparaîtront
Utilisez la fonction suivante pour intercepter le titre, et il n'y aura aucun problème :
function get_brief_str($str, $max_length) { echo strlen($str) ."<br>"; if(strlen($str) > $max_length) { $check_num = 0; for($i=0; $i < $max_length; $i++) { if (ord($str[$i]) > 128) $check_num++; } if($check_num % 3 == 0) $str = substr($str, 0, $max_length)."..."; else if($check_num % 3 == 1) $str = substr($str, 0, $max_length + 2)."..."; else if($check_num % 3 == 2) $str = substr($str, 0, $max_length + 1)."..."; } return $str; }
3. Problèmes MYSQL liés à l'utilisation de l'encodage UTF-8 pour les bases de données
1. Utilisez phpmyadmin pour créer des bases de données et des tables de données
Lors de la création d'un base de données, veuillez définir "Organisation" sur : "utf8_general_ci"
Ou exécutez l'instruction :
CREATE DATABASE `dbname` DEFAULTCHARACTER SET utf8 COLLATE utf8_general_ci;
Lors de la création d'une table de données : Si le champ est destiné à stocker le chinois, vous devez définir "Collation". C'est : "utf8_general_ci",
Si le champ stocke l'anglais ou des chiffres, la valeur par défaut est correcte.
Instruction SQL correspondante, par exemple :
CREATE TABLE `test` ( `id` INT NOT NULL , `name` VARCHAR( 10 ) CHARACTER SET utf8 COLLATE utf8_general_ciNOT NULL , PRIMARY KEY ( `id` ) ) ENGINE = MYISAM ;
2. Utilisez PHP pour lire et écrire la base de données
Après vous être connecté à la base de données :
[hide]$connection = mysql_connect($host_name, $host_user, $host_pass);
Rejoignez deux lignes :
mysql_query("set character set 'utf8'");//读库 mysql_query("set names 'utf8'");//写库
et vous pourrez lire et écrire la base de données MYSQL normalement.
4. Problèmes d'encodage UTF-8 liés à JS
JS读Cookie的中文乱码问题
PHP写cookie的时候需要将中文字符进行escape编码,
否则JS读到cookie中的中文字符将是乱码。
但php本身没有escape函数,我们新写一个escape函数:
function escape($str) { preg_match_all("/[\x80-\xff].|[\x01-\x7f]+/",$str,$r); $ar = $r[0]; foreach($ar as $k=>$v) { if(ord($v[0]) < 128) $ar[$k] = rawurlencode($v); else $ar[$k] = "%u".bin2hex(iconv("UTF-8","UCS-2",$v)); } return join("",$ar); }
JS读cookie的时候,用unescape解码,
然后就解决cookie中有中文乱码的问题了。
2.外部JS文件UTF-8编码问题
当一个HTML页面或则PHP页面包含一个外部的JS文件时,
如果HTML页面或则PHP页面是UTF-8编码格式的文件,
外部的JS文件同样要转成UTF-8的文件,
否则将出现,没有包含不成功,调用函数时没有反应的情况。
点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,
如果是ANSI,需要将编码改成:UTF-8。
五.FLASH相关的UTF-8编码问题
FLASH内部对所有字符串,默认都是以UTF-8处理
1.FLASH读文普通本文件(txt,html)
要将文本文件的编码存为UTF-8
点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,
如果是ANSI,需要将编码改成:UTF-8。
2.FLASH读XML文件
要将XML文件的编码存为UTF-8
点击编辑器的菜单:“文件”->“另存为”,可以看到当前文件的编码,确保文件编码为:UTF-8,
如果是ANSI,需要将编码改成:UTF-8。
在XML第1行写:
3.FLASH读PHP返回数据
如果PHP编码本身是UTF-8的,直接echo就可以了
如果PHP编码本身是GB2312的,可以将PHP转存成UTF-8编码格式的文件,直接echo就可以了
如果PHP编码本身是GB2312的,而且不允许改文件的编码格式,
用下面的语句将字符串转换成UTF-8的编码格式
$new_str = iconv("GB2312", "UTF-8", "$str");
再echo就可以了
4.FLASH读数据库(MYSQL)的数据
FLASH要通过PHP读取数据库中的数据
PHP本身的编码不重要,关键是如果数据库的编码是GB2312的话,
需要用下面的语句将字符串转换成UTF-8的编码格式
$new_str = iconv("GB2312", "UTF-8", "$str");
5.FLASH通过PHP写数据
一句话,FLASH传过来的字符串是UTF-8格式的,
要转换成相应的编码格式,再操作(写文件、写数据库、直接显示等等)
还是用iconv函数转换
6.FLASH使用本地编码(理论上不推荐使用)
如果想让FLASH不使用UTF-8编码,而是使用本地编码
对于中国大陆地区而言,本地编码是GB2312或GBK
AS程序内,可以添加以下代码:
System.useCodepage = true;
那么FLASH内所有字符都是使用GB2312的编码了
所有导入到FLASH或者从FLASH导出的数据,都应该做相应的编码转换
因为使用本地编码,会造成使用繁体中文地区的用户产生乱码,所以不推荐使用
相关推荐:
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!