jeu de caractères

Connaissance clé des jeux de caractères

Nous avons seulement besoin de savoir :

1. Jeux de caractères couramment utilisés

Quel jeu de caractères utilisons-nous dans la base de données

2. 🎜>Jeu de caractères anglais :

QQ截图20161009151258.png

ASCII


Le code ASCII utilise une combinaison de nombres binaires spécifiée de 7 ou 8 bits pour représenter 128 ou 256 caractères possibles. Le code ASCII standard, également appelé code ASCII de base, utilise des nombres binaires de 7 bits pour représenter toutes les lettres majuscules et minuscules, les chiffres de 0 à 9, les signes de ponctuation et les caractères de contrôle spéciaux utilisés en anglais américain.
Parmi eux :
0~31 et 127 (33 au total) sont des caractères de contrôle ou des caractères spécifiques à la communication (les autres sont des caractères affichables), tels que les caractères de contrôle : LF (saut de ligne), CR (retour chariot ), FF ( Saut de page), DEL (suppression), BS (retour arrière), BEL (sonnerie), etc. caractères spéciaux de communication : SOH (tête de texte), EOT (fin de texte), ACK (confirmation), etc. .; Les valeurs ASCII sont 8, 9, 10 et 13 sont respectivement converties en caractères de retour arrière, de tabulation, de saut de ligne et de retour chariot. Ils n'ont pas d'affichage graphique spécifique, mais auront des effets différents sur l'affichage du texte selon l'application.
32~126 (95 au total) sont des caractères (32 est un espace), dont 48~57 sont dix chiffres arabes de 0 à 9.

Les chiffres 65 à 90 sont 26 lettres anglaises majuscules, les chiffres 97 à 122 sont 26 lettres anglaises minuscules, et le reste est constitué de signes de ponctuation, de symboles arithmétiques, etc.

GBK

GBK est rétrocompatible avec l'encodage GB 2312. Il s'agit d'une spécification de codage informatique de caractères chinois définie par la République populaire de Chine. La version antérieure est GB2312.

Unicode

Unicode (Unicode, Universal Code, Unicode) Unicode est un système de codage de caractères développé par des organisations internationales qui peut s'adapter à tous les textes et symboles du monde. Pour répondre aux exigences de conversion et de traitement de texte multilingue et multiplateforme.

UTF-8

est un codage de caractères de longueur variable pour Unicode, et c'est également un code universel. Parce qu'UNICODE prend deux fois plus d'espace que l'ASCII et que l'octet de poids fort 0 n'est d'aucune utilité pour l'ASCII. Afin de résoudre ce problème, certains jeux de caractères de format intermédiaire sont apparus. Ils sont appelés formats de conversion universels, c'est-à-dire UTF (Universal Transformation Format)

L'encodage à utiliser dans le travail réel

Les jeux de caractères couramment utilisés en chinois sont divisés en utf-8 et GBK.

L'utilisation réelle est la suivante :

QQ截图20161009151421.png


En observant les caractéristiques de (Figure 1), vous constaterez que le jeu de caractères MySQL se compose de trois parties :
1. Jeu de caractères
2. Langue
3. Type

Le dernier bac fait référence au jeu de caractères binaires, et le ci suivant fait référence à la taille du caractères qui ne sont pas distingués lors du stockage et du tri de l'écriture.


Remarque :

Mysql écrit utf8 lors de l'écriture de utf-8. N'ajoutez pas la ligne horizontale médiane.


(Photo 1)

QQ截图20161009151437.png

<🎜>

1. À propos du jeu de caractères MySQL

La prise en charge du jeu de caractères MySQL (Character Set Support) a deux aspects :

Le jeu de caractères (Character set) et la méthode de tri (Collation).

La prise en charge des jeux de caractères MySQL est affinée à quatre niveaux : serveur, base de données, table et connexion.

La spécification du jeu de caractères MySQL peut être affinée selon le jeu de caractères à utiliser pour une base de données, une table et une colonne.

2. Afficher le jeu de caractères MySQL

2.1. Afficher les paramètres du jeu de caractères

mysql> show variables like 'character_set_%';

QQ截图20161009151450.png


2.2. Afficher les paramètres de tri du jeu de caractères

mysql> show variables like 'collation_%';

QQ截图20161009151503.png


3. Modifier le jeu de caractères MySQL

3.1 Modifier le jeu de caractères au niveau du serveur

a. Modification temporaire

mysql>SET GLOBAL character_set_server=utf8;

b. Modification permanente

Ouvrez /etc/mysql/my.cnf et ajoutez un jeu de caractères après. [mysqld] server=utf8

3.2 Modifier le niveau de la base de données

a Changement temporaire

mysql>SET GLOBAL character_set_database=utf8;

b Changement permanent

Changez simplement le niveau du serveur

3.3 Modifier le niveau du tableau

mysql>ALTER TABLE table_name DEFAULT CHARSET utf8;

Les changements prendront effet de façon permanente

3.4 Modifier l'exemple de modification au niveau des colonnes

mysql>ALTER TABLE `products` CHANGE `products_model` VARCHAR( 20 ) CHARACTER SET utf8 COLLATE utf8_general_ci NULL DEFAULT NULL; 更改了后永久生效

3.5 Modifier le caractère de connexion set

a. Modification temporaire : mysql> SET GLOBAL Character_set_client;

b. Modification permanente : ouvrez /etc/mysql/my.cnf, ajoutez default-character-set=utf8

après [client]


Formation continue
||
<?php echo "Hello Mysql"; ?>
soumettreRéinitialiser le code
  • Recommandations de cours
  • Téléchargement du didacticiel