Maison > développement back-end > Tutoriel Python > Méthode de jugement de codage de caractères Python

Méthode de jugement de codage de caractères Python

高洛峰
Libérer: 2017-03-01 13:21:16
original
1780 Les gens l'ont consulté

L'exemple de cet article décrit la méthode de jugement de codage de caractères Python. Partagez-le avec tout le monde pour votre référence, les détails sont les suivants :

Méthode 1 :

isinstance(s, str) est utilisée pour déterminer si elle est une chaîne générale
isinstance(s, unicode) est utilisée pour déterminer si elle est unicode

ou


if type(str).__name__!="unicode":
str=unicode(str,"utf-8")
else:
pass
Copier après la connexion


Méthode 2 :

Jugement d'encodage de caractères Python chardet

L'utilisation de chardet peut facilement implémenter la détection de l'encodage de chaîne/fichier. Surtout pour les pages Web chinoises, certaines pages utilisent GBK/GB2312 et certaines utilisent UTF8. Si vous devez explorer certaines pages, il est important de connaître l'encodage de la page Web. Bien que les pages HTML aient des balises charset, elles sont parfois incorrectes. Alors Chardet peut nous aider beaucoup.

instance chardet


>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
>>>chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。
Copier après la connexion


installation chardet

Après avoir téléchargé chardet, décompressez le package compressé chardet, placez le dossier chardet directement dans le répertoire de l'application, puis utilisez import chardet pour commencer à utiliser chardet.

Ou utilisez le fichier d'installation setup.py pour copier chardet dans le répertoire système Python, afin que tous vos programmes Python n'aient besoin que d'importer chardet.

Référence d'installation de python setup.py

Site officiel de Chardet : http://chardet.feedparser.org/
Page de téléchargement de Chardet : http://chardet.feedparser.org/download /

Pour plus d'articles liés aux méthodes de jugement d'encodage de caractères Python, veuillez faire attention au site Web PHP chinois !

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal