Rumah > php教程 > php手册 > teks badan

CP936 转换成 UTF-8

WBOY
Lepaskan: 2016-10-15 10:31:47
asal
3922 orang telah melayarinya

最近写了一个抓取脚本,抓取的大部分内容正常,但少部分乱码

 

检测字符编码,得出的结果是CP936

mb_detect_encoding(<span style="color: #800080;">$str</span>, 'GBK, gb2312, GB18030, ISO-8859-1, ASCII, UTF-8', <span style="color: #0000ff;">true</span>)
Salin selepas log masuk

尝试转换此编码,但得出的结果还是乱码

mb_convert_encoding($str, 'UTF-8', 'CP936');
氓聧掳氓潞娄盲赂聙70氓虏聛猫聙聛氓陇麓莽聦楼盲潞碌7氓虏聛氓楼鲁氓颅漏猫聙聦猫垄芦忙聧聲
Salin selepas log masuk

最后发现,这样可以转码

iconv('utf-8', 'latin1', $str);
Salin selepas log masuk
iconv('utf-8','latin1//IGNORE', $str);
Salin selepas log masuk

  

Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Cadangan popular
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan