社群學習工具庫休閒

繁体中文

首頁 > 後端開發 > Python教學 > python 採集中文亂碼問題的方法

python 採集中文亂碼問題的方法

高洛峰

發布： 2017-02-24 15:31:42

原創

1433 人瀏覽過

最近幾日遇到採集某網頁的時候大部分網頁OK,少部分網頁出現亂碼的問題,調試了幾日,終於發現了是含有一些非法字符造成的..特此記錄

#1. 在正常情況下..可以用

import chardet

thischarset = chardet.detect(strs)["encoding"]

登入後複製

來取得該檔案或頁面的編碼方式

或直接抓取頁面的charset = xxxx 來取得

2. 遇到內容中有特殊字元時指定的編碼一樣會造成亂碼..即內容中非法字元造成的,可以採用編碼忽略非法字元的方式來處理.

strs = strs.decode("UTF-8","ignore").encode("UTF-8")

登入後複製

decode的第二個參數表示遇到非法字元時所採取的方式

此參數預設為拋出異常.

以上就是小編為大家帶來的python 採集中文亂碼問題的完美解決方法的全部內容了，希望對大家有所幫助，多多支持PHP中文網

更多python 採集中文亂碼問題的方法相關文章請關注PHP中文網！

相關標籤：

python 中文乱码

來源：php.cn

上一篇：Python黑帽程式設計 3.4 跨越VLAN 下一篇：20招讓你的Python飛起來

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

作者最新文章

html設定加粗、傾斜、底線、刪除線等字型效果範例介紹

1970-01-01 08:00:00
實作一個 Java 版的 Redis

1970-01-01 08:00:00
最簡單的微信小程式Demo

1970-01-01 08:00:00
python中pandas.DataFrame（建立、索引、增加與刪除）的簡單操作方法介紹

1970-01-01 08:00:00
微信小程式：如何實作tabs選項卡效果範例

1970-01-01 08:00:00
Python建構自訂方法來美化字典結構輸出

1970-01-01 08:00:00
HTML5:使用Canvas即時處理Video

1970-01-01 08:00:00
Asp.net使用SignalR實作傳送圖片

1970-01-01 08:00:00
微信小程式開發教程-App()和Page()函數概述

1970-01-01 08:00:00
詳解python redis使用方法

1970-01-01 08:00:00

最新問題

有沒有辦法強制彈性框中的文字垂直居中，無論我們有什麼其他 CSS 程式碼？我有以下CSS程式碼，它是我正在開發的網站中使用的更大CSS程式碼的一部分：.cards-u{display:flex;flex-wrap:wrap;justify-content...

來自於 2024-04-06 20:41:51

0

1

518

為什麼省略 0ms sleep 會破壞我的 css 轉換？我正在嘗試實現FLIP動畫，看看我是否理解正確。在這個程式碼筆中（請原諒糟糕的程式碼，我只是在亂搞），如果我註解掉睡眠，平滑過渡將不再有效。 div突然改變位置。這很奇怪，因為睡眠...

來自於 2024-04-06 16:29:50

0

2

490

在Laravel中以Bootstrap模式展示AWS PDF文件我已經下載了awsurl，例如https://xxx-xx-dev.s3.ap-south-1.amazonaws.com/std_check/655712202215174539...

來自於 2024-04-04 22:16:18

0

1

1450

嘗試了一切方法，但HTML內容仍未顯示基本上，html文檔的內容不會在瀏覽器上顯示任何內容。我製作的這個HTML文件是從另一個html文件連結的。當我在瀏覽器上開啟這個HTML檔案時，它是空白的，當其中有明確的程式碼時...

來自於 2024-04-04 19:16:15

0

1

3496

將 HTTPS 重新導向與重寫規則結合無法新增 .php 副檔名希望有人能夠提供協助。我想從內部連結中刪除檔案副檔名(.php)，但當然我需要先在htaccess中進行設定。我相信正確的程式碼是RewriteEngineOnRewriteCon...

來自於 2024-04-04 15:44:30

0

1

299

相關專題

更多>

熱門推薦

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1421228
php入門教程之一週學會PHP

4264933
JAVA 初級入門影片教學

2516010
小甲魚零基礎入門學習Python影片教學

506192
PHP 零基礎入門教學

861303

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板