在Python 中讀寫Unicode 文字檔案
處理文字檔案中的Unicode 字元時,Python 提供了多種方法來確保正確處理。嘗試使用encode() 和decode() 方法讀取和寫入Unicode 字串時會出現一個常見問題。
要克服這項挑戰,建議在開啟檔案時指定檔案編碼。隨著Python 2.6中引入io模組,io.open函數變得可用,允許我們指定所需的編碼:
<code class="python">import io # Assuming the file is encoded in UTF-8 f = io.open("test", mode="r", encoding="utf-8") unicodeString = f.read()</code>
在Python 3.x中,io.open函數是一個別名對於內置的open 函數,無需導入。
另一個選擇是使用編解碼器標準庫模組中的open() :
<code class="python">import codecs f = codecs.open("test", "r", "utf-8") unicodeString = f.read()</code>
但是,這種方法可能混合read() 和readline() 操作時會導致相容性問題。
要將Unicode 字串以UTF-8 編碼寫入文件,可以使用以下程式碼片段:
<code class="python"># assumes unicodeString is a Unicode string outputFile = io.open("output.txt", mode="w", encoding="utf-8") outputFile.write(unicodeString)</code>
透過遵循這些準則,您可以確保在Python 中讀寫文字檔案時正確處理Unicode 字元。
以上是如何在 Python 中讀寫 Unicode 文字檔?的詳細內容。更多資訊請關注PHP中文網其他相關文章!