python difflib模組詳解-Python教學-PHP中文網

python difflib模組詳解

巴扎黑

發布： 2017-09-15 10:45:35

原創

6139 人瀏覽過

這篇文章主要為大家詳細介紹了python difflib模組的範例，具有一定的參考價值，有興趣的小夥伴們可以參考一下

difflib模組提供的類別和方法用來進行序列的差異化比較，它能夠比對檔案並產生差異結果文字或html格式的差異化比較頁面，如果需要比較目錄的不同，可以使用filecmp模組。

class difflib.SequenceMatcher

這類提供了比較任意可雜湊類型序列對方法。此方法將尋找沒有包含‘垃圾'元素的最大連續匹配序列。

透過演算法的複雜度比較，它由於原始的完形匹配演算法，在最壞情況下有n的平方次運算，在最好情況下，具有線性的效率。

它具有自動垃圾啟發式，可以將重複超過片段1%或重複200次的字元當作垃圾來處理。可以透過將autojunk設定為false關閉該功能。

class difflib.Differ

此類比較的是文字行的差異並且產生適合人類閱讀的差異結果或增量結果，結果中各部分的表示如下：

python difflib模組詳解

class difflib.HtmlDiff

此類可以用來建立HTML表格(或說包含表格的html檔) ，兩邊對應展示或行對行的展示比對差異結果。

make_file(fromlines, tolines [, fromdesc][, todesc][, context][, numlines])

make_table(fromlines, tolines [, fromdesc][, todesc][, context ][, numlines])

以上兩個方法都可以用來產生包含一個內容為比對結果的表格的html文件，並且部分內容會高亮顯示。

difflib.context_diff(a, b[, fromfile][, tofile][, fromfiledate][, tofiledate][, n][, lineterm])

#比較a與b(字串列表)，並且傳回一個差異文字行的生成器
範例：

>>> s1 = [&#39;bacon\n&#39;, &#39;eggs\n&#39;, &#39;ham\n&#39;, &#39;guido\n&#39;]
>>> s2 = [&#39;python\n&#39;, &#39;eggy\n&#39;, &#39;hamster\n&#39;, &#39;guido\n&#39;]
>>> for line in context_diff(s1, s2, fromfile=&#39;before.py&#39;, tofile=&#39;after.py&#39;):
...   sys.stdout.write(line) 
*** before.py
--- after.py
***************
*** 1,4 ****
! bacon
! eggs
! ham
 guido
--- 1,4 ----
! python
! eggy
! hamster
 guido

登入後複製

difflib.get_close_matches(word, possibilities [, n][, cutoff])

傳回最大符合結果的清單

#範例：

>>> get_close_matches(&#39;appel&#39;, [&#39;ape&#39;, &#39;apple&#39;, &#39;peach&#39;, &#39;puppy&#39;])
[&#39;apple&#39;, &#39;ape&#39;]
>>> import keyword
>>> get_close_matches(&#39;wheel&#39;, keyword.kwlist)
[&#39;while&#39;]
>>> get_close_matches(&#39;apple&#39;, keyword.kwlist)
[]
>>> get_close_matches(&#39;accept&#39;, keyword.kwlist)
[&#39;except&#39;]

登入後複製

difflib.ndiff(a, b[, linejunk][, charjunk])

比較a與b(字串清單)，傳回一個Differ-style 的差異結果

範例：

>>> diff = ndiff(&#39;one\ntwo\nthree\n&#39;.splitlines(1),
...       &#39;ore\ntree\nemu\n&#39;.splitlines(1))
>>> print &#39;&#39;.join(diff),
- one
? ^
+ ore
? ^
- two
- three
? -
+ tree
+ emu

登入後複製

difflib.restore(sequence, which)

傳回一個由兩個比對序列產生的結果

範例

>>> diff = ndiff(&#39;one\ntwo\nthree\n&#39;.splitlines(1),
...       &#39;ore\ntree\nemu\n&#39;.splitlines(1))
>>> diff = list(diff) # materialize the generated delta into a list
>>> print &#39;&#39;.join(restore(diff, 1)),
one
two
three
>>> print &#39;&#39;.join(restore(diff, 2)),
ore
tree
emu

登入後複製

difflib.unified_diff(a, b[, fromfile][, tofile][, fromfiledate][, tofiledate ][, n][, lineterm])

比較a與b(字串列表)，傳回一個unified diff格式的差異結果.

範例：

>>> s1 = [&#39;bacon\n&#39;, &#39;eggs\n&#39;, &#39;ham\n&#39;, &#39;guido\n&#39;]
>>> s2 = [&#39;python\n&#39;, &#39;eggy\n&#39;, &#39;hamster\n&#39;, &#39;guido\n&#39;]
>>> for line in unified_diff(s1, s2, fromfile=&#39;before.py&#39;, tofile=&#39;after.py&#39;):
...  sys.stdout.write(line) 
--- before.py
+++ after.py
@@ -1,4 +1,4 @@
-bacon
-eggs
-ham
+python
+eggy
+hamster
 guido

登入後複製

實際應用範例

比對兩個文件，然後產生一個展示差異結果的HTML文件

#coding:utf-8
&#39;&#39;&#39;
file:difflibeg.py
date:2017/9/9 10:33
author:lockey
email:lockey@123.com
desc:diffle module learning and practising 
&#39;&#39;&#39;
import difflib
hd = difflib.HtmlDiff()
loads = &#39;&#39;
with open(&#39;G:/python/note/day09/0907code/hostinfo/cpu.py&#39;,&#39;r&#39;) as load:
 loads = load.readlines()
 load.close()

mems = &#39;&#39;
with open(&#39;G:/python/note/day09/0907code/hostinfo/mem.py&#39;, &#39;r&#39;) as mem:
 mems = mem.readlines()
 mem.close()

with open(&#39;htmlout.html&#39;,&#39;a+&#39;) as fo:
 fo.write(hd.make_file(loads,mems))
 fo.close()

登入後複製

運行結果：

python difflib模組詳解