Mendapatkan Metrik Persamaan Rentetan dalam Python
Menentukan persamaan antara rentetan ialah tugas penting dalam pelbagai aplikasi pemprosesan bahasa semula jadi. Python menawarkan perpustakaan yang mantap untuk membantu dalam usaha ini.
Pendekatan:
Untuk mengira metrik persamaan antara dua rentetan, modul difflib menyediakan Kelas SequenceMatcher. Kelas ini menilai persamaan antara dua jujukan (rentetan dalam kes ini) menggunakan algoritma yang berbeza, termasuk algoritma urutan sepunya terpanjang (LCS).
Pelaksanaan:
from difflib import SequenceMatcher def similar(a, b): return SequenceMatcher(None, a, b).ratio()
Fungsi serupa menerima dua rentetan, a dan b, dan mengembalikan nilai perpuluhan yang mewakili kesamaan antara mereka, antara 0 (tiada persamaan) hingga 1 (persamaan sempurna).
Penggunaan:
print(similar("Apple", "Appel")) # Expected output: 0.8 (high similarity) print(similar("Apple", "Mango")) # Expected output: 0.0 (low similarity)
Dalam contoh ini, persamaan antara "Apple" dan "Appel" adalah tinggi, menunjukkan kebarangkalian tinggi untuk persamaan, manakala persamaan antara "Apple" dan "Mangga" adalah rendah, menunjukkan kebarangkalian persamaan yang rendah.
Atas ialah kandungan terperinci Bagaimanakah `difflib` Python Boleh Mengira Persamaan Rentetan dengan Cekap?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!