MySQL 中的 Levenshtein 距離模糊匹配如何改善公司名稱自動完成？-mysql教程-PHP中文網

MySQL 中的 Levenshtein 距離模糊匹配如何改善公司名稱自動完成？

Barbara Streisand

發布： 2024-12-06 21:57:17

原創

618 人瀏覽過

How Can Fuzzy Matching with Levenshtein Distance in MySQL Improve Company Name Auto-Completion?

使用PHP 模糊匹配MySQL 中的公司名稱以進行自動補全

背景：

用戶輸入公司名稱為大型字串的一部分，並且您的系統需要自動執行與現有公司名稱資料庫的配對過程。雖然直接的字串匹配可能很慢，但找到保持準確性和效能的最佳解決方案至關重要。

Soundex 索引：

SOUNDEX() 是一個 MySQL 函數，它產生基於字串前幾個字的語音表示。這可以幫助加快搜尋發音相似的公司名稱的速度。然而，它面臨著某些限制：

對較長字串的有限區分
依賴第一個字元進行匹配
MySQL 中的非ASCII 輸入問題

編輯距離：

編輯距離是一種更高級的字串相似度量，它考慮字串中的插入、刪除和替換。這種方法提供了更大的靈活性，但需要更多的計算。

實作：

要在 MySQL 中實現與 Levenshtein 距離的模糊匹配，您可以使用類似可用的儲存函數在 codejanitor.com。此函數接受兩個字串作為輸入並傳回它們的編輯距離。

範例比對：

// Calculate the Levenshtein distance between two names
$distance = levenshtein_distance('Microsoft', 'Microssift');

// Define a threshold for acceptable matches
$max_distance = 2;

if ($distance <= $max_distance) {
    // Suggest the closest match from your database
    $fuzzy_match = get_fuzzy_match('Microssift');
} else {
    // No close match found, suggest no matches
    $fuzzy_match = array();
}

登入後複製

其他注意事項：