MySQL Levenshtein pour une recherche de texte efficace
Cet article explique comment intégrer le puissant algorithme de distance Levenshtein dans MySQL pour une recherche de texte efficace. En utilisant Levenshtein, nous pouvons trouver des mots dans une base de données qui sont « similaires » à un mot d'entrée donné.
Pour illustrer, considérons le code PHP suivant utilisé pour trouver des termes similaires :
$word = strtolower($_GET['term']); $lev = 0; $q = mysql_query("SELECT `term` FROM `words`"); while ($r = mysql_fetch_assoc($q)) { $r['term'] = strtolower($r['term']); $lev = levenshtein($word, $r['term']); if ($lev >= 0 && $lev < 5) { $word = $r['term']; } }
Ce code interroge tous les mots de la base de données, calcule la distance de Levenshtein pour chaque mot et identifie les mots suffisamment similaires à l'entrée word.
Cependant, cette approche n'est pas optimale car elle nécessite de récupérer toutes les lignes et d'effectuer le calcul de Levenshtein en PHP. Pour améliorer l'efficacité, nous pouvons exploiter la puissance de MySQL et introduire une fonction Levenshtein directement dans la requête :
mysql_qery("SELECT `term` FROM `words` WHERE levenshtein('$word', `term`) BETWEEN 0 AND 4");
Cette requête utilise la fonction MySQL levenshtein() pour calculer la distance entre le mot saisi et les mots. dans la base de données. La clause BETWEEN garantit que nous récupérons uniquement les mots qui se trouvent dans une distance Levenshtein spécifiée (dans ce cas, 0 à 4).
En incorporant la fonction Levenshtein dans MySQL, nous évitons d'avoir à gérer le filtrage en PHP. , ce qui permet des recherches de texte plus rapides et plus efficaces.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!