Vérifier l'existence de mots anglais avec Python
Vérifier si un mot appartient au lexique anglais est une tâche courante dans le traitement du langage naturel. Python propose plusieurs approches pour résoudre ce problème, l'une étant l'interface nltk WordNet.
Utilisation de l'interface nltk WordNet
<code class="python">from nltk.corpus import wordnet def is_english_word(word): synsets = wordnet.synsets(word) return len(synsets) > 0</code>
Cette fonction vérifie si un mot donné a des synsets (ensembles de synonymes) dans WordNet, indiquant qu'il s'agit d'un mot anglais valide.
Extension aux formes singulières
Pour vérifier la forme singulière d'un mot, vous pouvez utiliser le bibliothèque inflect :
<code class="python">from inflect import engine def is_english_singular(word): singular_form = engine().singular_noun(word) return is_english_word(singular_form)</code>
Solution alternative : PyEnchant
Pour une efficacité et des fonctionnalités accrues, envisagez d'utiliser PyEnchant, une bibliothèque de vérification orthographique dédiée :
<code class="python">import enchant def is_english_word(word): d = enchant.Dict("en_US") return d.check(word)</code>
PyEnchant offre plus de fonctionnalités, telles que des recommandations de mots et la prise en charge de différentes langues.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!