python compte les occurrences de mots

angryTom
Libérer: 2020-02-13 11:09:12
original
9973 Les gens l'ont consulté

python compte les occurrences de mots

Python compte le nombre d'occurrences de mots

Pour faire des statistiques de fréquence de mots, utiliser le dictionnaire est sans aucun doute le plus approprié Type de données. Le mot est utilisé comme clé du dictionnaire et le nombre de fois où le mot apparaît est utilisé comme valeur du dictionnaire. Il est très pratique d'enregistrer la fréquence de chaque mot. Le dictionnaire ressemble beaucoup à notre téléphone. livre, et chaque nom est associé à un numéro de téléphone.

Ce qui suit est le code d'implémentation spécifique, qui lit les mots du fichier importthis.txt et compte les 5 mots avec le plus d'occurrences.

# -*- coding:utf-8 -*-
import io
import re

class Counter:
    def __init__(self, path):
        """
        :param path: 文件路径
        """
        self.mapping = dict()
        with io.open(path, encoding="utf-8") as f:
            data = f.read()
            words = [s.lower() for s in re.findall("\w+", data)]
            for word in words:
                self.mapping[word] = self.mapping.get(word, 0) + 1

    def most_common(self, n):
        assert n > 0, "n should be large than 0"
        return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n]

if __name__ == '__main__':
    most_common_5 = Counter("importthis.txt").most_common(5)
    for item in most_common_5:
        print(item)
Copier après la connexion

Effet d'exécution :

('is', 10)
('better', 8)
('than', 8)
('the', 6)
('to', 5)
Copier après la connexion

Plus de tutoriels Python, apprentissage recommandé : Tutoriel vidéo Python

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal