Python zählt die Anzahl der Wortvorkommen
Um Worthäufigkeitsstatistiken zu erstellen, ist die Verwendung von Wörterbuch zweifellos am besten geeignet Der Datentyp wird als Schlüssel des Wörterbuchs verwendet, und die Häufigkeit, mit der das Wort erscheint, wird als Wert des Wörterbuchs verwendet. Es ist sehr praktisch, die Häufigkeit jedes Worts aufzuzeichnen Buch, und jedem Namen ist eine Telefonnummer zugeordnet.
Das Folgende ist der spezifische Implementierungscode, der Wörter aus der Datei importthis.txt liest und die 5 Wörter zählt, die am häufigsten vorkommen.
# -*- coding:utf-8 -*- import io import re class Counter: def __init__(self, path): """ :param path: 文件路径 """ self.mapping = dict() with io.open(path, encoding="utf-8") as f: data = f.read() words = [s.lower() for s in re.findall("\w+", data)] for word in words: self.mapping[word] = self.mapping.get(word, 0) + 1 def most_common(self, n): assert n > 0, "n should be large than 0" return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n] if __name__ == '__main__': most_common_5 = Counter("importthis.txt").most_common(5) for item in most_common_5: print(item)
Ausführungseffekt:
('is', 10) ('better', 8) ('than', 8) ('the', 6) ('to', 5)
Weitere Python-Tutorials, empfohlenes Lernen: Python-Video-Tutorial
Das obige ist der detaillierte Inhalt vonPython zählt Wortvorkommen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!