Das Ermitteln der Häufigkeit des Auftretens einzelner Werte innerhalb eines NumPy-Arrays ist eine häufige Aufgabe bei der Datenanalyse. Dieser Artikel beschreibt einen effizienten Ansatz zum Erhalten dieser Häufigkeitszahlen.
Methode:
Die primäre Methode zum Erhalten von Häufigkeitszahlen in NumPy ist insbesondere die Funktion np.unique durch Setzen von return_counts=True. Betrachten Sie zum Beispiel das folgende Array:
<code class="python">x = np.array([1,1,1,2,2,2,5,25,1,1])</code>
Um die Häufigkeitsanzahl dieser Elemente zu berechnen:
<code class="python">import numpy as np unique, counts = np.unique(x, return_counts=True) print(np.asarray((unique, counts)).T)</code>
Dies wird Folgendes ausgeben:
[[ 1 5] [ 2 3] [ 5 1] [25 1]]
Wie Sie Wie Sie sehen können, enthält das resultierende Array die eindeutigen Werte (in der ersten Spalte) und ihre jeweiligen Häufigkeiten (in der zweiten Spalte).
Vergleich und Leistung:
Die Die np.unique-Methode mit return_counts=True bietet eine verbesserte Leistung im Vergleich zu anderen Ansätzen, wie z. B. scipy.stats.itemfreq. Bei großen Arrays reduziert sich der Zeitaufwand von np.unique deutlich, wie der folgende Benchmark-Vergleich zeigt:
<code class="python">x = np.random.random_integers(0,100,1e6) %timeit unique, counts = np.unique(x, return_counts=True) # 31.5 ms per loop %timeit scipy.stats.itemfreq(x) # 170 ms per loop</code>
Fazit:
Der np.unique Die Funktion in NumPy bietet eine effiziente Lösung zum Ermitteln der Häufigkeitsanzahl eindeutiger Werte in einem Array. Sein Leistungsvorteil gegenüber alternativen Methoden macht es zur bevorzugten Wahl für große Datensätze.
Das obige ist der detaillierte Inhalt von## Wie kann man Häufigkeitszahlen für unterschiedliche Werte in NumPy-Arrays effizient berechnen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!