首頁 > 後端開發 > Python教學 > 如何有效計算 Pandas DataFrame 中 ID 組組合中的術語出現次數?

如何有效計算 Pandas DataFrame 中 ID 組組合中的術語出現次數?

Linda Hamilton
發布: 2024-12-06 15:23:13
原創
595 人瀏覽過

How to Efficiently Count Term Occurrences within ID-Group Combinations in a Pandas DataFrame?

如何對 pandas 資料框執行 groupby 值計數?

您需要按'id' 和'group' 列對資料框進行分組,併計算每個資料框的計數「term」列中每個唯一的「id」和「group」值對的唯一值。換句話說,您需要確定每個術語在每個 id-group 組合中出現的頻率。

您可以使用 pandas 的 groupby 和 size 函數來實現此目的:

這將產生一個以 id 和 group 作為索引、term 作為列的表。

計時

這種方法效率很高,甚至對於大型資料集。對於具有 1,000,000 行的資料幀,執行上述程式碼只需要大約 6 秒。

以上是如何有效計算 Pandas DataFrame 中 ID 組組合中的術語出現次數?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板