考虑一个名为 df 的 DataFrame,其中包含列 col1、col2、col3、col4 和 col5,如提供的所示代码片段。要根据 col5 和 col2 中的特定值确定行数,请按照以下步骤操作:
按组获取行计数:
计算每行中的出现次数基于 col5 和 col2 值的唯一组合,使用 size() 方法,如下所示:
<code class="python">df.groupby(['col5', 'col2']).size()</code>
此操作按 col5 和 col2 对 DataFrame 进行分组,并计算每个组内的行数。输出将是一系列包含索引对 (col5, col2) 和相应计数的序列。
示例:
提供的代码片段使用 df DataFrame 演示了此操作,产生以下输出:
col5 col2 1 A 1 D 3 2 B 2 3 A 3 C 1 4 B 1 5 B 2 6 B 1 dtype: int64
在此输出中,每行代表 col5 和 col2 的唯一组合,相应的计数表示该组合在 DataFrame 中出现的次数。
查找每个 col2 值的最大计数:
要确定 col2 每个唯一值的最大计数,请执行以下步骤:
示例:
<code class="python">df.groupby(['col2']).size().groupby(level=1).max()</code>
此代码片段按 col2 对 df 进行分组,计算计数,然后找到每个 col2 值的最大计数,结果在以下输出中:
col2 A 3 B 2 C 1 D 3 dtype: int64
在此输出中,每个 col2 值与 col2 中共享该值的最大行数相关联。
以上是如何按多列对 Pandas DataFrame 进行分组和计数并查找最大计数?的详细内容。更多信息请关注PHP中文网其他相关文章!