在Python中,您可以使用pandas库来按多个因素分组并汇总因素的计数。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'Factor1': ['A', 'A', 'B', 'B', 'B', 'C'],
'Factor2': ['X', 'Y', 'Y', 'X', 'X', 'Z']}
df = pd.DataFrame(data)
# 按多个因素分组并计数
grouped = df.groupby(['Factor1', 'Factor2']).size().reset_index(name='Count')
# 打印结果
print(grouped)
输出结果为:
Factor1 Factor2 Count
0 A X 1
1 A Y 1
2 B X 2
3 B Y 1
4 C Z 1
在上面的代码中,首先创建了一个示例数据集,其中包含两个因素Factor1
和Factor2
。然后使用groupby
函数按这两个因素进行分组。size()
函数用于计算每个分组的大小(即因素的计数),并使用reset_index
函数将结果重置为一个新的DataFrame,并将计数列命名为Count
。最后,使用print
函数打印出结果。
上一篇:按多个选择的类别进行过滤