可以使用pandas库中的groupby()函数实现按条件分组并计数的操作。首先,使用DataFrame筛选出符合条件的数据,然后使用groupby()函数按照指定的列进行分组,并使用count()函数计算每组中的元素个数。
示例代码如下:
import pandas as pd
# 构造包含条件数据的DataFrame
df = pd.DataFrame({
'name': ['Alice', 'Beth', 'Charlie', 'Dick', 'Emma', 'Fred'],
'gender': ['F', 'F', 'M', 'M', 'F', 'M'],
'age': [25, 30, 20, 35, 27, 29],
'salary': [5000, 6000, 4000, 8000, 5500, 7000]
})
# 按性别分组并计数
result = df[df['age'] > 25].groupby('gender').count()
# 打印结果
print(result)
输出结果为:
name age salary
gender
F 2 2 2
M 2 2 2
以上代码中,我们先利用DataFrame筛选出年龄大于25岁的数据,然后使用groupby()函数按性别进行分组,最后使用count()函数计算每组中的元素个数。最终得到的结果是一个以性别分组的计数DataFrame。
下一篇:按条件分组并计算数量