这是一个示例代码,演示了如何按条件对数据进行分组,并修剪掉一些不需要的行:
import pandas as pd
# 创建一个示例数据集
data = {
'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick', 'John'],
'Age': [20, 30, 25, 20, 35, 28],
'City': ['New York', 'Paris', 'London', 'New York', 'Paris', 'London'],
'Salary': [50000, 60000, 55000, 52000, 62000, 57000]
}
df = pd.DataFrame(data)
# 按条件分组并修剪行
grouped_df = df.groupby('Name').apply(lambda x: x[x['Age'] > 25])
# 打印结果
print(grouped_df)
输出结果:
Name Age City Salary
Name
John John 28 London 57000
Nick Nick 30 Paris 60000
Nick Nick 35 Paris 62000
在这个示例中,我们首先创建了一个包含姓名、年龄、城市和薪水的数据集。然后,我们使用groupby
方法按照姓名对数据进行分组。接下来,我们使用apply
方法并传入一个lambda函数,该函数会筛选出年龄大于25的行。最后,我们打印出分组并修剪后的结果。