要按相同值对列进行分组并更新,可以使用 pandas 库来处理。下面给出一个代码示例:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['John', 'Mike', 'Sarah', 'Mike', 'John'],
'Age': [25, 30, 28, 30, 25],
'Salary': [5000, 6000, 5500, 6000, 5000]}
df = pd.DataFrame(data)
# 按 Name 列进行分组,并计算每个分组的平均年龄和工资
grouped = df.groupby('Name').agg({'Age': 'mean', 'Salary': 'mean'}).reset_index()
# 将每个分组的平均年龄和工资更新到原始数据集中
df = pd.merge(df, grouped, on='Name', suffixes=('', '_mean'))
# 打印更新后的数据集
print(df)
以上代码首先创建了一个示例数据集,包含 Name、Age 和 Salary 列。然后,使用 groupby
方法按 Name 列进行分组,并使用 agg
方法计算每个分组的平均年龄和工资。接下来,使用 merge
方法将计算结果与原始数据集合并,并更新到原始数据集中。最后,打印更新后的数据集。
输出结果如下:
Name Age Salary Age_mean Salary_mean
0 John 25 5000 25.0 5000.0
1 Mike 30 6000 30.0 6000.0
2 Sarah 28 5500 28.0 5500.0
3 Mike 30 6000 30.0 6000.0
4 John 25 5000 25.0 5000.0
可以看到,原始数据集中的每一行都被更新了平均年龄和工资的值。
上一篇:按相同值对列进行分组
下一篇:按相同值分组行,仅返回一行。