以下是一个示例代码,用于按天分组并计算相同列值的日期差的和。
import pandas as pd
# 创建示例数据集
data = {'日期': ['2021-01-01', '2021-01-02', '2021-01-03', '2021-01-01', '2021-01-02'],
'数值': [10, 15, 20, 5, 10]}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['日期'] = pd.to_datetime(df['日期'])
# 按照日期和数值分组,并计算日期差的和
result = df.groupby(['日期', '数值']).agg({'日期': lambda x: (x.max() - x.min()).days}).rename(columns={'日期': '日期差和'})
print(result)
这段代码首先导入pandas
库,并创建一个示例数据集df
,其中包含日期和数值两列。
然后,将日期列转换为日期类型,以便可以进行日期计算。
接下来,使用groupby
方法按照日期和数值分组,并使用agg
方法计算日期差的和。在agg
方法中,我们使用lambda
函数来计算日期差,x.max()
和x.min()
分别表示每个日期分组中的最大日期和最小日期。
最后,将结果保存在result
中,并打印出来。输出结果将显示按照日期和数值分组的日期差和。
上一篇:按天分组
下一篇:按天分组并显示MYSQL行?