以下是一个按日期累积的示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'日期': ['2021-01-01', '2021-01-02', '2021-01-03', '2021-01-04', '2021-01-05'],
'数值': [10, 5, 8, 12, 6]}
df = pd.DataFrame(data)
# 将日期列转换为日期时间类型
df['日期'] = pd.to_datetime(df['日期'])
# 按日期排序数据集
df = df.sort_values('日期')
# 计算按日期累积的数值
df['累积数值'] = df['数值'].cumsum()
print(df)
输出结果如下:
日期 数值 累积数值
0 2021-01-01 10 10
1 2021-01-02 5 15
2 2021-01-03 8 23
3 2021-01-04 12 35
4 2021-01-05 6 41
在这个示例中,我们首先将日期列转换为日期时间类型,然后按日期对数据集进行排序。接下来,使用cumsum()
函数计算按日期累积的数值,并将结果存储在一个新的列中。最后,打印输出结果。