以下是一个示例代码,用于按日期计算滚动平均值和标准差:
import pandas as pd
import numpy as np
# 创建一个示例数据集
data = {'Date': pd.date_range(start='1/1/2022', end='1/10/2022'),
'Value': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]}
df = pd.DataFrame(data)
# 按日期排序
df = df.sort_values('Date')
# 计算滚动平均值
df['Rolling Mean'] = df['Value'].rolling(window=3).mean()
# 计算滚动标准差
df['Rolling Std'] = df['Value'].rolling(window=3).std()
print(df)
输出结果如下:
Date Value Rolling Mean Rolling Std
0 2022-01-01 1 NaN NaN
1 2022-01-02 2 NaN NaN
2 2022-01-03 3 2.000000 1.000000
3 2022-01-04 4 3.000000 1.000000
4 2022-01-05 5 4.000000 1.000000
5 2022-01-06 6 5.000000 1.000000
6 2022-01-07 7 6.000000 1.000000
7 2022-01-08 8 7.000000 1.000000
8 2022-01-09 9 8.000000 1.000000
9 2022-01-10 10 9.000000 1.000000
在上面的示例代码中,我们使用了pandas库来处理日期和数据。首先,我们创建了一个示例数据集,包含日期和值两列。然后,我们按日期对数据进行排序。接下来,我们使用rolling函数来计算滚动平均值和滚动标准差,其中窗口大小为3。最后,我们将计算结果添加到数据集中,并打印整个数据集。
上一篇:按日期计算分组的计数
下一篇:按日期计算联合表中的实例次数