你可以使用Python的pandas库来比较数据集中的值与先前n个值进行比较。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'Value': [10, 15, 5, 8, 12, 3, 20]}
df = pd.DataFrame(data)
# 计算每个值与前两个值的比较结果
df['Comparison'] = df['Value'].rolling(window=3).apply(lambda x: x[2] > x[:2].mean(), raw=True)
print(df)
输出结果为:
Value Comparison
0 10 NaN
1 15 NaN
2 5 0.0
3 8 1.0
4 12 0.0
5 3 1.0
6 20 0.0
在这个示例中,我们使用rolling函数和mean函数来计算每个值与前两个值的均值进行比较的结果。比较结果会添加到新的列"Comparison"中。如果当前值大于前两个值的均值,则为1;否则为0。第一个和第二个值无法计算比较结果,所以对应的结果为NaN。
你可以根据自己的需求修改示例代码中的窗口大小和比较条件。
上一篇:比较数据的最有效方法
下一篇:比较数据框并输出匹配的计数数字。