下面是一个示例代码,演示如何按小时对DataFrame进行分组,并计算特定列的平均值。
import pandas as pd
# 创建一个示例DataFrame
data = {'timestamp': ['2021-01-01 10:00:00', '2021-01-01 10:30:00', '2021-01-01 11:00:00', '2021-01-01 11:30:00', '2021-01-01 12:00:00'],
'value': [1, 2, 3, 4, 5]}
df = pd.DataFrame(data)
# 将timestamp列转换为datetime类型
df['timestamp'] = pd.to_datetime(df['timestamp'])
# 按小时对DataFrame进行分组,并计算value列的平均值
df_hourly_avg = df.groupby(df['timestamp'].dt.hour)['value'].mean()
print(df_hourly_avg)
输出结果如下:
timestamp
10 1.5
11 3.5
12 5.0
Name: value, dtype: float64
在这个示例中,我们首先创建了一个包含时间戳和值的DataFrame。然后,我们使用pd.to_datetime()
函数将timestamp列转换为datetime类型。接下来,我们使用groupby()
函数将DataFrame按小时进行分组,并使用mean()
函数计算value列的平均值。最后,我们打印出计算得到的平均值。