以下是一个示例代码,用于按小时分组计算平均玩家人数:
import pandas as pd
# 示例数据
data = {
'时间': ['2020-01-01 08:00:00', '2020-01-01 08:15:00', '2020-01-01 09:00:00', '2020-01-01 09:15:00',
'2020-01-02 10:00:00', '2020-01-02 10:15:00', '2020-01-02 11:00:00', '2020-01-02 11:15:00'],
'玩家人数': [100, 150, 200, 250, 300, 350, 400, 450]
}
df = pd.DataFrame(data)
# 将 '时间' 列转换为日期时间类型
df['时间'] = pd.to_datetime(df['时间'])
# 按小时分组并计算平均值
df['小时'] = df['时间'].dt.hour
avg_players = df.groupby('小时')['玩家人数'].mean()
print(avg_players)
输出结果为:
小时
8 125.0
9 225.0
10 325.0
11 425.0
Name: 玩家人数, dtype: float64
这个示例中,我们首先创建了一个包含时间和玩家人数的示例数据。然后,我们使用pd.to_datetime()
函数将时间列转换为日期时间类型。
接下来,我们使用dt.hour
属性从日期时间中提取小时部分,并将其保存在一个新的列小时
中。
最后,我们使用groupby()
函数按小时分组,并使用mean()
函数计算每小时玩家人数的平均值。最终结果被保存在avg_players
中,并通过print()
函数打印出来。