下面是一个示例代码,演示如何按小时分组单元格:
import pandas as pd
# 创建一个示例数据集
data = {'Timestamp': ['2022-01-01 10:30:00', '2022-01-01 10:45:00', '2022-01-01 11:00:00', '2022-01-01 11:15:00', '2022-01-01 12:00:00'],
'Value': [10, 15, 20, 25, 30]}
df = pd.DataFrame(data)
# 将Timestamp转换为日期时间类型
df['Timestamp'] = pd.to_datetime(df['Timestamp'])
# 按小时分组
df['Hour'] = df['Timestamp'].dt.hour
# 按小时分组的单元格分组
grouped = df.groupby('Hour')['Value'].sum()
print(grouped)
输出结果:
Hour
10 25
11 45
12 30
Name: Value, dtype: int64
以上代码首先创建了一个示例数据集,包含Timestamp列和Value列。然后将Timestamp列转换为日期时间类型,并通过dt.hour
获取每个时间戳的小时数。最后,使用groupby
函数按小时分组,并对每个小时的Value列求和。输出结果是按小时分组的Value列的总和。