要按小时和分钟分组后创建一个新的索引,可以使用pandas库来实现。以下是一个示例代码:
import pandas as pd
# 创建一个示例数据框
data = {'timestamp': ['2021-01-01 12:30:00', '2021-01-01 12:45:00', '2021-01-01 13:10:00', '2021-01-01 13:20:00'],
'value': [10, 20, 30, 40]}
df = pd.DataFrame(data)
# 将'timestamp'列转换为datetime类型
df['timestamp'] = pd.to_datetime(df['timestamp'])
# 按小时和分钟分组,并创建新的索引
df = df.set_index([df['timestamp'].dt.hour, df['timestamp'].dt.minute])
# 删除原始的'timestamp'列
df = df.drop('timestamp', axis=1)
# 打印结果
print(df)
运行以上代码,将会得到如下输出:
value
12 30 10
45 20
13 10 30
20 40
在这个示例中,我们首先将'timestamp'列转换为datetime类型,然后使用dt.hour和dt.minute属性从日期时间中提取小时和分钟信息。接下来,我们将这两个信息作为多级索引的两个级别,并通过set_index函数创建新的索引。最后,我们删除原始的'timestamp'列,得到按小时和分钟分组后的数据框。