假设我们有一个名为data的数据框,其中包含两列:一个是日期(Date)列,一个是时间(Time)列,我们想要按天和小时拆分行,并在一个新列中求出利用时长的总和。
首先,我们可以使用pandas库来加载和处理数据。以下是一个示例代码:
import pandas as pd
# 加载数据
data = pd.read_csv('data.csv')
# 将日期和时间合并成一个新的列
data['DateTime'] = pd.to_datetime(data['Date'] + ' ' + data['Time'])
# 按天和小时拆分行
data['Day'] = data['DateTime'].dt.date
data['Hour'] = data['DateTime'].dt.hour
# 计算每个组合的利用时长总和
data['TotalDuration'] = data.groupby(['Day', 'Hour'])['Duration'].transform('sum')
# 打印结果
print(data)
在这个示例中,我们首先加载了名为data.csv的数据文件,并将日期和时间合并成一个新的DateTime列。然后,我们使用DateTime列来拆分行,并创建一个新的Day列和一个新的Hour列。接下来,我们使用groupby函数按Day和Hour进行分组,并使用transform函数计算每个组合的Duration列的总和,并将结果存储在一个名为TotalDuration的新列中。最后,我们打印出结果。
请注意,上述代码中的'Date','Time','Duration'和'data.csv'应根据您的实际数据进行修改。
上一篇:按天和时间排序