使用Pandas库的groupby函数和datetime模块筛选日期并对分组进行操作。
例如,我们有一个DataFrame包含日期、城市和销售额三列数据:
import pandas as pd
from datetime import datetime
df = pd.DataFrame({
'date': ['2021-01-15', '2021-01-15', '2021-01-16', '2021-01-16', '2021-01-17'],
'city': ['Shanghai', 'Beijing', 'Shanghai', 'Beijing', 'Shanghai'],
'sales': [100, 200, 150, 250, 300]
})
我们可以将日期列转换为datetime类型,并以日期和城市为关键字进行分组:
df['date'] = pd.to_datetime(df['date'])
grouped = df.groupby(['date', 'city'])
接下来,我们可以对每个分组进行操作,例如计算每个分组的销售额总和:
result = grouped['sales'].sum()
print(result)
输出结果为:
date city
2021-01-15 Beijing 200
Shanghai 100
2021-01-16 Beijing 250
Shanghai 150
2021-01-17 Shanghai 300
Name: sales, dtype: int64
这样,我们就可以按日期和城市分组筛选数据,并对分组进行操作了。
上一篇:按日期添加两个不同大小的数据框