首先,我们需要导入 pandas 库来处理数据。假设我们有一个包含销售数据的数据框 sales_data,其中包含日期、产品类别和销售额。
1.按日期和产品类别分组,然后将销售额计算为新列。
import pandas as pd
sales_data_grouped = sales_data.groupby(['日期', '产品类别']).agg({'销售额': 'sum'}).reset_index()
sales_data_pivot = sales_data_grouped.pivot(index='日期', columns='产品类别', values='销售额')
在这个示例中,我们使用 groupby() 分组功能对日期和产品类别进行分组,并使用 agg() 方法计算每个组内的销售额总和。然后,在将数据转换为透视表时,我们将日期作为索引,将产品类别作为列,并将销售额作为值。
2.按日期分组,然后将每个产品类别作为一个新列。
import pandas as pd
sales_data_grouped = sales_data.groupby('日期').apply(lambda x: x.set_index('产品类别')['销售额'].rename_axis(None)).unstack(fill_value=0)
在这个示例中,我们使用 groupby() 功能对日期进行分组,并使用 apply() 方法将每个产品类别作为一个新列。然后,我们将数据转换为 DataFrame,并使用 fill_value 参数来填充任何缺失的值。
这些示例将帮助您按条件和日期对数据进行分组,并将它们转换为透视表或 DataFrame,以便将它们作为单独的列呈现。
下一篇:按条件获取顶点及其边缘