对于具有数组列的表格,可能需要按照特定的方式聚合这些列。假设我们有一个包含姓名、年龄和付款历史的表格。
姓名 | 年龄 | 付款历史 |
---|---|---|
Bob | 27 | [{"date": "2022-01-01", "amount": 100.00}] |
Bob | 28 | [{"date": "2023-05-01", "amount": 200.00}] |
Sam | 35 | [{"date": "2020-07-01", "amount": 150.00}] |
Sam | 36 | [{"date": "2021-09-15", "amount": 75.00}] |
要按姓名对此表格进行聚合,并将付款历史数据合并为单个数组,我们可以使用以下代码:
import pandas as pd
import json
# 读取数据
df = pd.read_csv('payments.csv')
# 将付款历史数据转换为 JSON 格式
df['付款历史'] = df['付款历史'].apply(json.loads)
# 按姓名分组并将付款历史数据合并为单个数组
aggregation = {'付款历史': list}
df = df.groupby('姓名').agg(aggregation).reset_index()
此代码会生成以下输出:
姓名 | 付款历史 |
---|---|
Bob | [[{'date': '2022-01-01', 'amount': 100.0}], [{'date': '2023-05-01', 'amount': 200.0}]] |
Sam | [[{'date': '2020-07-01', 'amount': 150.0}], [{'date': '2021-09-15', 'amount': 75.0}]] |
现在,表格中的每一行都包含一个列表,在这个列表中,每一个元素都是一个人的付款历史记录。
上一篇:表格数组仅显示一个项目
下一篇:表格搜索Cobol问题