假设有一个记录列表,每个记录包含日期和ID信息。要按日期排序并按ID分组,然后获取每个组中最新的记录,可以使用以下代码示例解决:
from datetime import datetime
# 假设记录列表
records = [
{'id': 'A001', 'date': '2022-01-01'},
{'id': 'A002', 'date': '2022-01-02'},
{'id': 'A001', 'date': '2022-01-03'},
{'id': 'A003', 'date': '2022-01-04'},
{'id': 'A002', 'date': '2022-01-05'},
{'id': 'A001', 'date': '2022-01-06'}
]
# 按日期排序
sorted_records = sorted(records, key=lambda x: datetime.strptime(x['date'], '%Y-%m-%d'))
# 按ID分组并获取最新的记录
grouped_records = {}
for record in sorted_records:
id = record['id']
if id not in grouped_records:
grouped_records[id] = record
else:
# 比较日期判断是否为最新的记录
if datetime.strptime(record['date'], '%Y-%m-%d') > datetime.strptime(grouped_records[id]['date'], '%Y-%m-%d'):
grouped_records[id] = record
# 输出结果
for record in grouped_records.values():
print(record)
运行以上代码,输出结果为:
{'id': 'A001', 'date': '2022-01-06'}
{'id': 'A002', 'date': '2022-01-05'}
{'id': 'A003', 'date': '2022-01-04'}
代码中,首先使用sorted()
函数按日期对记录列表进行排序。然后,使用一个字典grouped_records
来存储每个ID对应的最新记录。遍历排序后的记录列表,如果ID在字典中不存在,则将记录添加到字典中;如果ID在字典中已存在,则比较日期判断是否为最新的记录,如果是,则更新字典中的记录。最后,遍历字典的值,即可获取每个组中最新的记录。