以下是一个保留最后一个重复行的示例代码:
def keep_last_duplicate_line(file_path):
lines_seen = set() # 用于存储已经出现过的行
with open(file_path, 'r') as file:
lines = file.readlines()
with open(file_path, 'w') as file:
for line in lines:
if line not in lines_seen: # 如果行不在已经出现过的集合中,则写入文件,并将其添加到集合中
file.write(line)
lines_seen.add(line)
else:
lines_seen.remove(line) # 如果行已经出现过,则从集合中移除,然后再次写入文件,保留最后一个重复行
lines_seen.add(line)
file.write(line)
使用示例:
keep_last_duplicate_line('input.txt')
上述代码将读取名为input.txt
的文件,并在写入相同行时保留最后一个重复行。
下一篇:保留最后一个重复行,但列不同