在Python中,可以使用pandas库来比较两个表并删除匹配的项。下面是一个示例代码:
import pandas as pd
# 创建两个DataFrame
df1 = pd.DataFrame({'A': [1, 2, 3, 4],
'B': ['a', 'b', 'c', 'd']})
df2 = pd.DataFrame({'A': [2, 4],
'B': ['b', 'd']})
# 使用merge函数将两个DataFrame进行比较,并删除匹配的项
df3 = pd.merge(df1, df2, how='outer', indicator=True).loc[lambda x: x['_merge'] == 'left_only']
# 输出结果
print(df3)
运行以上代码,输出结果如下:
A B _merge
0 1 a left_only
2 3 c left_only
这里使用了merge
函数将df1
和df2
进行比较。通过指定how='outer'
参数,可以保留两个DataFrame中的所有项。然后,使用indicator=True
参数来添加一个_merge
列,表示每个项的来源。最后,通过使用loc
函数选择_merge
列值为left_only
的项,即在df1
中但不在df2
中的项。