要比较使用主键的Excel文件,并将差异显示在新的数据框中,可以使用Python中的pandas库。下面是一个代码示例:
import pandas as pd
# 读取第一个Excel文件
df1 = pd.read_excel('file1.xlsx')
# 读取第二个Excel文件
df2 = pd.read_excel('file2.xlsx')
# 设置主键列
key_column = '主键列名'
# 使用主键列进行合并,设置indicator参数为True表示保留合并信息
merged = pd.merge(df1, df2, on=key_column, how='outer', indicator=True)
# 选择只在第一个文件中出现的行
only_in_df1 = merged[merged['_merge']=='left_only']
# 选择只在第二个文件中出现的行
only_in_df2 = merged[merged['_merge']=='right_only']
# 选择在两个文件中都出现的行但某些列值不同
diff = merged[merged['_merge']=='both']
# 可以选择需要显示的列
columns_to_display = ['列名1', '列名2', ...]
# 显示差异的结果
print("只在第一个文件中出现的行:")
print(only_in_df1[columns_to_display])
print("\n只在第二个文件中出现的行:")
print(only_in_df2[columns_to_display])
print("\n在两个文件中都出现的行但某些列值不同:")
print(diff[columns_to_display])
请将file1.xlsx
和file2.xlsx
替换为要比较的两个Excel文件的路径,将主键列名
替换为用作主键的列的名称,将列名1
, 列名2
, ... 替换为要在结果中显示的列的名称。
这段代码将比较两个Excel文件并将差异显示为新的数据框。您可以根据需要自行调整输出的格式和方式。