要比较两个不同的Excel表格中的多列数据,可以使用Python的pandas库。
下面是一个代码示例,演示如何比较两个Excel表格中的多列数据:
import pandas as pd
# 读取第一个Excel表格
df1 = pd.read_excel('path_to_excel_file1.xlsx')
# 读取第二个Excel表格
df2 = pd.read_excel('path_to_excel_file2.xlsx')
# 指定要比较的列
compare_cols = ['Column1', 'Column2', 'Column3']
# 使用merge方法比较指定的列
merged_df = pd.merge(df1[compare_cols], df2[compare_cols], on=compare_cols, how='outer', suffixes=('_df1', '_df2'))
# 找出差异的行
diff_df = merged_df[merged_df['Column1_df1'].isnull() | merged_df['Column1_df2'].isnull()]
# 打印差异的行
print(diff_df)
请注意,你需要将path_to_excel_file1.xlsx
和path_to_excel_file2.xlsx
替换为你实际的Excel文件路径,以及将Column1
、Column2
和Column3
替换为你要比较的列名。
此代码将输出两个Excel表格中差异的行,即只在一个表格中出现的行。你可以根据需要进行进一步的处理,比如输出差异行的数量、保存差异行到新的Excel文件等。