以下是一个使用Python pandas库的示例代码,用于比较几个表的列:
import pandas as pd
# 创建表1
data1 = {'ID': ['1', '2', '3'], 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df1 = pd.DataFrame(data1)
# 创建表2
data2 = {'ID': ['1', '3', '4'], 'Name': ['Alice', 'Charlie', 'Dave'], 'Salary': [5000, 6000, 7000]}
df2 = pd.DataFrame(data2)
# 创建表3
data3 = {'ID': ['2', '3', '4'], 'Name': ['Bob', 'Charlie', 'Dave'], 'Address': ['Street1', 'Street2', 'Street3']}
df3 = pd.DataFrame(data3)
# 比较表1和表2的列
columns1 = set(df1.columns)
columns2 = set(df2.columns)
common_columns = columns1.intersection(columns2)
only_in_df1 = columns1 - columns2
only_in_df2 = columns2 - columns1
print("表1和表2共有的列: ", common_columns)
print("只在表1中的列: ", only_in_df1)
print("只在表2中的列: ", only_in_df2)
# 比较表1、表2和表3的列
columns3 = set(df3.columns)
common_columns = common_columns.intersection(columns3)
only_in_df1 = only_in_df1 - columns3
only_in_df2 = only_in_df2 - columns3
only_in_df3 = columns3 - common_columns
print("表1、表2和表3共有的列: ", common_columns)
print("只在表1中的列: ", only_in_df1)
print("只在表2中的列: ", only_in_df2)
print("只在表3中的列: ", only_in_df3)
该示例代码创建了三个数据表df1、df2和df3,然后比较了它们的列。首先,比较了df1和df2的列,找出了共有的列和分别只在其中一个表中的列。然后,又将df3的列与共有的列进行比较,找出了共有的列和只在df1、df2或df3中的列。最后,将结果打印输出。
注意:这只是一个示例代码,实际应用中可能需要根据具体需求进行修改和扩展。