下面是一个示例代码,用于部分匹配两个不同数据表的两列:
import pandas as pd
# 创建示例数据表1
data1 = {'ID': ['1', '2', '3', '4', '5'],
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve']}
df1 = pd.DataFrame(data1)
# 创建示例数据表2
data2 = {'ID': ['1', '2', '3', '6', '7'],
'Age': [25, 30, 35, 40, 45]}
df2 = pd.DataFrame(data2)
# 使用部分匹配连接两个数据表
df_merged = pd.merge(df1, df2, on='ID', how='inner')
# 打印合并后的结果
print(df_merged)
这段代码使用pandas库来处理数据表。首先,我们创建了两个示例数据表df1和df2。然后,使用pd.merge()
函数将两个数据表根据'ID'列进行内连接。最后,打印合并后的结果df_merged。
运行以上代码,输出结果如下:
ID Name Age
0 1 Alice 25
1 2 Bob 30
2 3 Charlie 35
结果中只包含两个数据表中ID列相匹配的行,并且包含了合并后的Name和Age列。