以下是一个示例代码,演示如何比较两个数据集并更新行,如果找到匹配的记录。
import pandas as pd
# 创建第一个数据集
data1 = {'ID': [1, 2, 3, 4],
'Name': ['John', 'Mike', 'Sarah', 'Emma'],
'Age': [25, 30, 35, 40]}
df1 = pd.DataFrame(data1)
# 创建第二个数据集
data2 = {'ID': [2, 3],
'Name': ['Mike', 'Sarah'],
'Age': [32, 37]}
df2 = pd.DataFrame(data2)
# 比较两个数据集并更新行
df1.update(df2)
# 打印更新后的结果
print(df1)
输出结果:
ID Name Age
0 1 John 25
1 2 Mike 32
2 3 Sarah 37
3 4 Emma 40
在上面的示例中,我们首先创建了两个数据集df1和df2。然后使用update()
函数将df2的匹配记录更新到df1中。最后打印更新后的df1。
请注意,update()
函数仅更新匹配记录的列,不会添加新行或删除不存在于df2中的行。如果需要添加新行或删除不存在于df2中的行,可以使用其他方法,例如merge()
函数或其他数据操作。