要比较两个形状不同的数据框,可以使用以下方法:
rename()
函数将它们重命名为相同的列名。df1 = df1.rename(columns={'old_column_name': 'new_column_name'})
reindex()
函数将它们重新索引为相同的形状。df1 = df1.reindex(df2.index, columns=df2.columns)
astype()
函数将它们转换为相同的数据类型。df1['column_name'] = df1['column_name'].astype('desired_data_type')
equals()
函数比较两个数据框的值是否相等。df1.equals(df2)
下面是一个完整的示例代码:
import pandas as pd
# 创建不同形状的数据框
data1 = {'A': [1, 2, 3], 'B': [4, 5, 6]}
data2 = {'C': [7, 8, 9]}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)
# 检查列名是否相同
df1 = df1.rename(columns={'A': 'C', 'B': 'D'})
# 检查行数和列数是否相同
df1 = df1.reindex(df2.index, columns=df2.columns)
# 检查数据类型是否相同
df1['C'] = df1['C'].astype(int)
# 检查值是否相同
if df1.equals(df2):
print("两个数据框相同")
else:
print("两个数据框不同")
请注意,以上代码仅检查了数据框的形状和值是否相同,如果您还想检查数据框中的具体内容是否相同,可以使用其他方法,例如使用assert_frame_equal()
函数从pandas.testing
模块进行比较。