下面是一个使用Sklearn的LabelEncoder进行编码的示例代码:
from sklearn.preprocessing import LabelEncoder
# 创建一个示例数据框
data = {'color': ['红', '绿', '蓝', '红', '绿']}
df = pd.DataFrame(data)
# 创建LabelEncoder对象
le = LabelEncoder()
# 保留编码的值
df['color_encoded'] = le.fit_transform(df['color'])
# 对新数据框进行编码
new_data = {'color': ['红', '绿', '黄']}
new_df = pd.DataFrame(new_data)
new_df['color_encoded'] = le.transform(new_df['color'])
print(df)
print(new_df)
这段代码首先导入了LabelEncoder类,然后创建了一个示例数据框df,其中有一个名为color的列,包含了一些颜色值。接下来创建了一个LabelEncoder对象le。
通过调用fit_transform方法,LabelEncoder会根据color列中的唯一值创建编码,并将编码后的值赋给color_encoded列。这样就保留了编码的值。
然后,创建了一个新的数据框new_df,其中包含了一些新的颜色值。通过调用transform方法,LabelEncoder会根据之前的编码将新数据框的color列进行编码,并将编码后的值赋给color_encoded列。
最后,打印出df和new_df,可以看到编码后的结果。
上一篇:保留变量值中的空格