要保存一个 scikit-learn 的 Bunch 对象,可以使用 joblib
库中的 dump
函数。下面是一个保存 Bunch 对象的代码示例:
from sklearn.datasets import load_iris
from sklearn.externals import joblib
# 加载数据集
iris = load_iris()
# 创建 Bunch 对象
data = {
'data': iris.data,
'target': iris.target,
'feature_names': iris.feature_names,
'target_names': iris.target_names
}
# 保存 Bunch 对象
joblib.dump(data, 'iris_data.joblib')
在上面的示例中,我们首先使用 load_iris
函数加载了一个数据集,并使用这些数据创建了一个 Bunch 对象 data
。然后,我们使用 joblib.dump
函数将 Bunch 对象保存为文件 iris_data.joblib
。
要加载和恢复保存的 Bunch 对象,可以使用 joblib
库中的 load
函数。下面是一个加载 Bunch 对象的代码示例:
from sklearn.externals import joblib
# 加载 Bunch 对象
data = joblib.load('iris_data.joblib')
# 使用加载的 Bunch 对象
X = data['data']
y = data['target']
feature_names = data['feature_names']
target_names = data['target_names']
# 打印加载的数据集
print(X)
print(y)
print(feature_names)
print(target_names)
在上面的示例中,我们使用 joblib.load
函数加载了之前保存的 Bunch 对象,并将其存储在变量 data
中。然后,我们可以使用加载的 Bunch 对象来访问数据集的不同属性,如数据、目标、特征名称和目标名称。
上一篇:保存一个pandas数据帧
下一篇:保存一个双向不可为空约束