一种解决方法是使用无监督学习算法进行分类。无监督学习算法可以从数据中发现隐藏的模式或结构,并将数据分为不同的类别。
以下是使用K均值聚类算法进行分类的示例代码:
from sklearn.cluster import KMeans
# 加载数据
data = [[1, 2], [1, 4], [1, 0], [4, 2], [4, 4], [4, 0]]
# 创建K均值聚类模型
kmeans = KMeans(n_clusters=2)
# 训练模型
kmeans.fit(data)
# 预测类别
labels = kmeans.predict(data)
print(labels)
输出结果为:[1 1 1 0 0 0]
上述代码中,将数据分为2个类别。KMeans模型会自动将数据进行聚类,并将每个样本分配到最接近的聚类中心。最终,labels数组包含了每个样本的类别标签。
需要注意的是,无监督学习算法并不需要目标变量进行训练,它只使用输入数据进行模型构建和预测。可能需要根据具体情况选择适合的无监督学习算法,并进行参数调整以获得最佳的分类效果。