要保存LDA模型并进行预测,可以使用Python中的Gensim库。下面是一个基本的示例代码:
from gensim.models import LdaModel
from gensim.corpora import Dictionary
# 创建语料库
corpus = [[(1, 0.5), (2, 0.2)], # 文档1
[(2, 0.3), (3, 0.5)], # 文档2
[(1, 0.2), (3, 0.4)], # 文档3
[(0, 0.5)]] # 文档4
# 创建词典
dictionary = Dictionary(corpus)
num_topics = 2
# 训练LDA模型
lda_model = LdaModel(corpus=corpus, id2word=dictionary, num_topics=num_topics)
# 保存模型
lda_model.save("lda_model")
# 加载模型
loaded_model = LdaModel.load("lda_model")
# 预测新文档
new_doc = [(0, 0.7), (1, 0.1)] # 新文档
new_doc_topics = loaded_model.get_document_topics(dictionary.doc2bow(new_doc))
print(new_doc_topics)
此示例中,我们首先创建了一个简单的语料库和词典。然后,我们使用LdaModel
类训练了一个LDA模型,并将其保存到了名为"lda_model"的文件中。
在加载模型后,我们可以使用get_document_topics()
方法来预测新文档的主题分布。在示例中,我们创建了一个新的文档,并将其转换为词袋表示法(使用dictionary.doc2bow()
方法),然后使用get_document_topics()
方法获取其主题分布。
最后,我们打印出预测的主题分布。
上一篇:保存来自外部小部件的状态
下一篇:保存类别时的Magento问题