LDA主题模型可以将文档集中每篇文档的主题按照概率分布的形式给出。同时它是一种无监督学习算法,在训练时不需要手工标注的训练集,需要的仅仅是文档集以及指定主题的数量k即可。对于每一个主题LDA均可找出一些词语来描述它。
LDA首先由Blei, David M.、吴恩达和Jordan, Michael I于2003年提出,目前在文本挖掘领域包括文本主题识别、文本分类以及文本相似度计算方面都有应用。
原创文章,作者:BFS,如若转载,请注明出处:https://www.isclab.org.cn/2018/07/03/lda%e4%b8%bb%e9%a2%98%e6%a8%a1%e5%9e%8b%e6%b5%85%e6%9e%90/