文本情感分析 (I):词袋模型(VSM 和 LSA)和基于 n-gram 的文本表示 - 第 2 步:使用 LSA 的主题-文本矩阵训练随机森林分类器
最编程
2024-04-05 20:45:33
...
包外估计为0.82236,比基于VSM的效果要差2个百分点左右,毕竟特征维度降低了。本来想把话题设定为500,也就是把特征维度降到500维,可是计算时间太恐怖了,久久得不到结果。
这真是费力不讨好。
"""再使用LSA的话题-文本矩阵训练一个分类器""" forest = RandomForestClassifier(oob_score=True,n_estimators = 200) forest = forest.fit(train_lsa_freq, df.sentiment) print("\n====================评估以LSA为特征训练的模型==================\n") model_eval(train_lsa_freq)