欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

文本情感分析 (I):词袋模型(VSM 和 LSA)和基于 n-gram 的文本表示 - 第 2 步:使用 LSA 的主题-文本矩阵训练随机森林分类器

最编程 2024-04-05 20:45:33
...

包外估计为0.82236,比基于VSM的效果要差2个百分点左右,毕竟特征维度降低了。本来想把话题设定为500,也就是把特征维度降到500维,可是计算时间太恐怖了,久久得不到结果。

这真是费力不讨好。

"""再使用LSA的话题-文本矩阵训练一个分类器"""

forest = RandomForestClassifier(oob_score=True,n_estimators = 200)
forest = forest.fit(train_lsa_freq, df.sentiment)
print("\n====================评估以LSA为特征训练的模型==================\n")
model_eval(train_lsa_freq)