文本情感分析 (I)：词袋模型（VSM 和 LSA）和基于 n-gram 的文本表示 - 第 2 步：使用 LSA 的主题-文本矩阵训练随机森林分类器

最编程 2024-04-05 20:45:33

...

包外估计为0.82236，比基于VSM的效果要差2个百分点左右，毕竟特征维度降低了。本来想把话题设定为500，也就是把特征维度降到500维，可是计算时间太恐怖了，久久得不到结果。

这真是费力不讨好。

"""再使用LSA的话题-文本矩阵训练一个分类器"""

forest = RandomForestClassifier(oob_score=True,n_estimators = 200)
forest = forest.fit(train_lsa_freq, df.sentiment)
print("\n====================评估以LSA为特征训练的模型==================\n")
model_eval(train_lsa_freq)

上一篇：阿里云服务器为WordPress网站添加SSL证书，并设置http自动跳转https

下一篇： 22,484 个成人网站泄露数据，全世界都将知道你看过哪些电影