一个小伙子运用机器学习技巧巧觅真爱,结局会是如何呢?
最编程
2024-02-22 10:05:59
...
首先,我们将精确概率法(Fisher’s Exact Test)对目标约会变量和所有的说明变量进行分析,发现其中有 3 个变量影响最为显著:
健身:定期去健身房或运动的人有女朋友的概率会高出两倍以上(P值=0.02)
眼镜:不戴眼镜的人有女朋友的概率比戴眼镜的人会高出 70%(P值=0.08)
自信:有自信心的人有朋友的概率更高(P 值=0.09)
小哥哥对戴眼镜与否影响这么大感到很意外,好奇是不是因为戴眼镜一般会给人产生「书呆子」的印象。
所以小哥哥又查了些资料,发现还真有这么一回事,有篇研究论文讲到大多数人认为不管男性还是女性,戴眼镜会降低自身吸引力。
有些变量对于能否成功约会可能比较有预测力,不过很难确定,因为样本较小:
留学生比加拿大本地学生的约会成功率要高
亚洲人和其它人种相比约会机会更少
纵览其它因素,虽然女生很少,计算机专业的男生似乎并不处于劣势;剩下的变量(身高/事业/有趣性/社交性/时尚/居住地)这些和成功约会的关系不是很大,毕竟约会只是确认关系的第一步,很少有年轻人想得太远太复杂。
本次实验的完整结果:
接着我们检查各变量之间的关系,这可以帮我们识别出不正确的模型假设。
红色表示正相关,蓝色表示负相关
只展示统计显著性 <0.1 的相关性,因此大部分变量之间的关系为空白。
从图中看起来 { 有女朋友,看起来自信,去健身房,不戴眼镜 } 有相互关系。用这些数据训练后的模型也会反应这些偏差,未来我也会扩大调查范围,收集更多数据。