Popular Science || 本福德定律数据中的真相
最编程
2024-06-09 16:12:18
...
概述
今天逛B站时看到了李永乐老师用“本福特定律”验证拜登选票的真实性的文章,在这里分享一下。感觉挺有意思的,纯分享而已。
No.1 定义
根据我们的自然认知,在不同位数的数据中以1为首位的概率为1/9。
一位数 P1=1/9
二位数 P1=10/90=1/9
三位数 P1=100/900=1/9
.......
然后在实际中并非如此,自然杂乱无章的数据首位为1的概率约为30.1%。推广开来也就是越大的数以其为首位出现的概率越低,以上就是本福特定律的定义。
No.2 说明
在10进制中,首位为n的概率为Pn=lg((n+1)/n).
P1=lg2=30.1%
P2=lg(3/2)=17.6%
......
P9=lg(10/9)=4.6%
总体如下图所示。
** No.3 应用**
应用的前提是数据需要符合一部分要求。
1.非人为规律
2.数据之间的跨度大
李老师举了很多例子去验证,如视频播放量、地区人口、国家GDP、国土面积、菲波那切数列等。
上一篇: 本福德定律的直观解释