收藏文章 楼主
真假数据的“照妖镜” 关于本福特定律
网友【白晓剩】 2020-11-13 20:54:53 分享在【时代发展的印记】版块    1    5

识别伪造数据,一般都需要专业人士运用专业知识分析数据,作出判断。有没有一种简单的办法,只对数据本身的结构进行分析,而不用理解数据的专业含义,就能看出数据是否造假了呢?就是“外行”也能看出来数据真假?有!这就是神奇的本福特定律。

网友分享在meiguo.com上的图片
图源:网络

本福特定律是说,如果给出一个足够大数量的自然产生的数据,那么其首位开头数字的出现是有规律的,即以数字 1 开头的数据占数据总量的 30.1%,以数字 2 开头的数据占数据总量的 17.6%,等等,以此类推。下面这个表格列出了从 1 到 9 的首位数开头数字的出现概率。

网友分享在meiguo.com上的图片
分别以 1 到 9 开头的数据在整个数据中出现的概率列表

根据这个定律,以数字 1,2,3,4,5,6,7,8,9 开头的数据,占整个数据总量的比例是依次递减的,其出现的概率是恒定的。数学表达式如下。

网友分享在meiguo.com上的图片
本福特定律公式。n 为首位数字

用这个公式,可以计算出不同的首位数字的数字占比。比如当 n = 1 时,就得出首位数为 1 的出现概率为 0.30102999566, 约为 30.01%。

因为这个定律对数据来源的定义不够规范,所以不能严格的证明。但是,当限定条件后,是可以用数学证明它的正确性的。

这个定律最奇妙的地方在于,只有“自然”产生的数据,也就是没有人为修改过的数据才符合这个规律。否则,这个定律就不适用了。另外数据量越大,其结果拟合得越好,一般至少需要 3000 个以上的数据才行。

网友分享在meiguo.com上的图片
西蒙·纽康 (Simon Newcomb)。图源:网络

枯燥的数据竟然还有如此奇特的规律,它是谁发现的呢?最早发现这个有趣现象的是北美(现属于加拿大)天文学家西蒙·纽康(Simon Newcomb)。1881 年,他在翻阅对数表是偶然发现一个现象,前几页的破损程度远超过后面的页数。经过仔细研究他发现,原来自然界中存在的数字不是均匀的,而是首位数为 1 的数据出现的概率总是最大的,首位数为 2 的次之,以此类推。1938 年,物理学家本福特也发现了这个规律,这个规律便以他的名字命名了。

本福特定律在实际中被应用于数据欺骗检测和股票市场分析等领域。最有名的案例是安然公司财务造假案。安然公司曾经是世界上最大的能源和服务公司之一,名列《财富》杂志“美国500强”的第七名。在 2001 年,公司传出财务造假丑闻。有人对安然公司的财务报表数据用本福特定律检验,其结果令人惊讶。下图显示,在 2001 年以前安然公司的报表数据(左图)都严格拟合了本福特定律,只有 2001 年的数据(右图)不符合该定律,显示出有明显的人为篡改痕迹。安然公司随后申请破产倒闭。

网友分享在meiguo.com上的图片
安然公司历年财务数据与本福特定律的拟合程度分析图。图源:网络

让我们把这个规律用到当下最吸引眼球的一件事上:美国大选。参选的共和党和民主党正在相互指责对方在计票上造假。正常的计票结果,只要没有被人为改动过,数量足够大,就应该符合本福特定律的。下图是最近美国一位数据专家罗伯特·博耐瓦托(Robert Bonavito), 根据大选期间公布的宾夕法尼亚州的选举票数作出的分析图。左图是民主党候选人拜登的选票分析,右图是现任总统川普的,两人在宾州的总得票数都超过了三百万票,数据足够大了。大家可以通过这张图自己分析一下,宾州的选票统计有没有造假?

网友分享在meiguo.com上的图片
Robert Bonavito 的分析图。图源:视频截图 https://www.youtube.com/watch?v=1ald3w9FBmA

出处:头条号 @此岸彼岸君何在

meiguo.com 发布人签名/座右铭有我不知晓的吗?如果有请留言或评论告诉我!
大家都在看
楼主新近贴
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

5   2020-11-13 20:54:53  回复

回复/评论:真假数据的“照妖镜” 关于本福特定律

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 45岁后“人生黄金期”是认知和创造力的新高峰
  2. 中美航班“绕行俄罗斯领空”政策引关注
  3. 700万人参与了反川普集会?
  4. 中美稀土博弈,美国政策在急转直下!
  5. 美国“风行者”超大运输机计划曝光
  6. 中美因为“稀土管制”引发的贸易摩擦升级了
  7. 中美贸易的争端升级,中国实施“长臂管辖”颁布3项针对性措施!
  8. 我的人生有三个账户!伊隆·马斯克在斯坦福大学的最新演讲
  9. 联邦法院驳回了川普政府的“出生公民权”行政令
  10. 川普政府打算发放两千美元的关税补贴
  11. 佛罗里达的一名中学生在AI提问,然后被捕了!
  12. 华人购房遭遇国籍歧视,法院裁决后依然隐忧犹存!
  13. Zillow和Redfin“摊上大事儿”!五大州的总检察长起诉了房产平台合谋做局
  14. 美国司法部起诉了柬埔寨“电信诈骗集团”的头目
  15. 母亲给大一女儿恋爱八项要求
  16. 大学排名更新:顶尖学府稳固,新兴学校快速上升
  17. AWS最大区域故障,带崩多项服务!
  18. 美国“H-1B”签证新规:在境内的申请人,免缴10万美元费用!
  19. MIT稳居了CS榜首!美国大学的最新排名出炉
  20. 川普总统在联合国演讲,声称中国不愿用风力发电?
  21. 骨胶水的研发获突破,临床试验显示了安全有效!
  22. 全球高等教育的新趋势:留学生求学地“多元化”
  23. 川普总统宣布加沙战争结束,峰会聚焦“中东和平”!
  24. 在美国买房半年后,总结了两个扎心感受!
  25. TikTok美国业务的“合规运营”方案细节披露
  26. 谷歌的科学家已经连续两年摘得了诺贝尔奖
  27. 川普总统签署了备忘录,贩毒集团成为“国家之敌”!
  28. 马斯克成为全球首位身家5000亿美元的富豪
  29. 马斯克的模块化生产技术在革新汽车行业
  30. 美国的房地产市场显现了矛盾信号
  31. 川普政府“双失利”?
  32. 联合国大会“史上最尴尬”一幕:他上台后,观众纷纷撤离!
  33. 美股市值突破“全球GDP半数”大关
  34. 美国青少年“67”流行语的现象引关注
  35. 马斯克的净资产创纪录,突破5000亿美元!
  36. 福建舰“电磁弹射系统技术”获全球关注

美国动态 美果搜索

Your IP: 216.73.216.99, 2025-11-08 19:44:30

Processed in 0.04794 second(s)

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
已有0次打赏
(5) 分享
分享
取消