收藏文章 楼主
计算机科学界的40年共识遭遇了一名本科大学生🤦
网友【好样的】 2025-04-21 03:37:39 分享在【时代发展的印记】版块    1    10

这是一个听起来像是电影剧本的真实故事。

网友分享在meiguo.com上的图片

一个本科生,偶然翻到了一篇论文,随手琢磨着“玩一玩”,结果就顺手推翻了计算机科学界坚持了40年的核心理论。没错,你没有听错,不是博士生,不是某个顶尖实验室的教授,而是一个普普通通的大学生,凭借一时的好奇心,撼动了整个学术界的根基。

这听起来不可思议,但它确实发生了。

故事的主角叫安德鲁·克拉皮文(Andrew Krapivin),那年他还只是罗格斯大学的一名本科生。他无意中读到了一篇题为《Tiny Pointers》的论文,最初没怎么在意,毕竟这只是成千上万篇学术论文中的一篇。可两年后,他出于好奇,重新翻开了那篇论文,“就当是消遣吧”,他后来回忆道。

然后,历史的齿轮就这么悄无声息地转动了。

【01】

那篇论文谈的是指针优化——一种在计算机内存中指向数据位置的技术。说白了,就是让数据存储和查找更高效,节省空间。克拉皮文在阅读过程中突然冒出一个念头:“如果我能让这些指针更小一点,节省的内存会不会更多?”

网友分享在meiguo.com上的图片

但要做到这一点,他需要重新思考指针指向的数据该如何组织。于是,他顺理成章地接触到了计算机科学中最经典的数据结构之一:哈希表(Hash Table)。

哈希表的概念很简单,它就像一间有无数抽屉的档案柜,每个抽屉有自己的编号(哈希值)。你想存或取某个文件,只需要知道它的编号,直接打开对应的抽屉即可。它的高效性让它成为计算机世界的“瑞士军刀”,从数据库到操作系统,甚至你手机里的APP,背后几乎都离不开它。

但克拉皮文并没有止步于使用哈希表,而是开始思考:“我能不能让它更快?”

【02】

他发现了一种全新的哈希表设计,能够比现有技术更快地查找和插入数据。最初,他以为这只是一个有趣的小改进,直到他把这个想法分享给他的导师,著名计算机科学家马丁·法拉赫-科尔顿(Martín Farach-Colton)。

科尔顿一开始并不相信。毕竟,哈希表是计算机科学界研究最透彻的数据结构之一,无数顶尖学者钻研了几十年,能有什么“突破”早就被挖掘干净了。他甚至觉得这不过是一个年轻学生的小聪明。

但出于严谨,他还是找来了自己的老搭档、卡内基梅隆大学的威廉·库兹毛尔(William Kuszmaul)帮忙验证。没想到,库兹毛尔看完后,反应却完全相反:

“你不仅仅设计了一个新的哈希表,你实际上推翻了计算机科学界40年来一直坚信的一个核心猜想!”

【03】

被推翻的,是计算机科学界一个被奉为圭臬的理论——姚氏猜想(Yao’s Conjecture)

这个猜想的提出者,是鼎鼎大名的姚期智教授,图灵奖得主,计算复杂性领域的奠基人之一。他在1985年提出,在特定条件下,哈希表的查询和插入操作无法突破某个效率极限。这个极限简单来说就是:当哈希表越来越满,找到一个空位的时间复杂度,至少是和数据填满程度成正比的。

举个简单的例子:

当你的哈希表填满了99%时,平均可能需要尝试100个位置才能找到一个空位;

当填满99.9%时,你可能需要尝试1000个位置。

这听起来非常合理,几乎符合直觉。毕竟,当停车场只剩下几个空位,你肯定得多绕几圈才能找到空车位,对吧?

问题是,克拉皮文做到了违背直觉的事情。

他发现了一种全新的哈希表结构,在最糟糕的情况下,查询和插入数据的复杂度竟然不是线性的,而是和 (log x)² 成正比。

简单来说:

当填满99%时,你不需要找100次;

当填满99.9%时,你甚至不需要找1000次;

你只需要少得多的尝试,几乎是“轻松找到”。

这是什么概念?这意味着在处理大规模数据时,效率提升可以是指数级的。而且,他们证明了这个结果不仅仅是“更快”,而是理论上的最优解——没有任何算法能比这更快了。

【04】

如果你以为这个故事到这里就结束了,那你低估了这个团队的“魔法操作”。

除了推翻姚氏猜想之外,克拉皮文和他的导师们在同一篇论文中,顺手又解决了另一个计算机科学界的难题——平均查询时间的极限。

姚期智教授在1985年的论文中,还提到了另一个结论:对于一种叫“贪心型哈希表”的结构,平均查询时间的下限是 log x。

意思是,哪怕你优化到极致,平均查询数据的速度也不可能比 log x 更快。这个结论同样被学界视为“铁律”,没人怀疑它的正确性。

结果,克拉皮文团队表示:“不对啊,我们发现可以更快。”

他们找到了一个非贪心型的哈希表,平均查询时间竟然和数据量完全无关,是一个固定的常数。换句话说,不管数据量有多大,哈希表有多满,查询数据的速度始终保持不变。

这个结果震惊了所有人。连研究团队自己都一度不敢相信,反复验证了无数次,才敢将其发表。

【05】

2025年1月,这篇划时代的论文正式发表,学术界的反应可以用“地震”来形容。

康奈尔大学的亚历克斯·康韦表示:“哈希表是计算机科学中最基础的数据结构,能在这个领域取得这样的突破,堪称奇迹。”

卡内基梅隆大学的盖伊·布雷洛赫更是直言:“这不仅仅是推翻一个猜想,而是直接给出了完美答案。”

这项研究或许不会立刻应用到你的手机里,但它已经为未来的技术发展打开了新的大门。无论是大规模数据库、人工智能训练,还是高并发的互联网服务,这种效率提升最终都会影响到每个人的日常生活。

克拉皮文的故事再次验证了一句话:科学的突破,往往来自那些不知道“不可能”的人。

他没有被前人的理论束缚,因为他根本不知道有这个“权威猜想”。正是这种无知带来的纯粹好奇心,成就了这次改变历史的发现。

有时候,改变世界并不需要多么深奥的理论,也不一定要站在最高的学术殿堂。它可能只是一个学生,翻开了一篇旧论文,然后心血来潮地问了自己一句:

“这东西……我好像可以再试试。”

出处:头条号 @再建巴别塔

meiguo.com 发布人签名/座右铭这家伙浪费了“黄金广告位”,啥也没签!
大家都在看
楼主新近贴
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

10   2025-04-21 03:37:39  回复

回复/评论:计算机科学界的40年共识遭遇了一名本科大学生🤦

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 川普总统宣布加沙战争结束,峰会聚焦“中东和平”!
  2. 中美稀土博弈,美国政策在急转直下!
  3. 川普政府“双失利”?
  4. 佛罗里达的一名中学生在AI提问,然后被捕了!
  5. 美股市值突破“全球GDP半数”大关
  6. 谷歌的科学家已经连续两年摘得了诺贝尔奖
  7. 45岁后“人生黄金期”是认知和创造力的新高峰
  8. 美国司法部起诉了柬埔寨“电信诈骗集团”的头目
  9. 川普总统在联合国演讲,声称中国不愿用风力发电?
  10. 700万人参与了反川普集会?
  11. AWS最大区域故障,带崩多项服务!
  12. 大学排名更新:顶尖学府稳固,新兴学校快速上升
  13. TikTok美国业务的“合规运营”方案细节披露
  14. 马斯克的模块化生产技术在革新汽车行业
  15. Zillow和Redfin“摊上大事儿”!五大州的总检察长起诉了房产平台合谋做局
  16. 福建舰“电磁弹射系统技术”获全球关注
  17. 中美因为“稀土管制”引发的贸易摩擦升级了
  18. 联合国大会“史上最尴尬”一幕:他上台后,观众纷纷撤离!
  19. 全球高等教育的新趋势:留学生求学地“多元化”
  20. 川普政府打算发放两千美元的关税补贴
  21. 美国青少年“67”流行语的现象引关注
  22. 在美国买房半年后,总结了两个扎心感受!
  23. 马斯克成为全球首位身家5000亿美元的富豪
  24. 中美贸易的争端升级,中国实施“长臂管辖”颁布3项针对性措施!
  25. 美国“风行者”超大运输机计划曝光
  26. 美国的房地产市场显现了矛盾信号
  27. 川普政策变动,竟然催生了智利的生育旅游热潮?
  28. 母亲给大一女儿恋爱八项要求
  29. 我的人生有三个账户!伊隆·马斯克在斯坦福大学的最新演讲
  30. 川普总统签署了备忘录,贩毒集团成为“国家之敌”!
  31. 骨胶水的研发获突破,临床试验显示了安全有效!
  32. 华人购房遭遇国籍歧视,法院裁决后依然隐忧犹存!
  33. 马斯克的净资产创纪录,突破5000亿美元!
  34. 中美航班“绕行俄罗斯领空”政策引关注
  35. 美国“H-1B”签证新规:在境内的申请人,免缴10万美元费用!
  36. 联邦法院驳回了川普政府的“出生公民权”行政令

美国动态 美果搜索

Your IP: 216.73.216.0, 2025-11-04 07:44:40

Processed in 0.05373 second(s)

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
已有0次打赏
(10) 分享
分享
取消