收藏文章 楼主
DeepMind的新智能体开始颠覆传统科研
网友【呵呵呵】 2025-05-24 06:57:00 分享在【时代发展的印记】版块    1    11

【AlphaEvolve,一把通用的科研大杀器】

OpenAI的CEO山姆·奥特曼(Sam Altman)最近多次说,2025年是智能体之年,2026年则是AI的创造力之年,标志是到时候AI将独立做出一项人类科学家无法完成的科学发现 —— 哪知道AlphaEvolve现在就把他这个目标给实现了。

AlphaEvolve已经独立做出了不是一项,而是多项人类科学家难以企及的、决定性的成果。

这可不是日常AI新闻。

我们多次讲, AI正在颠覆科研。

DeepMind之前就已经在好几个科研领域取得成果。不过之前的做法都是人类主导:DeepMind派出几位研究人员,科研领域出几个本地科学家,大家一事一议,训练一个专用AI模型解决问题,比如用AI做天气预报、AI控制核聚变装置的等离子体、AI识别古文字等等。

而 AlphaEvolve,则是一把通用的科研大杀器。 你不需要请相关领域的专家帮忙,甚至你自己都不必特别懂那个问题: 你只要能把问题给它说明白,它就能独立做出发现!

如果你突然得到一件能解决科学难题的神兵利器,你会怎么做?你大概不会第一时间就把它公之于众。你肯定要自己先试一试,破解几个科学难题,也许发几篇论文……更重要的是,你需要证明这把武器真的好用。

DeepMind的科学家正是这么做的。他们先用AlphaEvolve解决了一系列科学难题,才正式对外宣布。

首先是数学领域的难题。一个是矩阵乘法。一个M×N矩阵乘以一个N×P矩阵,你用个什么算法,能在其中少做几次乘法运算呢?AlphaEvolve一举刷新了十几项人类记录,具体的咱们等一下再说——

网友分享在meiguo.com上的图片

一个更有意思的难题是把小的正六边形堆叠进一个大的正六边形里,问你最多能放几个。或者我们换个问法:如果你有11个边长为1的小正六边形,要把它们互不重叠地堆进一个大的正六边形中,这个大六边形的最小边长应该是多少?

网友分享在meiguo.com上的图片

之前人类数学家找到的最优解是边长3.943,而AlphaEvolve找出了一种新的堆叠方式,使边长缩小到了3.931。类似地,堆叠12个正六边形的情况下,原本的最优解是边长为4,AlphaEvolve通过一个不规则的堆叠法,把它降到了3.942。

咱们再看实际应用。AlphaEvolve为Google的大规模计算集群设计了一种全新的任务调度算法,节省了0.7%的算力资源。

它优化了Google的张量处理器(TPU)芯片的电路设计算法。TPU工程师已经进行了严格验证,确认结果有效,并且准备在下一次芯片设计中使用。

它还改进了Google自家AI模型Gemini的大规模矩阵运算算法,把关键内核加速了23%,最终使整体训练时间缩短了1%。你要知道训练大模型很费电,这1%也是很大一笔钱。

它给的算法步骤都很清晰,你是真能用上。

什么领域的问题都能做,做出来都能用,这难道不令人赞叹吗?

【AlphaEvolve和AlphaGo走的是不同的路数】

而AlphaEvolve给的算法都很独特,你不知道它思考的逻辑是什么。这种感觉就像当年AlphaGo跟李世石下围棋时,有个著名的「第37手」[2],让人类棋手当时都无法理解,可是后来证明是致胜的一手……不过从技术上说,AlphaEvolve和AlphaGo走的是不同的路数。

AlphaGo靠的是强化学习,AlphaEvolve用的则是演化算法。这就如同自然界的生物演化:一代代筛选改进,最终“演化”出优秀的解。咱们就以4×4的矩阵乘法为例具体说说。

学过线性代数的都知道,两个4×4矩阵相乘,结果还是一个4×4矩阵——

网友分享在meiguo.com上的图片

其中答案矩阵的左上角第一个数,是第一个矩阵的第一行和第二个矩阵的第一列对应元素相乘再相加得到的,其中总共4次乘法……那么以此类推,要算出答案矩阵的16个数,你需要做4×16=64次乘法,对吧?

但是1969年,德国数学家斯特拉森(Volker Strassen)提出了一个优化算法,说只要做49次乘法就够了。他怎么算的我也不知道,总之有这么一个算法。那你说有没有更好的算法?过去了整整56年,人类都没能再进一步。

直到AlphaEvolve出手。

首先你把问题给它说明白:我们要做4×4矩阵乘法的算法。然后你设定一个衡量标准:我们要求其中乘法运算的次数越少越好。然后你再把斯特拉森那个算法给它,作为初始的参考。那么AlphaEvolve将独立上演一场演化故事。

第一步,用Google现成的大模型把斯特拉森那个算法做些「变异」。 这里用了两个模型,Gemini Flash 速度快,负责生成想法;Gemini Pro 动作精准,负责把生成的算法细化。这样你得到比如说100个新算法。

第二步,AlphaEvolve用脚本自动检查这些新算法是否能正确计算、其中各自使用了多少次乘法运算,据此给每个算法一个综合评分。

第三步,选择得分最高的几个“优胜者”,进入下一轮演化。也就是回到第一步再对它们做变异。

网友分享在meiguo.com上的图片

这样经过很多很多轮,你就能得到优秀的算法。

具体到这个矩阵问题,AlphaEvolve用了不到一天的时间,完成了几十万条算法的生成和筛选,最终发现了一种只需要48次乘法就能完成4×4矩阵乘法的新算法。于是取得突破。

变异、选择、迭代:这不是人类科学家解决问题的办法——但这恰恰是大自然解决问题的办法!

【AlphaEvolve演化方法的本质,是搜索】

可惜目前Google尚未对外开放AlphaEvolve的使用权限。据说是正在筹备一个早期学术试用计划(Early Access Program),会邀请一些研究者先试用……开放商业应用则是遥遥无期。但科学家们已经跃跃欲试,这里能做的事儿太多了——

比如供应链管理。外卖员手里有10份外卖,请问你怎么给他规划路线,先送哪个后送哪个,最能节省时间?这是一个著名的 NP-hard 难题,可以说只有优秀解没有「最优解」。那么哪怕AlphaEvolve能发明一个新算法,节省5%的时间,也是巨大的经济效益。

金融更不用说:高频交易、风险控制、资产配置,每一个决策背后都有复杂的优化问题。

AI模型训练消耗的算力越来越高,而AlphaEvolve已经展现了它优化算法和算力调度的能力。

再比如说药物设计、筛选新材料等等,可以说各行各业都能用上。

但是你注意到没有,AlphaEvolve最擅长处理的问题,几乎都跟算法优化有关。这些问题的特点是结构明确、目标清晰、评估标准可量化。那么就有专家提出 [3],对于别的问题,它也能用吗?

DeepMind确实没有演示AlphaEvolve怎么帮助证明比如说黎曼猜想和哥德巴赫猜想……但我们先别说它就绝对不能。也许你只要找到合适的设定方式,那些难题也能被转化为优化问题?

但AlphaEvolve这个演化方法的本质,其实不是优化,而是「搜索」。就如同生物演化是在大自然中搜索解法一样,它其实就是在巨大的可能性空间中搜索解法。

这正好又应了理查德·萨顿(Richard Sutton)那个说法 [4]:只有两个技术可以在计算上无限地缩放,那就是「学习」和「搜索」。

如果你认同「所有求解本质上都是某种搜索」,那么AlphaEvolve就一点都不神秘,它只是在用庞大的算力,把搜索做到极致。

OpenAI的青年研究员杰森·魏(Jason Wei)对此有一番感慨——

网友分享在meiguo.com上的图片

他说AlphaEvolve这个搜索法,跟我们喜欢的强化学习(RL)可是两个路数……那难道说只要有模型的针对性训练+聪明的搜索,一切科学创新就都解决了吗?

我感觉他说的稍微有点酸……但其实没必要。强化学习也是一种搜索,只不过那种搜索中没有明确的量化指标,所以比较适合像自动驾驶、下棋、生成文章这些任务,而AlphaEvolve这种演化式的搜索更适合算法优化罢了。

AI确实能够做出真正的创新】

我看AlphaEvolve的一个突破性贡献,是它首次明确地证明了,AI确实能够做出真正的创新。

从ChatGPT刚出来开始,就不断地有人说大语言模型只不过是「随机鹦鹉」,说它们没有真正的思想,不理解因果关系,还有人认为AI做数学题只是机械地使用套路,说题目稍微改动一下它们就不会了等等……

现在他们还有啥说的?AlphaEvolve已经解决了人类数学家几十年来都未能攻克的问题!

当然,我们也不能因此就断言AI可以完全自主地搞科研。 AlphaEvolve目前解决的问题,都是人类事先给它明确定义出来的。 科学家至少有提出问题的权利,你仍然可以做微决策。

但我们必须承认,AI已经展现出真正的创造力。当然它的解题思路跟我们不一样,你可能觉得那些变异、筛选和迭代有机械味道,不像人类那样依靠直觉、灵感和顿悟 —— 但我要说的是,人类所谓的直觉、灵感和顿悟究竟是什么,你能说得清吗?

我们何尝不也是在头脑中苦苦搜索吗?从大脑的底层原理考虑,那些神来之笔也是某种搜索和重组。

可能AI在颠覆家政服务业之前,就已经颠覆了科研行业……对此我表示欢迎。但也许不会。不论如何,现在我们必须重新思考到底什么才是科研。

【AlphaEvolve 带来一个警示】

最后我想说的是,AlphaEvolve 带来一个警示。

它其实并没有一个绝对的停机时刻。 每次都是研究者主动叫停的——说“到这里就可以了,不用再算了”,它才停下。你要是让它继续算,它可能会找到更好的算法。

这也就是说,让AI思考1小时和思考10分钟,得到的答案很可能是不一样的。那么对于特别复杂的难题,岂不是说谁买得起更多的算力时间,谁就能找到更优秀、更极致的解决方案吗?

这意味着什么呢?意味着人的聪明可能没用了。

以前你可以说,虽然我们公司设备略差,但我们的人更优秀,我们更重视教育和学习,所以我们的办法更聪明,我们还可以在市场上占有一席之地 —— 而以后,谁算力强谁就有更优的算法,谁拥有更优的算法,谁就有更先进的技术。

谁就有更强的商业竞争力,以及军事优势。

金融领域,高频交易,如果你的算法能比别人快0.1%,准确率高1%,那背后就是巨大的利润差距,甚至可能是生死存亡的差距。在军事领域,像指挥无人机蜂群这样的任务,战场瞬息万变,更是必须依赖AI算法的实时调度能力……

那岂不是说什么战略、什么思想、什么文化、什么教育都没意义 —— 「Scaling Law(缩放定律)」之下算力就是一切吗?

出处:头条号 @商财洞察君

meiguo.com 发布人签名/座右铭这家伙浪费了“黄金广告位”,啥也没签!
大家都在看
楼主新近贴
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

11   2025-05-24 06:57:00  回复

回复/评论:DeepMind的新智能体开始颠覆传统科研

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 能熟练运用AI也不行?硅谷的40万人在近期被炒鱿鱼
  2. 英伟达的市值突破了四万亿美元,创人类历史纪录!
  3. 美国房价仍然高位,“美国梦”成奢望!
  4. 美国新法案“大漂亮”引发了全球资本配置大调整
  5. 遥控器电池,被幼儿误吞… 欧系保险公司赔付了近1.4亿元人民币!
  6. 川普家族“哈佛风波”和签证政策的突变
  7. 中国政府在构筑战略资源防线,重拳打击稀土走私!
  8. 川普总统宣布“金卡计划”网站开放
  9. 美国“非法移民家庭”遣返行动引发了“婴幼儿无国籍”的危机
  10. 川普和马斯克的公开交锋升级了
  11. 川普政府的关税政策或将加速中国崛起,助力中国成为全球的经济主导力量!
  12. 任天堂的Switch 2正式发售,参数细节全曝光!
  13. 互联网女皇“340页AI报告”猛料刷屏
  14. 世界瞩目的电话,十个不寻常的细节剖析!
  15. 孩子沉迷手机的真相和破局之道
  16. 难怪马斯克公开认错… 川普总统的相关杀器可以更多?
  17. 川普总统声称希望中国“增加美油采购”
  18. 英国2岁男童竟然刷新了门萨俱乐部“最年轻男性”会员纪录
  19. 中美通话的内容简短,但意味深长!
  20. 马斯克声称川普在“爱泼斯坦名单”,白宫回应:局面令人遗憾!
  21. 美国国会通过了减税法案,马斯克和川普总统再次激烈交锋!
  22. 美国移民新机遇:紧缺人才的绿卡通道“无需排期”
  23. 中美两国元首针对当下双边关系和经贸合作,☎️通话交流!
  24. 属于中国的世纪可能已经到来
  25. 手机充电习惯是影响电池寿命的根本原因
  26. 韦伯望远镜(JWST)发布迄今为止最大的早期宇宙地图
  27. QQ等级256级用户诞生,首次解锁“时光企鹅”图标!
  28. 美国暂停了学生签证预约,申请者在社交媒体平台的活动须谨慎!
  29. 比尔盖茨的财富突然蒸发了510亿美元,真相却令人肃然起敬!
  30. 鲁比奥声称将会收紧中国留学生的签证审批政策
  31. 宗庆后家族的多处海外房产曝光,价值数亿元!
  32. 川普总统:加拿大可以免费加入“金穹”导弹防御系统
  33. 川普总统批评支持者,马斯克激烈回应!
  34. 马斯克的“130天政府生涯”终结后…
  35. 萝莉岛是美国的政治中心?马斯克并非不懂政治,而是太懂了!
  36. 马斯克打算组建新党“美国党”代表中间派

美国动态 美果搜索

Your IP: 216.73.216.12, 2025-07-27 12:40:13

Processed in 0.04191 second(s)

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息