DeepMind的新智能体开始颠覆传统科研 – 时代发展的印记

DeepMind的新智能体开始颠覆传统科研

网友【呵呵呵】 2025-05-24 06:57:00 分享在【时代发展的印记】版块 1 11

【AlphaEvolve，一把通用的科研大杀器】

OpenAI的CEO山姆·奥特曼（Sam Altman）最近多次说，2025年是智能体之年，2026年则是AI的创造力之年，标志是到时候AI将独立做出一项人类科学家无法完成的科学发现 —— 哪知道AlphaEvolve现在就把他这个目标给实现了。

AlphaEvolve已经独立做出了不是一项，而是多项人类科学家难以企及的、决定性的成果。

这可不是日常AI新闻。

我们多次讲， AI正在颠覆科研。

DeepMind之前就已经在好几个科研领域取得成果。不过之前的做法都是人类主导：DeepMind派出几位研究人员，科研领域出几个本地科学家，大家一事一议，训练一个专用AI模型解决问题，比如用AI做天气预报、AI控制核聚变装置的等离子体、AI识别古文字等等。

而 AlphaEvolve，则是一把通用的科研大杀器。你不需要请相关领域的专家帮忙，甚至你自己都不必特别懂那个问题：你只要能把问题给它说明白，它就能独立做出发现！

如果你突然得到一件能解决科学难题的神兵利器，你会怎么做？你大概不会第一时间就把它公之于众。你肯定要自己先试一试，破解几个科学难题，也许发几篇论文……更重要的是，你需要证明这把武器真的好用。

DeepMind的科学家正是这么做的。他们先用AlphaEvolve解决了一系列科学难题，才正式对外宣布。

首先是数学领域的难题。一个是矩阵乘法。一个M×N矩阵乘以一个N×P矩阵，你用个什么算法，能在其中少做几次乘法运算呢？AlphaEvolve一举刷新了十几项人类记录，具体的咱们等一下再说——

网友分享在meiguo.com上的图片

一个更有意思的难题是把小的正六边形堆叠进一个大的正六边形里，问你最多能放几个。或者我们换个问法：如果你有11个边长为1的小正六边形，要把它们互不重叠地堆进一个大的正六边形中，这个大六边形的最小边长应该是多少？

网友分享在meiguo.com上的图片

之前人类数学家找到的最优解是边长3.943，而AlphaEvolve找出了一种新的堆叠方式，使边长缩小到了3.931。类似地，堆叠12个正六边形的情况下，原本的最优解是边长为4，AlphaEvolve通过一个不规则的堆叠法，把它降到了3.942。

咱们再看实际应用。AlphaEvolve为Google的大规模计算集群设计了一种全新的任务调度算法，节省了0.7%的算力资源。

它优化了Google的张量处理器（TPU）芯片的电路设计算法。TPU工程师已经进行了严格验证，确认结果有效，并且准备在下一次芯片设计中使用。

它还改进了Google自家AI模型Gemini的大规模矩阵运算算法，把关键内核加速了23%，最终使整体训练时间缩短了1%。你要知道训练大模型很费电，这1%也是很大一笔钱。

它给的算法步骤都很清晰，你是真能用上。

什么领域的问题都能做，做出来都能用，这难道不令人赞叹吗？

【AlphaEvolve和AlphaGo走的是不同的路数】

而AlphaEvolve给的算法都很独特，你不知道它思考的逻辑是什么。这种感觉就像当年AlphaGo跟李世石下围棋时，有个著名的「第37手」[2]，让人类棋手当时都无法理解，可是后来证明是致胜的一手……不过从技术上说，AlphaEvolve和AlphaGo走的是不同的路数。

AlphaGo靠的是强化学习，AlphaEvolve用的则是演化算法。这就如同自然界的生物演化：一代代筛选改进，最终“演化”出优秀的解。咱们就以4×4的矩阵乘法为例具体说说。

学过线性代数的都知道，两个4×4矩阵相乘，结果还是一个4×4矩阵——

网友分享在meiguo.com上的图片

其中答案矩阵的左上角第一个数，是第一个矩阵的第一行和第二个矩阵的第一列对应元素相乘再相加得到的，其中总共4次乘法……那么以此类推，要算出答案矩阵的16个数，你需要做4×16=64次乘法，对吧？

但是1969年，德国数学家斯特拉森（Volker Strassen）提出了一个优化算法，说只要做49次乘法就够了。他怎么算的我也不知道，总之有这么一个算法。那你说有没有更好的算法？过去了整整56年，人类都没能再进一步。

直到AlphaEvolve出手。

首先你把问题给它说明白：我们要做4×4矩阵乘法的算法。然后你设定一个衡量标准：我们要求其中乘法运算的次数越少越好。然后你再把斯特拉森那个算法给它，作为初始的参考。那么AlphaEvolve将独立上演一场演化故事。

第一步，用Google现成的大模型把斯特拉森那个算法做些「变异」。这里用了两个模型，Gemini Flash 速度快，负责生成想法；Gemini Pro 动作精准，负责把生成的算法细化。这样你得到比如说100个新算法。

第二步，AlphaEvolve用脚本自动检查这些新算法是否能正确计算、其中各自使用了多少次乘法运算，据此给每个算法一个综合评分。

第三步，选择得分最高的几个“优胜者”，进入下一轮演化。也就是回到第一步再对它们做变异。

网友分享在meiguo.com上的图片

这样经过很多很多轮，你就能得到优秀的算法。

具体到这个矩阵问题，AlphaEvolve用了不到一天的时间，完成了几十万条算法的生成和筛选，最终发现了一种只需要48次乘法就能完成4×4矩阵乘法的新算法。于是取得突破。

变异、选择、迭代：这不是人类科学家解决问题的办法——但这恰恰是大自然解决问题的办法！

【AlphaEvolve演化方法的本质，是搜索】

可惜目前Google尚未对外开放AlphaEvolve的使用权限。据说是正在筹备一个早期学术试用计划（Early Access Program），会邀请一些研究者先试用……开放商业应用则是遥遥无期。但科学家们已经跃跃欲试，这里能做的事儿太多了——

比如供应链管理。外卖员手里有10份外卖，请问你怎么给他规划路线，先送哪个后送哪个，最能节省时间？这是一个著名的 NP-hard 难题，可以说只有优秀解没有「最优解」。那么哪怕AlphaEvolve能发明一个新算法，节省5%的时间，也是巨大的经济效益。

金融更不用说：高频交易、风险控制、资产配置，每一个决策背后都有复杂的优化问题。

AI模型训练消耗的算力越来越高，而AlphaEvolve已经展现了它优化算法和算力调度的能力。

再比如说药物设计、筛选新材料等等，可以说各行各业都能用上。

但是你注意到没有，AlphaEvolve最擅长处理的问题，几乎都跟算法优化有关。这些问题的特点是结构明确、目标清晰、评估标准可量化。那么就有专家提出 [3]，对于别的问题，它也能用吗？

DeepMind确实没有演示AlphaEvolve怎么帮助证明比如说黎曼猜想和哥德巴赫猜想……但我们先别说它就绝对不能。也许你只要找到合适的设定方式，那些难题也能被转化为优化问题？

但AlphaEvolve这个演化方法的本质，其实不是优化，而是「搜索」。就如同生物演化是在大自然中搜索解法一样，它其实就是在巨大的可能性空间中搜索解法。

这正好又应了理查德·萨顿（Richard Sutton）那个说法 [4]：只有两个技术可以在计算上无限地缩放，那就是「学习」和「搜索」。

如果你认同「所有求解本质上都是某种搜索」，那么AlphaEvolve就一点都不神秘，它只是在用庞大的算力，把搜索做到极致。

OpenAI的青年研究员杰森·魏（Jason Wei）对此有一番感慨——

网友分享在meiguo.com上的图片

他说AlphaEvolve这个搜索法，跟我们喜欢的强化学习（RL）可是两个路数……那难道说只要有模型的针对性训练+聪明的搜索，一切科学创新就都解决了吗？

我感觉他说的稍微有点酸……但其实没必要。强化学习也是一种搜索，只不过那种搜索中没有明确的量化指标，所以比较适合像自动驾驶、下棋、生成文章这些任务，而AlphaEvolve这种演化式的搜索更适合算法优化罢了。

【AI确实能够做出真正的创新】

我看AlphaEvolve的一个突破性贡献，是它首次明确地证明了，AI确实能够做出真正的创新。

从ChatGPT刚出来开始，就不断地有人说大语言模型只不过是「随机鹦鹉」，说它们没有真正的思想，不理解因果关系，还有人认为AI做数学题只是机械地使用套路，说题目稍微改动一下它们就不会了等等……

现在他们还有啥说的？AlphaEvolve已经解决了人类数学家几十年来都未能攻克的问题！

当然，我们也不能因此就断言AI可以完全自主地搞科研。 AlphaEvolve目前解决的问题，都是人类事先给它明确定义出来的。科学家至少有提出问题的权利，你仍然可以做微决策。

但我们必须承认，AI已经展现出真正的创造力。当然它的解题思路跟我们不一样，你可能觉得那些变异、筛选和迭代有机械味道，不像人类那样依靠直觉、灵感和顿悟 —— 但我要说的是，人类所谓的直觉、灵感和顿悟究竟是什么，你能说得清吗？

我们何尝不也是在头脑中苦苦搜索吗？从大脑的底层原理考虑，那些神来之笔也是某种搜索和重组。

可能AI在颠覆家政服务业之前，就已经颠覆了科研行业……对此我表示欢迎。但也许不会。不论如何，现在我们必须重新思考到底什么才是科研。

【AlphaEvolve 带来一个警示】

最后我想说的是，AlphaEvolve 带来一个警示。

它其实并没有一个绝对的停机时刻。每次都是研究者主动叫停的——说“到这里就可以了，不用再算了”，它才停下。你要是让它继续算，它可能会找到更好的算法。

这也就是说，让AI思考1小时和思考10分钟，得到的答案很可能是不一样的。那么对于特别复杂的难题，岂不是说谁买得起更多的算力时间，谁就能找到更优秀、更极致的解决方案吗？

这意味着什么呢？意味着人的聪明可能没用了。

以前你可以说，虽然我们公司设备略差，但我们的人更优秀，我们更重视教育和学习，所以我们的办法更聪明，我们还可以在市场上占有一席之地 —— 而以后，谁算力强谁就有更优的算法，谁拥有更优的算法，谁就有更先进的技术。

谁就有更强的商业竞争力，以及军事优势。

金融领域，高频交易，如果你的算法能比别人快0.1%，准确率高1%，那背后就是巨大的利润差距，甚至可能是生死存亡的差距。在军事领域，像指挥无人机蜂群这样的任务，战场瞬息万变，更是必须依赖AI算法的实时调度能力……

那岂不是说什么战略、什么思想、什么文化、什么教育都没意义 —— 「Scaling Law（缩放定律）」之下算力就是一切吗？

出处：头条号 @商财洞察君

这家伙浪费了“黄金广告位”，啥也没签！