史蒂夫·纳迪斯特约撰稿人
余莹 在加州大学圣地亚哥分校 (University of California, San Diego) 俯瞰着拉霍亚海岸 (La Jolla Shores),他构建了使用物理原理解决实际问题的神经网络。
当她 10 岁时,余莹收到了一份生日礼物,这将改变她的生活——甚至可能改变我们学习物理的方式。她的叔叔给她买了一台电脑。这在 25 年前的中国是一种稀有商品,这份礼物也没有被闲置。起初,Yu 主要玩电脑游戏,但在中学时,她获得了网页设计奖。这是许多与计算机相关的荣誉中的第一个。
余莹 继续在浙江大学主修计算机科学,并获得了创新研究奖。对于她的研究生学习,她选择了南加州大学 (USC),部分原因是同一个叔叔——他是她在美国唯一认识的人——当时在附近帕萨迪纳的喷气推进实验室工作。Yu 于 2017 年获得最佳论文奖,获得博士学位。她最近的荣誉是在 1 月份,当时乔·拜登总统在任期的最后一周授予她总统早期职业奖。
余莹现在是加州大学圣地亚哥分校 (UCSD) 的副教授,是“物理引导深度学习”领域的领导者,多年来一直将我们的物理学知识整合到人工神经网络中。这项工作不仅引入了构建和训练这些系统的新技术,而且还使她在几个实际应用方面取得了进展。她利用流体动力学原理来改进交通预测,加快了湍流的模拟以增强我们对飓风的理解,并设计了帮助预测 Covid-19 传播的工具。
这项工作使 余莹 更接近她的宏伟梦想——部署一套她称之为 AI Scientist 的数字实验室助手。她现在设想了她所说的人类研究人员和 AI 工具之间的“伙伴关系”,完全基于物理学原理,因此能够产生新的科学见解。在她看来,结合这些助手团队的意见可能是促进发现过程的最佳方式。
Quanta 与 余莹 讨论了各种形式的动荡、如何充分利用 AI 以及它如何帮助我们摆脱城市僵局。为清晰起见,采访经过了压缩和编辑。
余莹 在加州大学圣地亚哥分校(UCSD)校园里担任副教授。
Peggy Peattie 为 Quanta 杂志拍摄
您第一次尝试将物理学与深度学习相结合是什么时候?
它始于交通。我是南加州大学的研究生,校园就在 I-10 和 I-110 的交叉口附近。要到达任何地方,你必须穿过大量的交通,这可能非常烦人。2016 年,我开始怀疑我是否可以对此做些什么。
深度学习(使用多层神经网络从数据中获取模式)在当时非常热门。图像分类中的应用已经让人兴奋不已,但图像只是静态的东西。我想知道深度学习是否可以帮助解决不断变化的问题。我不是第一个考虑这个问题的人,但我和我的同事确实找到了一种新颖的方法来构建这个问题。
您的新方法是什么?
首先,我们从扩散的物理过程的角度来考虑交通。在我们的模型中,道路网络上的交通流类似于流体在表面上的流动——运动受流体动力学定律的支配。但我们的主要创新是从图论的数学领域将交通视为一个图形。监控高速公路和其他道路上交通的传感器充当该图的节点。图形的边缘表示这些传感器之间的道路(和距离)。
余莹对计算机的兴趣始于她 10 岁生日的礼物。
Peggy Peattie 为 Quanta 杂志拍摄
图表提供了在给定时间整个道路网络的快照,告诉您图表上每个点的汽车平均速度。当您将一系列快照放在一起时,每隔五分钟间隔一次,您可以很好地了解交通如何演变。从那里,您可以尝试预测未来会发生什么。
深度学习的最大挑战是需要大量数据来训练神经网络。幸运的是,我的一位顾问 Cyrus Shahabi 多年来一直致力于交通预测问题,他积累了大量洛杉矶的交通数据,我可以访问这些数据。
那么你的预测有多好呢?
在我们工作之前,人们只能做出大约 15 分钟的可靠交通预测。我们的预测有效期为 1 小时——这是一个很大的进步。我们的代码于 2018 年由 Google Maps 部署。不久之后,Google 邀请我成为一名访问研究员。
那时你就是开始从事气候建模工作的时候,对吧?
是的,这始于 2018 年,当时我在劳伦斯伯克利国家实验室发表了演讲。之后,我与那里的科学家进行了交谈,我们寻找了一个问题,该问题可以成为物理引导深度学习的良好测试平台。我们决定预测湍流的演变,这是气候模型中的一个关键因素,也是一个主要不确定性的领域。
熟悉的湍流示例是将牛奶倒入一杯咖啡并搅拌后看到的漩涡图案。在海洋中,像这样的漩涡可以跨越数千英里。基于求解描述流体流动的 Navier-Stokes 方程的湍流行为预测被认为是该领域的黄金标准。但是所需的计算非常缓慢,这就是为什么我们没有预测飓风和热带气旋的良好模型。
洛杉矶的严重拥堵首先激发了 Yu 将高速公路交通建模为流体流动的灵感。
Peggy Peattie 为 Quanta 杂志拍摄
深度学习可以提供帮助吗?
基本思想是,在我们最好的数值模拟上训练的深度神经网络可以学习模仿——或者正如我们所说的,“模拟”——这些模拟。它们通过识别隐藏在数据中的属性和模式来实现这一点。他们不必通过耗时的蛮力计算来找到近似解。我们的模型在二维设置中将预测速度提高了 20 倍,在三维设置中将预测速度提高了 1,000 倍。有朝一日,像我们的湍流预测模块这样的东西可能会入到更大的气候模型中,这些模型可以更好地预测飓风等事件。
湍流还会出现在哪些地方?
它几乎无处不在。例如,血流中的湍流会导致中风或心脏病发作。当我在加州理工学院 [加州理工学院] 做博士后时,我与人合著了一篇研究稳定无人机的论文。螺旋桨产生的气流与地面相互作用,产生湍流。这反过来又会导致无人机晃动。我们使用神经网络对湍流进行建模,从而在起飞和降落过程中更好地控制无人机。
我目前正在与加州大学圣地亚哥分校(UCSD)和通用原子公司(General Atomics)的科学家们合作研究聚变能。成功的关键之一是学习如何控制等离子体,等离子体是物质的热电离相。在大约 1 亿度的温度下,等离子体内部会出现不同类型的湍流,而描述这种行为的基于物理的数值模型非常缓慢。我们正在开发一种深度学习模型,应该能够在瞬间预测等离子体的行为,但这仍在进行中。
Yu 和博士生 Jianke Yang 在她在 UCSD 的办公室里。
Peggy Peattie 为 Quanta 杂志拍摄
您的 AI 科学家想法从何而来?
在过去的几年里,我的团队开发了可以从数据中自动发现对称原理的 AI 算法。例如,我们的算法确定了洛伦兹对称性,这与光速的恒定性有关。我们的算法还确定了旋转对称性——例如,无论你如何旋转,球体看起来都没有任何不同——这是它没有经过专门训练了解的东西。虽然这些是众所周知的特性,但我们的工具也能够发现物理学目前未知的新对称性,这将构成一个巨大的突破。
然后我突然想到,如果我们的工具可以从原始数据中发现对称性,我们为什么不尝试将其推广化呢?这些工具还可以产生研究思路或科学中的新假设。这就是 AI Scientist 的起源。
AI Scientist 到底是什么 — 只是一种花哨的神经网络?
它不是一个单一的神经网络,而是一组可以帮助科学家取得新发现的计算机程序。我的团队已经开发了可以帮助完成个人任务的算法,例如天气预报、确定全球气温上升的驱动因素或试图发现因果关系,例如疫苗接种政策对疾病传播的影响。
我们现在正在构建一个更广泛的“基础”模型,该模型具有足够的通用性,可以处理多项任务。科学家从各种类型的仪器中收集数据,我们希望我们的模型包括各种数据类型——数字、文本、图像和视频。我们有一个早期原型,但我们希望在发布模型之前使我们的模型更全面、更智能、训练有素。这可能会在几年内发生。
您认为它能做什么?
AI 几乎可以协助科学发现过程的每一步。当我说“AI 科学家”时,我实际上指的是 AI 科学助理。例如,实验中的文献调查阶段通常需要大量的数据收集和组织工作。但现在,一个大型语言模型可以在一次午休时间阅读和总结数千本书。AI 不擅长的是判断科学有效性。在这种情况下,它无法与经验丰富的研究人员竞争。虽然 AI 可以帮助生成假设、设计实验和数据分析,但它仍然无法进行复杂的实验。
您希望看到这个概念走多远?
正如我所想象的,AI 科学家可以减轻研究人员的一些苦差事,同时让人们处理科学的创造性方面。这是我们特别擅长的事情。请放心,我们的目标不是取代人类科学家。我不设想——也永远不想看到——一台机器取代或干扰人类的创造力。
出处:头条号 @人工智能学家