对话李开复:“勤俭持家”的中国大模型道路
网友【chuang】 2024-11-27 12:35:28 分享在【时代发展的印记】版块    1    15

中美AI产业的不同图景,AI First产品的最终形态,以及AI对人类命运的影响

网友分享在meiguo.com上的图片

文|《财经》研究员 郑可书

编辑|马克

李开复创业后的关键词是“勤俭持家”。

2023年5月,创新工场董事长李开复卷起袖子自己创业,成立大模型公司零一万物并担任CEO。李开复拍板选择更便宜、更具性价比的大模型研发路线,与相熟的国内外财富100强 CEO见面,把个人精力花在开拓客户、谈订单上。他同时带领团队开发应用,确立海外ToC(To Consumer,面向个人用户)、国内ToB(To Business,面向企业客户)的战略,探索收费的可能性。有人认为他能融资几十亿美金、与美国公司角逐AGI(通用人工智能)的机会,因此加入,又在发现公司选择不烧钱之后离开。但李开复有充足的理由相信,“勤俭持家”才是正确的道路。

李开复1961年出生于中国台湾,11岁时移居美国读中学,后入读哥伦比亚大学计算机科学系。1988年,他自卡内基梅隆大学的计算机系以最高荣誉毕业,获得博士学位,后在苹果、微软、谷歌等科技公司担任高管。2009年,他在中国创办天使投资公司创新工场,关注硬科技投资与前沿技术趋势。作为中国最早的AI布道者,他被称作“中国的AI教父”。

2023年,ChatGPT掀起AI 2.0浪潮半年后,李开复创办零一万物。经过轰轰烈烈的“百模大战”,大模型行业经历洗牌,中国六家头部创业公司,零一万物、智谱、MiniMax、月之暗面、百川智能、阶跃星辰,被并称为“六小虎”。

如今,他们面临共同的处境——融资少、估值低。美国的头部公司OpenAI累计融资额已经超过115亿美元,估值1570亿美元,而国内六小虎的融资总额与估值,普遍在数十亿美元级别。这在大模型领域,是一个足够关键的问题,因为由OpenAI指明的AGI(通用人工智能)路径,就是Scaling Law(规模定律),是堆GPU(图形处理器)、堆数据,“大力出奇迹”。而这些都需要钱,很多的钱。斯坦福大学人本人工智能研究中心发布的《2024年人工智能指数报告》估算,OpenAI的GPT-4模型,训练成本7800万美元;Google的Gemini Ultra模型,成本高达1.91亿美元。

大模型创业公司同时面对来自大厂的价格战挤压。今年5月以来,字节跳动旗下云服务火山引擎、阿里云、百度智能云、腾讯云先后把大模型推理算力价格调低90%以上。

在AI 1.0时代(2012年-2022年),李开复投资了10多家独角兽。他看到当时的局面,上半场大家比论文、比赛事排名,下半场比拿单子、比规模化收入、比盈利。他认为AI 2.0不能走到类似的道路上,最终的盈利环节,才是真实的“灵魂考验”,而且不可避免。

李开复下周年满63岁,他每天四点半起床,一天工作十多个小时。他说这是“年纪大的好处,不需要那么多睡眠”。他没有想过退休的事,将零一万物视作自己“最后一个非常重要、让我振奋的事业”。

李开复近日接受《财经》杂志执行主编马克专访。“勤俭持家”的技术路径之外,他还谈论了商业化策略、管理创业公司的心得、中美AI的不同图景、AI First产品的最终形态、以及AI对人类命运的影响。

【01】

不能明显好过开源模型就不要做预训练了

“我们是勤俭持家的Scaling Law,他们是财大气粗的Scaling Law。”

马克:零一万物的大模型Yi-Lightning最近在国际盲测榜单LMSYS上超过GPT-4o(五月版本)。有一种说法,盲测跟考试一样,高考状元进入职场也未必表现好。你们为什么热衷于盲测?它的意义是什么?

李开复:我们绝对相信产品和用户比测试重要。但是做技术,需要知道自己的位置在哪里,知道和过去的自己比怎么样。以后每个月,我们可能都会参加测试,目的不是刷榜单,而是看看有没有进步。我特别认可的一句话是,不衡量就不能进步,所以我们要不断衡量自己。内部测试可能会失准。参加竞赛还是有价值的。如果你说高考考出来的结果并不是绝对正确的指标,那在家关门自己做模拟题更不是。至少高考能帮助我们确定,模拟题做出来的成绩是真的还是假的。

马克:所以测试成绩跟实际产品的表现能画等号吗?

李开复:不能画等号,但是相关的。如果产品固定不动,把下面的模型换成另一个,新的模型比旧的多30分,用户是可以体验出来的。但如果我们只有这个分数,完全不管用户体验,那也不行。其实两者各有价值,一个是评估模型本身的能力,一个是评估产品的能力。模型的能力可以给产品加分,还有很多别的因素也可以给产品加分。这两者缺一不可。

马克:有报道说,国内好多大模型公司,包括六小虎中的两位,已经放弃了预训练。这意味着什么?

李开复:为什么要做预训练,或者为什么选择放弃?答案其实非常简单。如果一个大模型公司自己的预训练做不过开源模型,那就应该放弃,直接用开源模型。或者如果你略胜开源模型,但训练花了很多钱,投资回报不值得,也应该放弃。我们是超过了所有的开源模型,包括比我们参数量大20倍的Llama-3.1-405B,所以我们没有任何理由放弃预训练。

马克:2023年,无论中国、美国,大家都在谈AGI(通用人工智能)。到了2024年,美国还在谈AGI,中国的话题重心转到了落地、应用、产品、收入、客户。这种现象与谁在坚持预训练、谁在放弃预训练有关系吗?

李开复:坚持AGI就必须坚持预训练,但是坚持预训练未必能第一个达到AGI。我认为如果未来三年,有公司达到AGI,它高概率是一个美国公司,主要理由是中国公司的估值、融资不如美国公司。OpenAI一次融60亿美元,中国融资最多、最快的也只有它的六分之一,而且融一次,下一次也不见得那么容易。如果AGI是靠Scaling Law烧出来的,那美国公司融得多,就会跑在前面。

但是跑在前面有跑在前面的打法,落后一点有落后一点的打法,就像骑车比赛,你很厉害,跑在前面,帮后面的人挡风了,后面的人可能跑出更好的成绩,但未必能跑过你。我们不仅坚持预训练,而且在LMSYS评测上公司排名跟马斯克创办的xAI一起全球排第三,绝不能放弃,但我们也不会认为再过一年就会只落后OpenAI两个月甚至超过它,毕竟人家每做一次训练,花的钱是我们的几十倍。我们希望能用更少的钱,训练出一个更快、更可用的模型。当然如果AGI发生了,我们只落后OpenAI六个月,他先做成,我们六个月以后可能也能做成。

马克:Yi-Lightning模型,零一万物训练一个多月,一共只花了300多万美元,而GPT-4要花7800万美元。怎么把训练成本降到这么低?他们这么烧钱是因为太有钱了吗?

李开复:对,当你太有钱的时候,你就会犹豫要不要花很多时间去抠细节。从另外一个角度看,我干嘛要请这么多工程师?我反正财大气粗,一下子烧一亿美金,结果会早出三个月。也许对他来说早三个月出结果更重要,多烧钱更不重要。这个心态最极端的是Meta。Llama的训练应该也花了几亿美元,而且我的理解是GPU花了几亿美元,数据还花了几亿美元,最粗暴的用钱来买时间,这也是一个战略。但我觉得一方面中国公司资源有限,一方面中国的工程师非常勤奋努力(都是原因)。

我们为什么能够300万美元训练出来?有几个因素:第一,我们特别重视模基共建。也就是说,我们的AI基础设施和模型一起开发,把成本当做第一要素。如果训练的某一种方法太花GPU了,我们就不走这个路径。哪怕结果稍微差一点,只要能省很多的钱,我们会选择这么做。第二,我们还有一些独特的技术,包括MoE(混合专家模型),在不同时候这里省点、那里省点。第三,我们特别重视内存的管理,用内存取代计算,来达到更好的结果。还有GPU训练的时候,宕机是很大的问题。我们去预测它的宕机,在宕之前把它换掉,或者宕之后做恢复。这里10%、那里10%加起来,就变成26倍的差距。可能很多美国财大气粗的公司会觉得我就是要烧AGI的,损失1%我也不愿意,我宁可多花1亿美金。

马克:把参数降低是不是也是节省成本的办法?

李开复:是的。我们过的数据大概是GPT-4的三分之一,一下又省了三倍的成本。而且MoE就是一个很聪明的降低参数的方法。用MoE,是看到了稠密模型的缺点,比如4050亿的参数量,里面绝大多数都是无用的,用MoE是指,如果只有这几个地方重要,就把它们拉出来做3个专家模型,其他的我就不要了。这是一个简化的例子。我们不断做这方面的实验,扔掉巨大稠密模型里面不用的部分,抽取有用的部分,当做专家模型,再用MoE的模式整合。

再往下推算,为什么只做3个(专家模型),不做100个?这又是一个勤俭持家的问题。如果做非常多专家的MoE模式,训练会非常痛苦,因为稠密模型就是一个模型,而分很多(专家模型)的话,数据协调、内存管理、算法收敛等,都需要成本。

马克:按照这个逻辑,Scaling Law不一定成立?

李开复:Scaling Law肯定成立,而且已经出现新的演化。我们预训练模型花了300万美元,如果给我3000万美元,肯定可以训练出一个更好的。我们一年要训练多次,而且预训练只是整个成本的一部分,还有后训练、推理、研发探索。全部加起来,模型成本是300万美元的几倍。而且我们还要做开源模型、多模态模型。这么一加起来,整个花费还是很可观的。

Scaling Law肯定是对的,只是我们是勤俭持家的Scaling Law,他们是财大气粗的Scaling Law。

网友分享在meiguo.com上的图片

【02】

ToB还是ToC?

“刚开始是比谁的论文多、谁打比赛得了名次。后来就看谁拿下单子,谁能规模化收入,再看有没有单子可以盈利,然后看整个公司能不能盈利。最后这两步是真实的灵魂考验。”

马克:零一万物的产品策略是海外做ToC,国内做ToB,这个策略是一开始就想好了,还是经过一年多摸索出来的?

李开复:国内/海外、ToC/ToB,四个可能性,我们知道不能都做,但是要做一些探索,才能决定哪些不做或先不做。

马克:对ToC、ToB的产品结构有什么预期?

李开复:我先讲讲ToC。无论国内还是国外,ToC的发展路径会跟移动互联网相似。因为手机的来临,移动互联网把所有应用都重做了一遍;现在也会因为有AI的来临,把所有应用重做一遍。移动互联网要做的是Mobile First,AI做的是AI First。

什么是Mobile First呢?一个应用,如果在PC(个人电脑)上、手机上使用起来是一样的,那就不是Mobile First;如果它基于你的地理位置做了PC不能做的事情,那它就是Mobile First。比如美团、滴滴就是Mobile First,四大门户网站就不是。

一个新技术革命的来临,通常会是循序渐进地,从一些比较基础的需求走向更复杂的需求。比如先去浏览内容,再去创造内容,再去搜索和组织内容,再去把内容多元化、丰富化,再去做交易。在移动互联网时代,刚开始是浏览工具,比如UC Web、豌豆荚,然后是搜索,比如百度,然后是多元化社交和娱乐,比如微信、快手、抖音,再往后是新电商和交易,比如拼多多。

AI First的蓝图也是一样,从浏览到创造内容,到搜索组织内容,再到多模态社交和娱乐,再到本地生活和电商。越往后走,用户越来越多,使用越来越复杂,就需要越来越强的模型。我们是用这样的方法论打造新的应用。

另外还有一点特别重要,你在某一阶段说我要做AI First的应用,你一定要找一个更好的模型;这个更好的模型如果太贵,你就要等它变便宜,或者你要主动把它做便宜。这也是我们的闭环工作,就是我们看中了要做若干个应用,用外部的模型太贵了,内部的模型可能刚开始也比较贵,那么我们就想办法把它做便宜。

马克:为什么国内做ToC还不成熟?

李开复:国内还没有发生ChatGPT moment。虽然国内很多大模型聊天机器人产品已经跟第一个版本的ChatGPT一样好,甚至更好了,但因为不是一个单一化的产品,没有起到教育市场的作用。但ChatGPT在美国推出的时候,每一个人都去用(这同一款产品),它就自然地吸收一批用户,然后塑造用户认知,再收费,大家也觉得这是可以收费的。中国的大模型从业者就没有这个信念。现在市场上四五家聊天机器人,有两三家都做得不错,都不收费,用户也就不愿意付费,甚至有些人初次用,不知道这是什么,把它当搜索引擎,对效果不满意,所以留存也不好。这些问题都需要时间来解决。

马克:所以尽管Kimi、文小言、豆包,下载量已经数以千万计了,但一旦收费,你觉得他们都是不可持续的?

李开复:付费习惯确实是一个很大的挑战。我都不谈收费了,用户留存都是挑战。获取用户挺贵的,用户留存也不是很好。把用户留下来、把量做上去,甚至达到排名前三的地位,要烧的钱是我们今天不愿意烧的。

大厂的优势是它可以用已有的海量用户推新的产品,初创公司非常吃亏。评估之后,我们就觉得国内(ToC业务)[WY1] 还要再等一会儿。要不就找一个用户需求很强、自带流量、可以病毒式传播的应用,要不就找一个像Prosumer(生产型消费者)的产品,可以收费,但不是针对所有人,而是针对少数职场工作者的需求;要不就是用户认知足够强了,再去和其他产品竞争。

以现在我们有限的精力和资源,先在国外把(ToC业务)[WY2] 产品做得更好——能收钱就收点钱,能赚钱更好——在适当的时刻再出口转内销。就像当年字节先做抖音再做TikTok,拼多多先做国内再做海外,SHEIN先做海外,以后也可以做国内。

马克:所以付费习惯和产品力,哪个权重更高?为什么QQ音乐能收到钱,腾讯视频能收到钱?

李开复:如果真的能找到用户的痛点或需求,是可以收费的。现在大家都捆绑了支付方式,不是付费困难,而是一种习惯。比如大家都习惯搜索是不要钱的,就很难做一个付费的搜索产品;大家一定程度上也开始习惯聊天机器人不能收费,这是一个很大的坎。

但我觉得AI能做的产品绝对不只是一个ChatBot。比如一个能够节省办公时间、提高效率(的产品),就有可能收费。再比如一个多模态的、AI First的,下一个时代的Microsoft Office或Adobe,就有可能收费。谈到音乐,既然大家已经有付费习惯,有没有可能做一个AI音乐产品?这些都有机会。如果把自己锁定在无论如何要做ChatBot,我就是要去花钱买用户,然后执着地认为可以收费,那这不是成熟的商业化思维。

马克:半年前你说过,国内ToB做一单赔一单,你们不会做,为什么现在说国内可以做ToB?

李开复:我当时说的是不会做“做一单赔一单”的项目,我们现在还是不做。我们希望做能够收费而且盈利的项目。不是说每个项目都要盈利,但是大部分都应该要盈利。

马克:找到这种ToB产品了吗?

李开复:正在摸索,初步有几个客户。有些客户是垂直领域,比如能源,有特别独特的需求,项目式招标不能解决的问题,我们和这样的公司合作,收费会酌情更高。它跟项目制的差别是,如果做一个应用,甲方只愿意付200万,但成本是300万,为了打败竞争对手,项目制公司会接,但我们不做。一些公司勉强做了,可能也不会花心思做得很好,交付之后客户不满意,之后大家也没有再次合作。我们宁愿去更精挑细选,选那些认可我们、我们能赋能他们的(客户),我们用大模型技术帮助他们找到利润的第二增长曲线,而我们也从中获益,大家共赢。

马克:零一万物有哪些你比较满意的ToB产品?

李开复:我们走了几个赛道:线下连锁零售、餐饮等本地生活场景,政务,智算中心,城市的新能源,游戏。每一个赛道的需求不一样。能源客户希望提高效率,游戏客户希望增加用户时长、减少游戏制作时间,智算中心客户需要很强的AI基础架构,让它买来的GPU发挥作用。本地生活客户是用“大模型+数字人”的技术获客并增加GMV(交易总额)。过去的直播是人讲的,又花时间又花钱,数字人能一天做20个小时的直播,也不需要人写脚本,大模型自动生成,它是一个端到端的解决方案。只要接进去,第一次花几小时、第二次几分钟就可以每天直播。第二个好处是,它产生的GMV、省了多少钱、赚了多少钱是可以计算的。今天的经济情况之下,能扩大GMV就是客户最大的诉求,这样收费就有希望。我们在打造这样的产品,还比较初期,现在也不是做一单就能赚一单,但可以看到曙光。

马克:你们的整体ToB思路是什么?

李开复:我们的ToB思路是能够展现我们的特色,可能是模型更强、成本更低,或者是我们对某一个领域有很深的认知,或者是客户信任我们的品牌。因为很多客户是我跟我们团队打出来的,我个人也认识蛮多财富100强的CEO。我们会思考在有些行业,是不是能够做端到端的、能够带来商业价值的(解决方案)。我们也还在探索阶段,但确实拿了几个蛮大的单子。

马克:国内ToB业务的难题是:如果每一个项目都要从零开始做,那就没有复利。

李开复:我们会希望不是这样的,我们希望有可持续的收入。刚才讲的几个行业里,至少有两个可以有持续收入,比如我license(许可)技术给你,按月收费。按月收费,就要按月证明能帮客户赚钱。我们要让客户看到,虽然每个月要付几十万,但是可以赚几百万。我们也会做一些项目制的,但我们希望项目大一点、创造价值高一点,我们的利润就能多一点。

马克:做ToB和ToC的思路完全不一样,对能力、基因的要求也都不一样。同时做这两种业务,会不会引发分裂和冲突?

李开复:怎么去均衡我的注意力,并让大模型技术能够关注两边,这是有一定挑战的。现在我的时间会更多放在帮ToB业务找客户、看单子,团队也理解,因为有些单子是我认识CEO(所以谈下来),而且ToC是他们自己运营,不见得需要我参与。

模型的打磨可能更偏向ToC,一边做应用、一边测数据、一边调整模型;ToB的工作流程需要更多的外部协同,与客户的直接沟通。所以在公司内部确实有形成两个部门,我要确保跨部门合作的时间能够合理分配,进而模型能进行局部快速调优。这件事情是可能的。因为我在微软的时候也一样,底层 Windows不分独立体系,但是上面的产品分ToB、ToC。我在微软学到很多管理方式。

马克:微软是一家巨大的公司,它的ToC、ToB团队很可能就是独立工作,没有交互性。但零一万物是一家创业公司。现在在零一万物ToC、ToB团队有协同效应吗?

李开复:有协同效应。技术都是协同的,另外很多ToC的产品,里面的技术可以提炼到ToB,因为无论什么用户都需要基础的功能,比如帮我读20篇文章,或者写一个报告。

马克:现在会考虑break even(收支平衡)的问题吗?

李开复:现在没有考虑,但是需要未雨绸缪。我在AI 1.0时代投了10多家独角兽,它们刚开始也是比谁的论文多、谁打比赛得了名次。后来就看谁拿下单子,谁能规模化收入,再看有没有单子可以盈利,然后看整个公司能不能盈利。最后这两步是真实的灵魂考验。当年很多AI 1.0公司,在最后两个问题上没有过关,因此上市以后也面临很多问题,或者根本不能上市。

今天的大模型虽然技术更好,但是竞争也更激烈,我们也在经历(类似AI 1.0的)这个过程,所以我们会知道这个阶段需要拿下一些客户,做一些亮点产品。但这只是刚开始,下半场看收入和利润够不够、有没有产品能力、能不能整体盈利,这不可避免。

马克:有报道说,零一万物最近拿了一大笔融资(2024年8月,零一万物获得数亿美元的A+轮融资),是不是明年、后年甚至大后年都不用考虑break even的问题?

李开复:我觉得是按部就班,今年先拿到一些单子、有一些收入,明年希望这些收入不是一次性,有一部分可以按年收到,而且我们希望可以看到利润提升,再后面希望有些产品线是盈利的。

我们投的一些比较好的AI 1.0公司,本来成立六七年之后就可以盈利了,但他们没有做到,因为碰到疫情、经济形势、上市等问题,但它们提供了一个参考,AI 2.0的创业公司有这样的希望,六七年时间从一个初创(公司)做到break even。要努力地去做,因为盈利问题是逃不掉的。很多创业者觉得我上市就OK了,股票就可以卖了,但上市还是要把握时机,要在一个成长非常好的时候,不然随着成长放缓,股市会要求盈利,(到时候)就能算上市,(股价)跌个百分之七十八十九十,其实也就打回到A轮B轮(融资时的估值)了,上市也白上了。我们要努力避免这个问题。

马克:所以零一万物设定每个阶段达成什么样的目标?

李开复:活下来是最重要的。在这个前提之下,我们要尽量做出出彩的产品和技术,这些产品和技术还要带来一些商业的结果。为了完成这些任务,就不能不负责地把全部的钱花在买GPU上。

【03】

自由与创新VS规则与流程

“Necessity is the mother of innovation(迫不得已是创新之母)。很多创新,是因为有一些束缚,不得不做的情况下,才开创出来。“

马克 :运动员(创业者)转做教练员(投资人)很常见,反过来就不多见,你创建零一万物就是教练员转做运动员,你还见过其他这样的人吗?

李开复:有啊,Sam Altman不就是吗?雷军也算是。做投资可以看得更深刻,一个公司的发展路径、战略,或者直白一点怎么去融资,怎么去上市。一个理想的创业者应该是(把这些)都塞到脑袋里,知道从零到一怎么做,知道大公司怎么管理,知道怎么去融资、上市。

马克:你的竞争对手里面已经出现了90后的CEO,你觉得这是个问题吗?

李开复:我觉得各有优势。他们写代码肯定比我好,但是谈商业模式、公司战略,我更有经验。

马克 :你真的认为零一万物能做成一家万亿美元市值的公司吗?

李开复:我认为我们有希望,我们会努力地去做,但这肯定是一个具有超大挑战的事。当年我说过,希望有一天零一万物万亿美元,不是很狂妄地说我一定能做到,而是说这一次的风,会带来一批万亿美元的公司。做这个领域的任何一家公司,都有这样一个最终的希望。

马克:二级市场的投资圈有一句名言:在你想赚多少钱之前,先想清楚自己能输多少钱,要先给自己设定止损线。你觉得这句话在创业圈适用吗?

李开复:为什么要去想能输多少钱?去想输多少钱,就已经输在起点了。止损线那是买股的,我做早期投资,不投二级市场,可能也是因为我没有这种基因跟思维方式,起步阶段我不考虑止损。创业不能第一天就想着如何止损了,不能这么想,创业一定是All in。

马克:零一万物现在有多少员工,你怎么管理他们?

李开复:大概两百。我希望能招非常优秀的人,放权给他们做管理。所以我的-1团队是相当资深的,年龄也比其他大模型公司年长一些。我非常信任他们。我想我需要做的就是公司的整体战略,还有做对外的发言人、融资人。我要确保公司的文化发展方向,还要负责招聘,要给一个团队正确的目标。

马克:你说过对人才的看法,包括自驱力、专业能力、学习能力、沟通合作能力。你把“自驱力”放在第一位。每个公司都想找到有自驱力的人,怎么找到这些人?

李开复:自驱力,就是积极主动、负责,不会推卸责任。进公司以后也要考察一段时间,我们也不是每一个招来的员工都有很强的自驱力,需要不断调整。

马克:有些人是挺会表演的,怎么鉴别?

李开复:只有看结果说话,看一个人怎么面对问题。把责任推给别人,或者找借口,丢给别人解决,这些都是不负责任的表现。自驱力很强的人应该把自己当做公司的主人,碰到问题要自发、主动地去负责。自驱力不够,就会只把工作当成工作,朝九晚五。

有一句话我很认可,一个自驱而高效的人,重视的是结果,而不是形式。我更希望在周报中看到这礼拜碰到一个超级大的挑战,我带着团队把它克服了;或者说我承诺季度达到的销售目标,两周前发现落后了,这两周我们加班补上。这就是result(结果)。而不是写了多少行代码,出了几次差,开了几次会。

马克:对于前沿领域的创业公司来讲,自由和创新是必须的。但是对于任何一家公司来讲,规则和流程也都是必须的。自由与创新,规则与流程这两者往往是对立的,你怎么平衡?

李开复:我觉得没有绝对的自由。绝对的自由就像是一个没有管理、松散的科研机构。我们不是的,我们在一个竞争激烈的行业里,要战战兢兢地去追赶,所以我们一定要有自己的框架和战略,在这个前提之下去做创新。

比如我们做大模型,目的是要做到世界一流,速度快、价格低。如果只能做到效果很好,但是很贵、很慢,我们不做。所以我们自由、放权是有的,前提是按照公司的战略方向走。

有一句话我特别认可,Necessity is the mother of innovation(迫不得已是创新之母)。很多创新,是因为有一些束缚,不得不做的情况下,才开创出来。我们穷,融资少,不能把GPU当做无限的资源去烧,反而因为有了这些限制,才有创新。如果我们当时融资20亿美元,缺少条件束缚,可能就弄了太多GPU。我们没OpenAI有钱,所以一定要找一个自己的方法,而且如果用OpenAI的方法跟OpenAI竞争,那是必死无疑的。

创业的前六七个月,我们舍命狂奔,因为我们落后太多了,连GPT-3都不如。每一家大模型公司在去年可能都是这个状态,但是进入今年以后,我觉得格局就比较清楚了。也看出来想烧钱烧出AGI,我们是烧不过美国的,我们要走出一条不同的路。大概今年年初的时候,我们就定下基调:超快训练、超低费用,模型尽量做到最好。

马克:电影《奥本海默》里,有一个场景是讨论研发路径时,一个科学家站出来说,你们说的都是狗屎,我的这个更棒。奥本海默把他边缘化了,但这人后来做出了氢弹。如果团队发生这种事,你会怎么处置?

李开复:因为奥本海默面临一个deadline(截止时间)。这样一个跳跃式的、不知周期的想法,是达不到目标的,所以只能放弃。

马克:零一万物是不是也面临同样的问题?

李开复:我们会希望留住每一个人才,但也不可否认,原来选择跟着我的人里面,有非常少数觉得这是中国人做出AGI的机会,觉得开复可以融到几十亿美金跟OpenAI打仗。后来发现现实很残酷,跟硅谷巨头相比,我们“六小虎”面临的问题是一样的,融资辛苦,估值偏低。我们不能走OpenAI的路子。这些当时这样想的人,可能就会去美国,干脆加入OpenAI,去实现他的梦想。

【04】

大模型“六小虎”谁能活下来?

“市场实在是够大,可以选择的实在是够多,这不是零和游戏。”

马克:国内大模型行业今年爆发了价格战。价格战的目的一是赢得收入,二是占领更多市场份额。价格战是大厂发起的,他们有雄厚的实力,创业公司如何在大厂的压迫下生存?

李开复:一个水平一般的模型,你降到免费也不创造任何价值,一个水平很好的模型,可以既得到市场份额,还能挣到钱。大厂有它的优势,钱多、人多、资源多、GPU多、场景多、数据多。小公司也有优势。第一个就是团队更凝聚。在大厂,做芯片的在一个组,做基础架构的在一个组,做AI模型训练的在一个组,做推理的在一个组,做应用的在一组,5个组可能有5个VP(副总裁),5个VP有不同的KPI,很难协调。第二个差别是,大厂有更宏伟的目标,比如卖云,比如推某一个拳头产品, AI是服务于另外更大的目标,那就不是直接做满足用户需求的AI Firs产品,而创业公司可以更纯粹地走这个方向。第三个是大厂可能有The Innovator's Dilemma(创新者窘境),他不能把AI嵌入已有产品,不然他可能就没有收入了。比如说Google,为什么Gemini做得不怎么样,为什么不去做AI搜索?比如Perplexity的搜索就比Google好用。其实就是Google不敢做AI搜索。因为它一做AI搜索,传统搜索广告收入就会受影响。还有一点非常重要的,我的前老板Eric Schmidt(谷歌原CEO)在斯坦福说的大实话。有人问他,OpenAI怎么打败Google?他说Google自从疫情之后,员工比较慵懒,在家工作,不像OpenAI是个创业型公司,疯狂往前冲。当然之后他有道歉。但我觉得是大实话。在创业公司,员工更有主人翁精神,大厂的话就是一份工作。大厂和创业公司各有优势,我不会说创业公司有绝对的优势,但是我觉得这个优势和劣势是旗鼓相当的。

马克:现在的大模型“六小虎”,你觉得最终能有几家生存下来?

李开复:我觉得大部分都可以生存,但是不一定都会做往AGI、往Scaling Law走的预训练公司。可能有些会走娱乐,有些走ToC,有些走ToB,有些走开源路线,有些在国内上市,成为国内做某某领域最强的公司,有些可能放弃预训练,但是能接单。我觉得每一家都会发挥自己的优势。

在今天,这六家公司的直接竞争并不多。我们就讲一个最简单的例子,我们(目前)基本不竞标。我觉得这个市场实在是够大,可以选择的实在是够多。比如说我们做海外ToC,另外还有至少一家也在做海外ToC,但我们的产品完全没有交叉。这不是零和游戏。

马克:基础大模型国内公司要赶上美国同行是比较难的。但是也有蛮多人说不用担心,因为国内有丰富的应用场景,尤其是ToB,虽然基础模型不如美国,但我们完全可以开发行业模型、服务行业客户,这样我们也能活得好。你同意这个看法吗?

李开复:一方面我同意,国内有非常丰富的场景,非常多的行业数据,而且确实底座不见得有差那么多,六小虎里做得最好的三四家的底模,都足够满足各行业的需求。但是我觉得行业模型的落地,必须解决另外一个问题:客户如何能够接受更先进的商业模式,互创价值,形成良性循环。

如果客户只愿意给你那么点钱,那你也只能干那么多活,他就没有那么满意,这样就很难形成良性循环。而美国现在比较先进的模式,SaaS(软件即服务)也好,订阅也好,都能形成良性循环。放眼看美国这些几百亿美元的公司,从Databricks到Snowflake,都在和客户产生良性互动。客户愿意持续付费,愿意为软件买单,软件公司赚了钱就继续投入,给客户更好的技术,让客户愿意继续付钱,实现了良性的循环。

简单地说,就是中国的企业级软件的商业模式不如美国,企业没有足够的付费意愿,创业者无法获取足够收入来持续进步。这个问题如果不化解,大模型和其它企业级软件都会面临很大挑战。

马克:美国的基础模型在不断前进,参数量从千亿到万亿,国内跟进很吃力。这会不会影响到国内下游的应用开发?

李开复:不但不会,可能还有独特的优势。今天我们的参数量比世界最好的几个模型少一个数量级,但恰恰因为少了一个数量级,而表现跟它又很接近,我们的推理可以做得又便宜又快,反而适合开发者开发应用。如果拿最贵的模型,开发者做不起。

马克:OpenAI已经关闭了中国大陆的API服务,美国国会也在讨论禁止开源模型出口。国内很多模型是基于美国的开源模型,如果他们不再允许使用,那意味着什么?

李开复:对零一万物没有任何差别,因为我们现在不用任何开源模型,是自研的系统,当然参考了很多别人发表的论文或业界标准。话说回来,如果两年前就不存在任何开源,中国业界确实会受到一些挑战,但是我觉得美国的很多讨论都戴着“后视镜”,看到过去开源让中国跑得更快(所以要禁止出口),但他们没有看到中国现在对开源的依赖已经大大降低。而且我们也不要认为开源是纯粹美国人发明、中国人学习,在中国很多开源做得很好。开源是一个互惠的事情。美国政府如果把它当做单行道,认为只是方便了中国学习美国,这是错误的、短视的,一方面低估了中国今天已经达到的水平,另外也不了解中国也在积极开源。我们可以看到Hugging Face CEO常常说,现在开源模型最多的是中国。

马克:所以结论是,即便美国真的禁止开源大模型出口,对中国从业者也不会有太大影响?

李开复:我觉得短期内不会有太大影响,中国现在基本是能够自给自足。但也不能排除三年后美国的某个天才科学家开源了一个天才发明,帮助了全世界。只是说按照今天的情况,我想很少中国大模型公司需要完全参考美国的开源模型,才能推动自己的进步。这个时代已经过去了。

我们当然还是希望开源社区继续开放,大家能彼此切磋学习进步。我也不认为能轻易阻止开源,因为全世界的开源社区可能是最不被地缘政治影响的。开源的人就认为我们愿意彼此扶持,是站在巨人的肩膀上的信仰者。如果美国真的出了这种法律,可能反抗最多的是那批美国开源社区的人。

马克:你是1988年进入职场的,这三四十年间经历了好几波技术浪潮,PC、互联网和移动互联网、云计算,如今是AI 2.0。一家公司只要抓住一次浪潮,就会成为巨头,但往往抓住上一波的巨头会错过下一波。你有没有见过没有错过任何一次浪潮的公司?

李开复:微软应该是最接近的,而且很有意思的是,我们可能都想着软件公司,其实硬件公司也是一样的。PC时代是英特尔的时代,移动时代是高通的时代,现在 AI 2.0时代是英伟达的时代,所以我觉得不可避免的,每一次科技浪潮都会因为新的技术认知,而带来新的领军公司。一些旧的公司不愿意放弃过去形成的商业模式和利益,被替换是高概率事件,但是也有一些能坚持下来。

马克:生成式AI这波浪潮中,诞生了两个巨头,英伟达和 OpenAI。OpenAI可能更准确一点,因为英伟达之前已经挺大了。有没有可能再出现一个类似OpenAI的巨头?

李开复:我觉得会有很多巨头产生,也许没有OpenAI那么大,OpenAI应该万亿市值。今天每一个应用在AI时代都会被重写,每一个重写应用的公司都可能是千亿美元公司,比如取代Microsoft office、Adobe的公司,取代手机的硬件产品公司,取代Google的搜索公司。

而且,这些例子只是把已有的产品取代了,还有前所未有的产品,比如多模态、具身智能机器人,它们可能更像特斯拉——电动车本来是不存在的产品,突然杀出来。这些市场都是超级巨大的,我相信10年以后最有价值的10家公司,全部跟生成式AI相关,有些可能是现在的巨头,生成式AI赋能后变得更厉害,有些可能是开发了某一个很厉害的应用,然后不断地衍生,做成多产品的矩阵,有些可能是找到了一个生成式AI带来的前所未有的机会,做了一个过去不存在的产品。就像今天前10名很多公司,都是10年前还不太知名的公司,10年以后肯定也是一样的状况。而且可以很确定地说,10年后最值钱的10个公司的总市值,会比今天的高非常多。

马克:在位的巨头中,谁比较危险?

李开复:我觉得Google相当危险,拿了这么好的牌,打得这么差。但核心是,它没有办法放弃核心收入(搜索广告收入)。柯达就是为了它的胶片,不愿意去推数码相机,最后它被自己发明的数码相机革了自己的命。

马克:希望拉里·佩奇能够看到我们今天的对话。

李开复:他们是知道的,Google管理层是很担忧的。但是既有利益的惯性太大,改变起来不止需要壮士断腕的勇气,是壮士要把四肢都切了,这样才可能有重生的机会。但是四肢都切了,怎么重生呢?

网友分享在meiguo.com上的图片

【05】

AI产品的最终形态

“大模型是一个很厉害的思考机器,如果只把它看作ChatBot,其实是低估了它。”

马克:进步的捷径就是学习先进。你刚才谈到若干家你认为很不错的美国公司,可以ToC和ToB各拎出一家来详细解剖一下吗?

李开复:我觉得今天美国很有特色的、让我很佩服的公司是微软。因为它一方面能够慧眼识英雄,选中OpenAI,另一方面跟OpenAI达成双赢,至少短期双赢的商业协议。而且它在自己的产品里非常完整地融入了各种大模型技术,整个Copilot,从Office,到Game,到Windows,布局非常完整。而且它也没有那么疯狂地去烧钱。

我觉得苹果的机会和风险都很大,今天它必须采用第三方的ChatBot,因为它自己虽然有投入,但是没做出来,这就代表以后每一个设备使用自然语言界面都要经过第三方的引擎,这个引擎刚开始是问答,之后可能变成搜索,再之后可能就是委托式的用户体验,然后开始帮你干活,成为智能体,最后颠覆整个苹果手机。这个风险是特别巨大的,因为苹果今天最值钱的就是用户,世界上那么多用户,眼睛跟手是在苹果手机上,而且是不经过别人,苹果就可以掌控。如果说整个手机的体验变成对话委托式,可能就会绕过苹果今天的核心优势,它整个生态系统会坍塌。所以我觉得苹果现在特别需要振作起来,拥有自己的AI技术,整合到苹果手机里来。

我觉得未来的硬件会有一个革命,现在还没开始。今天的手机其实不太适合终极的大模型。终极的大模型应该不只是一个问答(工具),而是委托(工具)。跟它说我太太明天生日,它马上就说帮你订蛋糕,这才是一个聪明的委托式的用户体验。但是刚才这句话,如果我要把手机打开,打开Siri,然后跟它讲,看它的答案,我已经浪费了40秒钟的时间了,如果就在我跟你讲话的过程中,它随时听懂我,然后就把事情干了,能够在合适的时候告知我,就很高效。

马克:不需要你给他布置任务,他能够主动推测到你想干嘛。

李开复:这是最好的。我主动布置任务也行,但是我不需要把手机打开,再开APP去选什么条件来用。我每天在讲话,我一讲,它就听到我,就做,这是委托。还有些例子我可能都不需要讲,它就知道应该做。比如说我前三年都买花,今年它就说,你太太生日,你要准备什么样的花。这个过程需要一个设备,可能是随身携带,而且always listening, always on,它才能做到无缝衔接。这样的设备应该由苹果来做。这就是终极的智能助理,因为以后我95%的事情都是经过它来做,所以以后也没什么手机了,因为我没有应用,只有少数的东西我还是要打开软件。

马克:我非常同意你刚才说的,现在苹果的产品不是AI First产品,它是上一个时代的产品,交互不是那么方便。但是哪怕进入到AI First时代,AI First的产品都普及了,仍然需要一个交互介质。还有什么介质比手机更方便?

李开复:如果说是我委托任务,它就把活给干了,它可以是耳环、项链、手表、戒指,可能90%、95%我想做的任务,我说一句话,它就帮我办到。有些东西我需要看,比如说我要看今天股市什么样,当然还是需要手机。就像手机出来的时候,我们没把PC丢掉。所以以后可能也是当我委托任务的时候,什么设备都不要,我讲话,它就学习到了;但当我不是在做任务委托,而是要看一个东西、处理一个东西的时候,我才用手机、电脑。

马克:智能手机之所以了不起,就是集成了各种产品。你刚才讲的耳环、眼镜、项链,一个人是不可能戴那么多东西的。

李开复:最近眼镜也蛮火的,假设跟眼镜说今天买什么东西,或者用餐、订票,所有我会跟我的助理讲的话,眼镜都很熟,这个眼镜就能成为助理。我要看一个视频的时候才用手机。这两种需求比例是80:20还是20:80,我们可以讨论,但是我觉得终极状态应该是很多你要做的任务,这个眼镜会处理。

马克:其实我们讨论的不是一个新话题,10年前就在讨论谁能取代手机。那时候智能音箱是一个热门的候选,后来的候选还有智能手环,但这些统统都没有取代手机。但是我完全同意交互方式一定会变得更自然。

李开复:这个事情不容易达到,我同意非常困难。当年我还在苹果的时候,我们就在推测什么能取代PC,第一套做的是用笔来输入的Pad,不是今天的iPad。那时候假设 PC太大、太麻烦了,能不能像笔记本那样握在手中,然后失败了。还有一些别的公司做,也失败了。然后就出来MP3、iPod,再后面就有了iPhone。所以也是摸索了很多年,从一些失败的产品到单一功能产品比如iPod,最终才到了iPhone。所以我们从今天的手机走向未来的眼镜也好,手表也好,未来还会有很多探索,不会是很轻松的,但最后肯定会找到。

其实第一个牺牲者已经出现了。美国有一个产品叫做Humane,苹果顶级的设计师出来做的,它是一款像别针的可穿戴AI设备,别在身上,always listening,always on,卖五六百块美金,最后这个价位消费者没法承受,体验也不够好,就死在沙滩上。

马克:对于创业公司,如果给他们找一个学习榜样,你会解剖哪家公司?

李开复:最近一个特别火的产品NotebookLM, Google出来的人做的,一个小团队做出来的,它很聪明地让你能把一本书或若干篇文章丢进去,把可能有点枯燥的东西做成Talk Show,自动生成音频,两个人对讲,听不出是机器人,话家常、讲笑话都栩栩如生。在美国,很多人喜欢一边听音频一边开车上班,所以可能每天都有1小时给NotebookLM。我觉得这是一个非常成功的产品,也给我们指点了一些路。我们现在过度地认为要做一个ChatGPT,做ChatBot就是大模型的必然之路,其实做一个非常平易近人、有趣幽默的产品,让大家能够很轻松地消费严肃内容,对我们的价值同样很大。大模型是一个很厉害的思考机器,我们如果只把它看作ChatBot,其实是低估了它。

【06】

AI会解放人类,也会让人类更加不平等

“AI也许就是为了解放我们,让我们真正找到人生的价值,把时间花在那些只有人类能做的事情上。”

马克:今年的诺奖有一个插曲,杰弗里·辛顿说,我很自豪我的一个学生解雇了Sam Altman。在OpenAI的争斗中,科学界好像都在支持Ilya,但商界人士大多支持Altman。你会支持谁?

李开复:我觉得两边都各有道理。但一定要二选一的话,我会支持伊利亚。Sam Altman是一个战略家、谋略家,商业的天才,所以他想尽快打造出AGI,然后就能成为垄断者,成为霸主。这个梦想我觉得每个企业家都会有,我也完全可以理解。Ilya和他周围这些人,包括最近从OpenAI离职这批人,更有理想主义,觉得AGI这么厉害,我们要负责地去做它,要确保它是安全的。本来其实OpenAI的架构是有一点制衡作用的。董事会在乎安全,Altman下面的几个人也比较在乎安全,Altman想推动,但是有上下两层(制衡)。但现在上面的一层切掉了,下面的一层离职了。我们作为AI从业者,也想看到AGI快点来,但绝对不放心让Altman这个人来控制AGI。

马克:几十年的技术浪潮已经深刻地改变了人类社会。但不幸的是,随着技术的进步,人类的不平等也在扩大。1989年,你博士毕业的第二年,美国最富的1%的人占有全美财富的23.5%。2001年,这个数字增加到32.2%,也就是说,1%的人占有全社会1/3的财富,而且这个趋势还在扩大。你觉得AI浪潮是不是会进一步扩大人类社会的不平等和贫富分化?

李开复:首先AI浪潮会给每一个人机会,就像Sam Altman说过,他认为会有第一家一个人做出来的10亿美元的公司。直接回答你的问题,贫富差距肯定会继续增加,除非政府出面阻止,向富人收税,分给其他人。如果没有这类措施,一方面, AI的赢家赚的钱会比移动互联网多,另一方面,很多人会因为AI失去工作,因为AI可以把部分工作取代。会有越来越多的重复性工作,尤其白领,面临失业。所以说最有钱的人变得更有钱,因为得到了AI的红利;而最没有钱的人,自己的工作还可能被AI取代。这会带来更多的不平衡。

马克:678乘以875等于多少?如果你算不出来的话,拿个计算器就能够迅速解决。这跟不会解二元二次方程,让ChatGPT帮你解决,有什么不同吗?

李开复:我觉得人的智能和人的能力应该不断升华,计算器让我们升华到一定程度,生成式AI可以让我们再升华一层。以后我们要去解难度更高的问题,无论是某一领域,比如数学的问题,还是跨领域的问题,比如一个CEO面临的各种抉择。这一类的问题是人类应该花时间去做的。

还有人类的独特性,AI能做的事情越来越多,应该让我们有一个很深刻的灵魂拷问:AI这么多事情做得比我们好,还有什么我们能做、AI不能做的?特别有创造性的,特别复杂的,或者是特别需要温度的、需要亲和力的,或者人与人之间的关系,或者是自我意识,这些是我们最珍贵的事情。

所以我们不要只是觉得AI做了很多事情,我们越来越渺小、越来越没有用。AI能做的事情,可能本来就不是我们应该花最多时间做的事情。AI帮我们把重复性的、相对简单的事情做了,把一些过去认为是思考,但不是深度思考的事情做了,也许就是为了解放我们,让我们真正找到人生的价值,把时间花在那些只有人类能做的事情上。

(《财经》记者刘以秦、研究员吴俊宇对此文亦有贡献)
责编 | 杨明慧

出处:微信公众号 @财经杂志

meiguo.com 发布人签名/座右铭我已经有美国绿卡了,只差美果绿卡啦!
大家都在看
楼主新近贴
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

15   2024-11-27 12:35:28  回复

回复/评论:对话李开复:“勤俭持家”的中国大模型道路

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 王毅定调了中国统一,马英九发出了战争预警!
  2. 重庆妹子“盯美国男人不放”,前后嫁给美国医生和美国律师!
  3. 23岁中国女留学生在南加州的住所内遇害,曾控诉白人男友“性虐待”!
  4. 陆地入境美国受阻,“华人偷渡客”已经改用快艇登陆了?
  5. 李嘉诚在全球的港口“几乎清仓”,套现190亿美元!
  6. 大S【徐熙媛】病逝,享年48岁!
  7. 美签面签后的全面复盘:审核原因和拒签因素剖析
  8. 谷歌地图和苹果地图已经都修改了美国湾(墨西哥湾)
  9. 美国首都机场为何全美风险最高?川普总统“怒喷航管弱智”
  10. 风向有变?🇨🇳中央召开民企座谈会,寓意深刻!
  11. 北美留学生注意,美国和加拿大即将共享所有移民和签证讯息!
  12. 在美国买房,看Open House时需要注意的问题汇总
  13. 美国留学的政策大变?众多名校陷入财政危机,扩招中国学生?
  14. DeepSeek已经让成人玩具“率先受益”
  15. 全美境内,非法移民“驱逐战”打响了!
  16. 遭遇“断粮”的BBC叛变了?
  17. “复活版”TikTok“拿捏了”美国人的软肋?
  18. 川普政府的“朝令夕改”最短纪录再次刷新
  19. 美国房产的保值要点,但却被九成华人买家忽视了!
  20. 男性精液质量和预期寿命“真有关系”
  21. 滞留美国的华裔非法移民“遭遇流放”,首批119人已起飞!
  22. 时至2025年3月中旬,地球上最顶尖的五大芯片品牌,均由华人掌舵!
  23. 福布斯曝光了Deepseek 梁文锋的净资产
  24. 赴美生子的中国人在纠结剖不剖?美国人在寻思“移民鹤岗”呢!
  25. DOGE让1.4万公务员失业?马斯克已经做好最坏心理准备!
  26. 赵本山在纽约:前排票价1400美元,团队聚餐画面曝光!
  27. 全面盘点:加州大学的9大分校
  28. 华人害华人!涉及1500万美元的芝加哥“大型持枪绑架案”嫌疑人半数落网
  29. 《纽约时报》刊登的中国父子文章:为何送儿子留学美国
  30. SpaceX在13小时内3连发,全力拯救被困宇航员!
  31. 在美国生活,这四证缺一不可!
  32. 滞留太空的NASA宇航员即将返回地球
  33. 美国“H1B签证”新一轮抽签在3月份开启,新变化真不少!
  34. 成也“马老板”,败也“马部长”?关于伊隆·马斯克的现状
  35. 泽连斯基和川普、万斯在白宫当众吵架,饭都没吃着!
  36. 川普总统竟然帮马斯克“带娃儿加带货”,特斯拉市值保得住了?

美国动态 美果转盘 美果商店

Your IP: 18.220.248.77, 2025-04-03 07:09:26

Processed in 0.09071 second(s)

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
已有0次打赏
(15) 分享
分享
取消