中美AI产业的不同图景,AI First产品的最终形态,以及AI对人类命运的影响
文|《财经》研究员 郑可书
编辑|马克
李开复创业后的关键词是“勤俭持家”。
2023年5月,创新工场董事长李开复卷起袖子自己创业,成立大模型公司零一万物并担任CEO。李开复拍板选择更便宜、更具性价比的大模型研发路线,与相熟的国内外财富100强 CEO见面,把个人精力花在开拓客户、谈订单上。他同时带领团队开发应用,确立海外ToC(To Consumer,面向个人用户)、国内ToB(To Business,面向企业客户)的战略,探索收费的可能性。有人认为他能融资几十亿美金、与美国公司角逐AGI(通用人工智能)的机会,因此加入,又在发现公司选择不烧钱之后离开。但李开复有充足的理由相信,“勤俭持家”才是正确的道路。
李开复1961年出生于中国台湾,11岁时移居美国读中学,后入读哥伦比亚大学计算机科学系。1988年,他自卡内基梅隆大学的计算机系以最高荣誉毕业,获得博士学位,后在苹果、微软、谷歌等科技公司担任高管。2009年,他在中国创办天使投资公司创新工场,关注硬科技投资与前沿技术趋势。作为中国最早的AI布道者,他被称作“中国的AI教父”。
2023年,ChatGPT掀起AI 2.0浪潮半年后,李开复创办零一万物。经过轰轰烈烈的“百模大战”,大模型行业经历洗牌,中国六家头部创业公司,零一万物、智谱、MiniMax、月之暗面、百川智能、阶跃星辰,被并称为“六小虎”。
如今,他们面临共同的处境——融资少、估值低。美国的头部公司OpenAI累计融资额已经超过115亿美元,估值1570亿美元,而国内六小虎的融资总额与估值,普遍在数十亿美元级别。这在大模型领域,是一个足够关键的问题,因为由OpenAI指明的AGI(通用人工智能)路径,就是Scaling Law(规模定律),是堆GPU(图形处理器)、堆数据,“大力出奇迹”。而这些都需要钱,很多的钱。斯坦福大学人本人工智能研究中心发布的《2024年人工智能指数报告》估算,OpenAI的GPT-4模型,训练成本7800万美元;Google的Gemini Ultra模型,成本高达1.91亿美元。
大模型创业公司同时面对来自大厂的价格战挤压。今年5月以来,字节跳动旗下云服务火山引擎、阿里云、百度智能云、腾讯云先后把大模型推理算力价格调低90%以上。
在AI 1.0时代(2012年-2022年),李开复投资了10多家独角兽。他看到当时的局面,上半场大家比论文、比赛事排名,下半场比拿单子、比规模化收入、比盈利。他认为AI 2.0不能走到类似的道路上,最终的盈利环节,才是真实的“灵魂考验”,而且不可避免。
李开复下周年满63岁,他每天四点半起床,一天工作十多个小时。他说这是“年纪大的好处,不需要那么多睡眠”。他没有想过退休的事,将零一万物视作自己“最后一个非常重要、让我振奋的事业”。
李开复近日接受《财经》杂志执行主编马克专访。“勤俭持家”的技术路径之外,他还谈论了商业化策略、管理创业公司的心得、中美AI的不同图景、AI First产品的最终形态、以及AI对人类命运的影响。
【01】
不能明显好过开源模型就不要做预训练了
“我们是勤俭持家的Scaling Law,他们是财大气粗的Scaling Law。”
马克:零一万物的大模型Yi-Lightning最近在国际盲测榜单LMSYS上超过GPT-4o(五月版本)。有一种说法,盲测跟考试一样,高考状元进入职场也未必表现好。你们为什么热衷于盲测?它的意义是什么?
李开复:我们绝对相信产品和用户比测试重要。但是做技术,需要知道自己的位置在哪里,知道和过去的自己比怎么样。以后每个月,我们可能都会参加测试,目的不是刷榜单,而是看看有没有进步。我特别认可的一句话是,不衡量就不能进步,所以我们要不断衡量自己。内部测试可能会失准。参加竞赛还是有价值的。如果你说高考考出来的结果并不是绝对正确的指标,那在家关门自己做模拟题更不是。至少高考能帮助我们确定,模拟题做出来的成绩是真的还是假的。
马克:所以测试成绩跟实际产品的表现能画等号吗?
李开复:不能画等号,但是相关的。如果产品固定不动,把下面的模型换成另一个,新的模型比旧的多30分,用户是可以体验出来的。但如果我们只有这个分数,完全不管用户体验,那也不行。其实两者各有价值,一个是评估模型本身的能力,一个是评估产品的能力。模型的能力可以给产品加分,还有很多别的因素也可以给产品加分。这两者缺一不可。
马克:有报道说,国内好多大模型公司,包括六小虎中的两位,已经放弃了预训练。这意味着什么?
李开复:为什么要做预训练,或者为什么选择放弃?答案其实非常简单。如果一个大模型公司自己的预训练做不过开源模型,那就应该放弃,直接用开源模型。或者如果你略胜开源模型,但训练花了很多钱,投资回报不值得,也应该放弃。我们是超过了所有的开源模型,包括比我们参数量大20倍的Llama-3.1-405B,所以我们没有任何理由放弃预训练。
马克:2023年,无论中国、美国,大家都在谈AGI(通用人工智能)。到了2024年,美国还在谈AGI,中国的话题重心转到了落地、应用、产品、收入、客户。这种现象与谁在坚持预训练、谁在放弃预训练有关系吗?
李开复:坚持AGI就必须坚持预训练,但是坚持预训练未必能第一个达到AGI。我认为如果未来三年,有公司达到AGI,它高概率是一个美国公司,主要理由是中国公司的估值、融资不如美国公司。OpenAI一次融60亿美元,中国融资最多、最快的也只有它的六分之一,而且融一次,下一次也不见得那么容易。如果AGI是靠Scaling Law烧出来的,那美国公司融得多,就会跑在前面。
但是跑在前面有跑在前面的打法,落后一点有落后一点的打法,就像骑车比赛,你很厉害,跑在前面,帮后面的人挡风了,后面的人可能跑出更好的成绩,但未必能跑过你。我们不仅坚持预训练,而且在LMSYS评测上公司排名跟马斯克创办的xAI一起全球排第三,绝不能放弃,但我们也不会认为再过一年就会只落后OpenAI两个月甚至超过它,毕竟人家每做一次训练,花的钱是我们的几十倍。我们希望能用更少的钱,训练出一个更快、更可用的模型。当然如果AGI发生了,我们只落后OpenAI六个月,他先做成,我们六个月以后可能也能做成。
马克:Yi-Lightning模型,零一万物训练一个多月,一共只花了300多万美元,而GPT-4要花7800万美元。怎么把训练成本降到这么低?他们这么烧钱是因为太有钱了吗?
李开复:对,当你太有钱的时候,你就会犹豫要不要花很多时间去抠细节。从另外一个角度看,我干嘛要请这么多工程师?我反正财大气粗,一下子烧一亿美金,结果会早出三个月。也许对他来说早三个月出结果更重要,多烧钱更不重要。这个心态最极端的是Meta。Llama的训练应该也花了几亿美元,而且我的理解是GPU花了几亿美元,数据还花了几亿美元,最粗暴的用钱来买时间,这也是一个战略。但我觉得一方面中国公司资源有限,一方面中国的工程师非常勤奋努力(都是原因)。
我们为什么能够300万美元训练出来?有几个因素:第一,我们特别重视模基共建。也就是说,我们的AI基础设施和模型一起开发,把成本当做第一要素。如果训练的某一种方法太花GPU了,我们就不走这个路径。哪怕结果稍微差一点,只要能省很多的钱,我们会选择这么做。第二,我们还有一些独特的技术,包括MoE(混合专家模型),在不同时候这里省点、那里省点。第三,我们特别重视内存的管理,用内存取代计算,来达到更好的结果。还有GPU训练的时候,宕机是很大的问题。我们去预测它的宕机,在宕之前把它换掉,或者宕之后做恢复。这里10%、那里10%加起来,就变成26倍的差距。可能很多美国财大气粗的公司会觉得我就是要烧AGI的,损失1%我也不愿意,我宁可多花1亿美金。
马克:把参数降低是不是也是节省成本的办法?
李开复:是的。我们过的数据大概是GPT-4的三分之一,一下又省了三倍的成本。而且MoE就是一个很聪明的降低参数的方法。用MoE,是看到了稠密模型的缺点,比如4050亿的参数量,里面绝大多数都是无用的,用MoE是指,如果只有这几个地方重要,就把它们拉出来做3个专家模型,其他的我就不要了。这是一个简化的例子。我们不断做这方面的实验,扔掉巨大稠密模型里面不用的部分,抽取有用的部分,当做专家模型,再用MoE的模式整合。
再往下推算,为什么只做3个(专家模型),不做100个?这又是一个勤俭持家的问题。如果做非常多专家的MoE模式,训练会非常痛苦,因为稠密模型就是一个模型,而分很多(专家模型)的话,数据协调、内存管理、算法收敛等,都需要成本。
马克:按照这个逻辑,Scaling Law不一定成立?
李开复:Scaling Law肯定成立,而且已经出现新的演化。我们预训练模型花了300万美元,如果给我3000万美元,肯定可以训练出一个更好的。我们一年要训练多次,而且预训练只是整个成本的一部分,还有后训练、推理、研发探索。全部加起来,模型成本是300万美元的几倍。而且我们还要做开源模型、多模态模型。这么一加起来,整个花费还是很可观的。
Scaling Law肯定是对的,只是我们是勤俭持家的Scaling Law,他们是财大气粗的Scaling Law。
【02】
ToB还是ToC?
“刚开始是比谁的论文多、谁打比赛得了名次。后来就看谁拿下单子,谁能规模化收入,再看有没有单子可以盈利,然后看整个公司能不能盈利。最后这两步是真实的灵魂考验。”
马克:零一万物的产品策略是海外做ToC,国内做ToB,这个策略是一开始就想好了,还是经过一年多摸索出来的?
李开复:国内/海外、ToC/ToB,四个可能性,我们知道不能都做,但是要做一些探索,才能决定哪些不做或先不做。
马克:对ToC、ToB的产品结构有什么预期?
李开复:我先讲讲ToC。无论国内还是国外,ToC的发展路径会跟移动互联网相似。因为手机的来临,移动互联网把所有应用都重做了一遍;现在也会因为有AI的来临,把所有应用重做一遍。移动互联网要做的是Mobile First,AI做的是AI First。
什么是Mobile First呢?一个应用,如果在PC(个人电脑)上、手机上使用起来是一样的,那就不是Mobile First;如果它基于你的地理位置做了PC不能做的事情,那它就是Mobile First。比如美团、滴滴就是Mobile First,四大门户网站就不是。
一个新技术革命的来临,通常会是循序渐进地,从一些比较基础的需求走向更复杂的需求。比如先去浏览内容,再去创造内容,再去搜索和组织内容,再去把内容多元化、丰富化,再去做交易。在移动互联网时代,刚开始是浏览工具,比如UC Web、豌豆荚,然后是搜索,比如百度,然后是多元化社交和娱乐,比如微信、快手、抖音,再往后是新电商和交易,比如拼多多。
AI First的蓝图也是一样,从浏览到创造内容,到搜索组织内容,再到多模态社交和娱乐,再到本地生活和电商。越往后走,用户越来越多,使用越来越复杂,就需要越来越强的模型。我们是用这样的方法论打造新的应用。
另外还有一点特别重要,你在某一阶段说我要做AI First的应用,你一定要找一个更好的模型;这个更好的模型如果太贵,你就要等它变便宜,或者你要主动把它做便宜。这也是我们的闭环工作,就是我们看中了要做若干个应用,用外部的模型太贵了,内部的模型可能刚开始也比较贵,那么我们就想办法把它做便宜。
马克:为什么国内做ToC还不成熟?
李开复:国内还没有发生ChatGPT moment。虽然国内很多大模型聊天机器人产品已经跟第一个版本的ChatGPT一样好,甚至更好了,但因为不是一个单一化的产品,没有起到教育市场的作用。但ChatGPT在美国推出的时候,每一个人都去用(这同一款产品),它就自然地吸收一批用户,然后塑造用户认知,再收费,大家也觉得这是可以收费的。中国的大模型从业者就没有这个信念。现在市场上四五家聊天机器人,有两三家都做得不错,都不收费,用户也就不愿意付费,甚至有些人初次用,不知道这是什么,把它当搜索引擎,对效果不满意,所以留存也不好。这些问题都需要时间来解决。
马克:所以尽管Kimi、文小言、豆包,下载量已经数以千万计了,但一旦收费,你觉得他们都是不可持续的?
李开复:付费习惯确实是一个很大的挑战。我都不谈收费了,用户留存都是挑战。获取用户挺贵的,用户留存也不是很好。把用户留下来、把量做上去,甚至达到排名前三的地位,要烧的钱是我们今天不愿意烧的。
大厂的优势是它可以用已有的海量用户推新的产品,初创公司非常吃亏。评估之后,我们就觉得国内(ToC业务)[WY1] 还要再等一会儿。要不就找一个用户需求很强、自带流量、可以病毒式传播的应用,要不就找一个像Prosumer(生产型消费者)的产品,可以收费,但不是针对所有人,而是针对少数职场工作者的需求;要不就是用户认知足够强了,再去和其他产品竞争。
以现在我们有限的精力和资源,先在国外把(ToC业务)[WY2] 产品做得更好——能收钱就收点钱,能赚钱更好——在适当的时刻再出口转内销。就像当年字节先做抖音再做TikTok,拼多多先做国内再做海外,SHEIN先做海外,以后也可以做国内。
马克:所以付费习惯和产品力,哪个权重更高?为什么QQ音乐能收到钱,腾讯视频能收到钱?
李开复:如果真的能找到用户的痛点或需求,是可以收费的。现在大家都捆绑了支付方式,不是付费困难,而是一种习惯。比如大家都习惯搜索是不要钱的,就很难做一个付费的搜索产品;大家一定程度上也开始习惯聊天机器人不能收费,这是一个很大的坎。
但我觉得AI能做的产品绝对不只是一个ChatBot。比如一个能够节省办公时间、提高效率(的产品),就有可能收费。再比如一个多模态的、AI First的,下一个时代的Microsoft Office或Adobe,就有可能收费。谈到音乐,既然大家已经有付费习惯,有没有可能做一个AI音乐产品?这些都有机会。如果把自己锁定在无论如何要做ChatBot,我就是要去花钱买用户,然后执着地认为可以收费,那这不是成熟的商业化思维。
马克:半年前你说过,国内ToB做一单赔一单,你们不会做,为什么现在说国内可以做ToB?
李开复:我当时说的是不会做“做一单赔一单”的项目,我们现在还是不做。我们希望做能够收费而且盈利的项目。不是说每个项目都要盈利,但是大部分都应该要盈利。
马克:找到这种ToB产品了吗?
李开复:正在摸索,初步有几个客户。有些客户是垂直领域,比如能源,有特别独特的需求,项目式招标不能解决的问题,我们和这样的公司合作,收费会酌情更高。它跟项目制的差别是,如果做一个应用,甲方只愿意付200万,但成本是300万,为了打败竞争对手,项目制公司会接,但我们不做。一些公司勉强做了,可能也不会花心思做得很好,交付之后客户不满意,之后大家也没有再次合作。我们宁愿去更精挑细选,选那些认可我们、我们能赋能他们的(客户),我们用大模型技术帮助他们找到利润的第二增长曲线,而我们也从中获益,大家共赢。
马克:零一万物有哪些你比较满意的ToB产品?
李开复:我们走了几个赛道:线下连锁零售、餐饮等本地生活场景,政务,智算中心,城市的新能源,游戏。每一个赛道的需求不一样。能源客户希望提高效率,游戏客户希望增加用户时长、减少游戏制作时间,智算中心客户需要很强的AI基础架构,让它买来的GPU发挥作用。本地生活客户是用“大模型+数字人”的技术获客并增加GMV(交易总额)。过去的直播是人讲的,又花时间又花钱,数字人能一天做20个小时的直播,也不需要人写脚本,大模型自动生成,它是一个端到端的解决方案。只要接进去,第一次花几小时、第二次几分钟就可以每天直播。第二个好处是,它产生的GMV、省了多少钱、赚了多少钱是可以计算的。今天的经济情况之下,能扩大GMV就是客户最大的诉求,这样收费就有希望。我们在打造这样的产品,还比较初期,现在也不是做一单就能赚一单,但可以看到曙光。
马克:你们的整体ToB思路是什么?
李开复:我们的ToB思路是能够展现我们的特色,可能是模型更强、成本更低,或者是我们对某一个领域有很深的认知,或者是客户信任我们的品牌。因为很多客户是我跟我们团队打出来的,我个人也认识蛮多财富100强的CEO。我们会思考在有些行业,是不是能够做端到端的、能够带来商业价值的(解决方案)。我们也还在探索阶段,但确实拿了几个蛮大的单子。
马克:国内ToB业务的难题是:如果每一个项目都要从零开始做,那就没有复利。
李开复:我们会希望不是这样的,我们希望有可持续的收入。刚才讲的几个行业里,至少有两个可以有持续收入,比如我license(许可)技术给你,按月收费。按月收费,就要按月证明能帮客户赚钱。我们要让客户看到,虽然每个月要付几十万,但是可以赚几百万。我们也会做一些项目制的,但我们希望项目大一点、创造价值高一点,我们的利润就能多一点。
马克:做ToB和ToC的思路完全不一样,对能力、基因的要求也都不一样。同时做这两种业务,会不会引发分裂和冲突?
李开复:怎么去均衡我的注意力,并让大模型技术能够关注两边,这是有一定挑战的。现在我的时间会更多放在帮ToB业务找客户、看单子,团队也理解,因为有些单子是我认识CEO(所以谈下来),而且ToC是他们自己运营,不见得需要我参与。
模型的打磨可能更偏向ToC,一边做应用、一边测数据、一边调整模型;ToB的工作流程需要更多的外部协同,与客户的直接沟通。所以在公司内部确实有形成两个部门,我要确保跨部门合作的时间能够合理分配,进而模型能进行局部快速调优。这件事情是可能的。因为我在微软的时候也一样,底层 Windows不分独立体系,但是上面的产品分ToB、ToC。我在微软学到很多管理方式。
马克:微软是一家巨大的公司,它的ToC、ToB团队很可能就是独立工作,没有交互性。但零一万物是一家创业公司。现在在零一万物ToC、ToB团队有协同效应吗?
李开复:有协同效应。技术都是协同的,另外很多ToC的产品,里面的技术可以提炼到ToB,因为无论什么用户都需要基础的功能,比如帮我读20篇文章,或者写一个报告。
马克:现在会考虑break even(收支平衡)的问题吗?
李开复:现在没有考虑,但是需要未雨绸缪。我在AI 1.0时代投了10多家独角兽,它们刚开始也是比谁的论文多、谁打比赛得了名次。后来就看谁拿下单子,谁能规模化收入,再看有没有单子可以盈利,然后看整个公司能不能盈利。最后这两步是真实的灵魂考验。当年很多AI 1.0公司,在最后两个问题上没有过关,因此上市以后也面临很多问题,或者根本不能上市。
今天的大模型虽然技术更好,但是竞争也更激烈,我们也在经历(类似AI 1.0的)这个过程,所以我们会知道这个阶段需要拿下一些客户,做一些亮点产品。但这只是刚开始,下半场看收入和利润够不够、有没有产品能力、能不能整体盈利,这不可避免。
马克:有报道说,零一万物最近拿了一大笔融资(2024年8月,零一万物获得数亿美元的A+轮融资),是不是明年、后年甚至大后年都不用考虑break even的问题?
李开复:我觉得是按部就班,今年先拿到一些单子、有一些收入,明年希望这些收入不是一次性,有一部分可以按年收到,而且我们希望可以看到利润提升,再后面希望有些产品线是盈利的。
我们投的一些比较好的AI 1.0公司,本来成立六七年之后就可以盈利了,但他们没有做到,因为碰到疫情、经济形势、上市等问题,但它们提供了一个参考,AI 2.0的创业公司有这样的希望,六七年时间从一个初创(公司)做到break even。要努力地去做,因为盈利问题是逃不掉的。很多创业者觉得我上市就OK了,股票就可以卖了,但上市还是要把握时机,要在一个成长非常好的时候,不然随着成长放缓,股市会要求盈利,(到时候)就能算上市,(股价)跌个百分之七十八十九十,其实也就打回到A轮B轮(融资时的估值)了,上市也白上了。我们要努力避免这个问题。
马克:所以零一万物设定每个阶段达成什么样的目标?
李开复:活下来是最重要的。在这个前提之下,我们要尽量做出出彩的产品和技术,这些产品和技术还要带来一些商业的结果。为了完成这些任务,就不能不负责地把全部的钱花在买GPU上。
【03】
自由与创新VS规则与流程
“Necessity is the mother of innovation(迫不得已是创新之母)。很多创新,是因为有一些束缚,不得不做的情况下,才开创出来。“
马克 :运动员(创业者)转做教练员(投资人)很常见,反过来就不多见,你创建零一万物就是教练员转做运动员,你还见过其他这样的人吗?
李开复:有啊,Sam Altman不就是吗?雷军也算是。做投资可以看得更深刻,一个公司的发展路径、战略,或者直白一点怎么去融资,怎么去上市。一个理想的创业者应该是(把这些)都塞到脑袋里,知道从零到一怎么做,知道大公司怎么管理,知道怎么去融资、上市。
马克:你的竞争对手里面已经出现了90后的CEO,你觉得这是个问题吗?
李开复:我觉得各有优势。他们写代码肯定比我好,但是谈商业模式、公司战略,我更有经验。
马克 :你真的认为零一万物能做成一家万亿美元市值的公司吗?
李开复:我认为我们有希望,我们会努力地去做,但这肯定是一个具有超大挑战的事。当年我说过,希望有一天零一万物万亿美元,不是很狂妄地说我一定能做到,而是说这一次的风,会带来一批万亿美元的公司。做这个领域的任何一家公司,都有这样一个最终的希望。
马克:二级市场的投资圈有一句名言:在你想赚多少钱之前,先想清楚自己能输多少钱,要先给自己设定止损线。你觉得这句话在创业圈适用吗?
李开复:为什么要去想能输多少钱?去想输多少钱,就已经输在起点了。止损线那是买股的,我做早期投资,不投二级市场,可能也是因为我没有这种基因跟思维方式,起步阶段我不考虑止损。创业不能第一天就想着如何止损了,不能这么想,创业一定是All in。
马克:零一万物现在有多少员工,你怎么管理他们?
李开复:大概两百。我希望能招非常优秀的人,放权给他们做管理。所以我的-1团队是相当资深的,年龄也比其他大模型公司年长一些。我非常信任他们。我想我需要做的就是公司的整体战略,还有做对外的发言人、融资人。我要确保公司的文化发展方向,还要负责招聘,要给一个团队正确的目标。
马克:你说过对人才的看法,包括自驱力、专业能力、学习能力、沟通合作能力。你把“自驱力”放在第一位。每个公司都想找到有自驱力的人,怎么找到这些人?
李开复:自驱力,就是积极主动、负责,不会推卸责任。进公司以后也要考察一段时间,我们也不是每一个招来的员工都有很强的自驱力,需要不断调整。
马克:有些人是挺会表演的,怎么鉴别?
李开复:只有看结果说话,看一个人怎么面对问题。把责任推给别人,或者找借口,丢给别人解决,这些都是不负责任的表现。自驱力很强的人应该把自己当做公司的主人,碰到问题要自发、主动地去负责。自驱力不够,就会只把工作当成工作,朝九晚五。
有一句话我很认可,一个自驱而高效的人,重视的是结果,而不是形式。我更希望在周报中看到这礼拜碰到一个超级大的挑战,我带着团队把它克服了;或者说我承诺季度达到的销售目标,两周前发现落后了,这两周我们加班补上。这就是result(结果)。而不是写了多少行代码,出了几次差,开了几次会。
马克:对于前沿领域的创业公司来讲,自由和创新是必须的。但是对于任何一家公司来讲,规则和流程也都是必须的。自由与创新,规则与流程这两者往往是对立的,你怎么平衡?
李开复:我觉得没有绝对的自由。绝对的自由就像是一个没有管理、松散的科研机构。我们不是的,我们在一个竞争激烈的行业里,要战战兢兢地去追赶,所以我们一定要有自己的框架和战略,在这个前提之下去做创新。
比如我们做大模型,目的是要做到世界一流,速度快、价格低。如果只能做到效果很好,但是很贵、很慢,我们不做。所以我们自由、放权是有的,前提是按照公司的战略方向走。
有一句话我特别认可,Necessity is the mother of innovation(迫不得已是创新之母)。很多创新,是因为有一些束缚,不得不做的情况下,才开创出来。我们穷,融资少,不能把GPU当做无限的资源去烧,反而因为有了这些限制,才有创新。如果我们当时融资20亿美元,缺少条件束缚,可能就弄了太多GPU。我们没OpenAI有钱,所以一定要找一个自己的方法,而且如果用OpenAI的方法跟OpenAI竞争,那是必死无疑的。
创业的前六七个月,我们舍命狂奔,因为我们落后太多了,连GPT-3都不如。每一家大模型公司在去年可能都是这个状态,但是进入今年以后,我觉得格局就比较清楚了。也看出来想烧钱烧出AGI,我们是烧不过美国的,我们要走出一条不同的路。大概今年年初的时候,我们就定下基调:超快训练、超低费用,模型尽量做到最好。
马克:电影《奥本海默》里,有一个场景是讨论研发路径时,一个科学家站出来说,你们说的都是狗屎,我的这个更棒。奥本海默把他边缘化了,但这人后来做出了氢弹。如果团队发生这种事,你会怎么处置?
李开复:因为奥本海默面临一个deadline(截止时间)。这样一个跳跃式的、不知周期的想法,是达不到目标的,所以只能放弃。
马克:零一万物是不是也面临同样的问题?
李开复:我们会希望留住每一个人才,但也不可否认,原来选择跟着我的人里面,有非常少数觉得这是中国人做出AGI的机会,觉得开复可以融到几十亿美金跟OpenAI打仗。后来发现现实很残酷,跟硅谷巨头相比,我们“六小虎”面临的问题是一样的,融资辛苦,估值偏低。我们不能走OpenAI的路子。这些当时这样想的人,可能就会去美国,干脆加入OpenAI,去实现他的梦想。
【04】
大模型“六小虎”谁能活下来?
“市场实在是够大,可以选择的实在是够多,这不是零和游戏。”
马克:国内大模型行业今年爆发了价格战。价格战的目的一是赢得收入,二是占领更多市场份额。价格战是大厂发起的,他们有雄厚的实力,创业公司如何在大厂的压迫下生存?
李开复:一个水平一般的模型,你降到免费也不创造任何价值,一个水平很好的模型,可以既得到市场份额,还能挣到钱。大厂有它的优势,钱多、人多、资源多、GPU多、场景多、数据多。小公司也有优势。第一个就是团队更凝聚。在大厂,做芯片的在一个组,做基础架构的在一个组,做AI模型训练的在一个组,做推理的在一个组,做应用的在一组,5个组可能有5个VP(副总裁),5个VP有不同的KPI,很难协调。第二个差别是,大厂有更宏伟的目标,比如卖云,比如推某一个拳头产品, AI是服务于另外更大的目标,那就不是直接做满足用户需求的AI Firs产品,而创业公司可以更纯粹地走这个方向。第三个是大厂可能有The Innovator's Dilemma(创新者窘境),他不能把AI嵌入已有产品,不然他可能就没有收入了。比如说Google,为什么Gemini做得不怎么样,为什么不去做AI搜索?比如Perplexity的搜索就比Google好用。其实就是Google不敢做AI搜索。因为它一做AI搜索,传统搜索广告收入就会受影响。还有一点非常重要的,我的前老板Eric Schmidt(谷歌原CEO)在斯坦福说的大实话。有人问他,OpenAI怎么打败Google?他说Google自从疫情之后,员工比较慵懒,在家工作,不像OpenAI是个创业型公司,疯狂往前冲。当然之后他有道歉。但我觉得是大实话。在创业公司,员工更有主人翁精神,大厂的话就是一份工作。大厂和创业公司各有优势,我不会说创业公司有绝对的优势,但是我觉得这个优势和劣势是旗鼓相当的。
马克:现在的大模型“六小虎”,你觉得最终能有几家生存下来?
李开复:我觉得大部分都可以生存,但是不一定都会做往AGI、往Scaling Law走的预训练公司。可能有些会走娱乐,有些走ToC,有些走ToB,有些走开源路线,有些在国内上市,成为国内做某某领域最强的公司,有些可能放弃预训练,但是能接单。我觉得每一家都会发挥自己的优势。
在今天,这六家公司的直接竞争并不多。我们就讲一个最简单的例子,我们(目前)基本不竞标。我觉得这个市场实在是够大,可以选择的实在是够多。比如说我们做海外ToC,另外还有至少一家也在做海外ToC,但我们的产品完全没有交叉。这不是零和游戏。
马克:基础大模型国内公司要赶上美国同行是比较难的。但是也有蛮多人说不用担心,因为国内有丰富的应用场景,尤其是ToB,虽然基础模型不如美国,但我们完全可以开发行业模型、服务行业客户,这样我们也能活得好。你同意这个看法吗?
李开复:一方面我同意,国内有非常丰富的场景,非常多的行业数据,而且确实底座不见得有差那么多,六小虎里做得最好的三四家的底模,都足够满足各行业的需求。但是我觉得行业模型的落地,必须解决另外一个问题:客户如何能够接受更先进的商业模式,互创价值,形成良性循环。
如果客户只愿意给你那么点钱,那你也只能干那么多活,他就没有那么满意,这样就很难形成良性循环。而美国现在比较先进的模式,SaaS(软件即服务)也好,订阅也好,都能形成良性循环。放眼看美国这些几百亿美元的公司,从Databricks到Snowflake,都在和客户产生良性互动。客户愿意持续付费,愿意为软件买单,软件公司赚了钱就继续投入,给客户更好的技术,让客户愿意继续付钱,实现了良性的循环。
简单地说,就是中国的企业级软件的商业模式不如美国,企业没有足够的付费意愿,创业者无法获取足够收入来持续进步。这个问题如果不化解,大模型和其它企业级软件都会面临很大挑战。
马克:美国的基础模型在不断前进,参数量从千亿到万亿,国内跟进很吃力。这会不会影响到国内下游的应用开发?
李开复:不但不会,可能还有独特的优势。今天我们的参数量比世界最好的几个模型少一个数量级,但恰恰因为少了一个数量级,而表现跟它又很接近,我们的推理可以做得又便宜又快,反而适合开发者开发应用。如果拿最贵的模型,开发者做不起。
马克:OpenAI已经关闭了中国大陆的API服务,美国国会也在讨论禁止开源模型出口。国内很多模型是基于美国的开源模型,如果他们不再允许使用,那意味着什么?
李开复:对零一万物没有任何差别,因为我们现在不用任何开源模型,是自研的系统,当然参考了很多别人发表的论文或业界标准。话说回来,如果两年前就不存在任何开源,中国业界确实会受到一些挑战,但是我觉得美国的很多讨论都戴着“后视镜”,看到过去开源让中国跑得更快(所以要禁止出口),但他们没有看到中国现在对开源的依赖已经大大降低。而且我们也不要认为开源是纯粹美国人发明、中国人学习,在中国很多开源做得很好。开源是一个互惠的事情。美国政府如果把它当做单行道,认为只是方便了中国学习美国,这是错误的、短视的,一方面低估了中国今天已经达到的水平,另外也不了解中国也在积极开源。我们可以看到Hugging Face CEO常常说,现在开源模型最多的是中国。
马克:所以结论是,即便美国真的禁止开源大模型出口,对中国从业者也不会有太大影响?
李开复:我觉得短期内不会有太大影响,中国现在基本是能够自给自足。但也不能排除三年后美国的某个天才科学家开源了一个天才发明,帮助了全世界。只是说按照今天的情况,我想很少中国大模型公司需要完全参考美国的开源模型,才能推动自己的进步。这个时代已经过去了。
我们当然还是希望开源社区继续开放,大家能彼此切磋学习进步。我也不认为能轻易阻止开源,因为全世界的开源社区可能是最不被地缘政治影响的。开源的人就认为我们愿意彼此扶持,是站在巨人的肩膀上的信仰者。如果美国真的出了这种法律,可能反抗最多的是那批美国开源社区的人。
马克:你是1988年进入职场的,这三四十年间经历了好几波技术浪潮,PC、互联网和移动互联网、云计算,如今是AI 2.0。一家公司只要抓住一次浪潮,就会成为巨头,但往往抓住上一波的巨头会错过下一波。你有没有见过没有错过任何一次浪潮的公司?
李开复:微软应该是最接近的,而且很有意思的是,我们可能都想着软件公司,其实硬件公司也是一样的。PC时代是英特尔的时代,移动时代是高通的时代,现在 AI 2.0时代是英伟达的时代,所以我觉得不可避免的,每一次科技浪潮都会因为新的技术认知,而带来新的领军公司。一些旧的公司不愿意放弃过去形成的商业模式和利益,被替换是高概率事件,但是也有一些能坚持下来。
马克:生成式AI这波浪潮中,诞生了两个巨头,英伟达和 OpenAI。OpenAI可能更准确一点,因为英伟达之前已经挺大了。有没有可能再出现一个类似OpenAI的巨头?
李开复:我觉得会有很多巨头产生,也许没有OpenAI那么大,OpenAI应该万亿市值。今天每一个应用在AI时代都会被重写,每一个重写应用的公司都可能是千亿美元公司,比如取代Microsoft office、Adobe的公司,取代手机的硬件产品公司,取代Google的搜索公司。
而且,这些例子只是把已有的产品取代了,还有前所未有的产品,比如多模态、具身智能机器人,它们可能更像特斯拉——电动车本来是不存在的产品,突然杀出来。这些市场都是超级巨大的,我相信10年以后最有价值的10家公司,全部跟生成式AI相关,有些可能是现在的巨头,生成式AI赋能后变得更厉害,有些可能是开发了某一个很厉害的应用,然后不断地衍生,做成多产品的矩阵,有些可能是找到了一个生成式AI带来的前所未有的机会,做了一个过去不存在的产品。就像今天前10名很多公司,都是10年前还不太知名的公司,10年以后肯定也是一样的状况。而且可以很确定地说,10年后最值钱的10个公司的总市值,会比今天的高非常多。
马克:在位的巨头中,谁比较危险?
李开复:我觉得Google相当危险,拿了这么好的牌,打得这么差。但核心是,它没有办法放弃核心收入(搜索广告收入)。柯达就是为了它的胶片,不愿意去推数码相机,最后它被自己发明的数码相机革了自己的命。
马克:希望拉里·佩奇能够看到我们今天的对话。
李开复:他们是知道的,Google管理层是很担忧的。但是既有利益的惯性太大,改变起来不止需要壮士断腕的勇气,是壮士要把四肢都切了,这样才可能有重生的机会。但是四肢都切了,怎么重生呢?
【05】
AI产品的最终形态
“大模型是一个很厉害的思考机器,如果只把它看作ChatBot,其实是低估了它。”
马克:进步的捷径就是学习先进。你刚才谈到若干家你认为很不错的美国公司,可以ToC和ToB各拎出一家来详细解剖一下吗?
李开复:我觉得今天美国很有特色的、让我很佩服的公司是微软。因为它一方面能够慧眼识英雄,选中OpenAI,另一方面跟OpenAI达成双赢,至少短期双赢的商业协议。而且它在自己的产品里非常完整地融入了各种大模型技术,整个Copilot,从Office,到Game,到Windows,布局非常完整。而且它也没有那么疯狂地去烧钱。
我觉得苹果的机会和风险都很大,今天它必须采用第三方的ChatBot,因为它自己虽然有投入,但是没做出来,这就代表以后每一个设备使用自然语言界面都要经过第三方的引擎,这个引擎刚开始是问答,之后可能变成搜索,再之后可能就是委托式的用户体验,然后开始帮你干活,成为智能体,最后颠覆整个苹果手机。这个风险是特别巨大的,因为苹果今天最值钱的就是用户,世界上那么多用户,眼睛跟手是在苹果手机上,而且是不经过别人,苹果就可以掌控。如果说整个手机的体验变成对话委托式,可能就会绕过苹果今天的核心优势,它整个生态系统会坍塌。所以我觉得苹果现在特别需要振作起来,拥有自己的AI技术,整合到苹果手机里来。
我觉得未来的硬件会有一个革命,现在还没开始。今天的手机其实不太适合终极的大模型。终极的大模型应该不只是一个问答(工具),而是委托(工具)。跟它说我太太明天生日,它马上就说帮你订蛋糕,这才是一个聪明的委托式的用户体验。但是刚才这句话,如果我要把手机打开,打开Siri,然后跟它讲,看它的答案,我已经浪费了40秒钟的时间了,如果就在我跟你讲话的过程中,它随时听懂我,然后就把事情干了,能够在合适的时候告知我,就很高效。
马克:不需要你给他布置任务,他能够主动推测到你想干嘛。
李开复:这是最好的。我主动布置任务也行,但是我不需要把手机打开,再开APP去选什么条件来用。我每天在讲话,我一讲,它就听到我,就做,这是委托。还有些例子我可能都不需要讲,它就知道应该做。比如说我前三年都买花,今年它就说,你太太生日,你要准备什么样的花。这个过程需要一个设备,可能是随身携带,而且always listening, always on,它才能做到无缝衔接。这样的设备应该由苹果来做。这就是终极的智能助理,因为以后我95%的事情都是经过它来做,所以以后也没什么手机了,因为我没有应用,只有少数的东西我还是要打开软件。
马克:我非常同意你刚才说的,现在苹果的产品不是AI First产品,它是上一个时代的产品,交互不是那么方便。但是哪怕进入到AI First时代,AI First的产品都普及了,仍然需要一个交互介质。还有什么介质比手机更方便?
李开复:如果说是我委托任务,它就把活给干了,它可以是耳环、项链、手表、戒指,可能90%、95%我想做的任务,我说一句话,它就帮我办到。有些东西我需要看,比如说我要看今天股市什么样,当然还是需要手机。就像手机出来的时候,我们没把PC丢掉。所以以后可能也是当我委托任务的时候,什么设备都不要,我讲话,它就学习到了;但当我不是在做任务委托,而是要看一个东西、处理一个东西的时候,我才用手机、电脑。
马克:智能手机之所以了不起,就是集成了各种产品。你刚才讲的耳环、眼镜、项链,一个人是不可能戴那么多东西的。
李开复:最近眼镜也蛮火的,假设跟眼镜说今天买什么东西,或者用餐、订票,所有我会跟我的助理讲的话,眼镜都很熟,这个眼镜就能成为助理。我要看一个视频的时候才用手机。这两种需求比例是80:20还是20:80,我们可以讨论,但是我觉得终极状态应该是很多你要做的任务,这个眼镜会处理。
马克:其实我们讨论的不是一个新话题,10年前就在讨论谁能取代手机。那时候智能音箱是一个热门的候选,后来的候选还有智能手环,但这些统统都没有取代手机。但是我完全同意交互方式一定会变得更自然。
李开复:这个事情不容易达到,我同意非常困难。当年我还在苹果的时候,我们就在推测什么能取代PC,第一套做的是用笔来输入的Pad,不是今天的iPad。那时候假设 PC太大、太麻烦了,能不能像笔记本那样握在手中,然后失败了。还有一些别的公司做,也失败了。然后就出来MP3、iPod,再后面就有了iPhone。所以也是摸索了很多年,从一些失败的产品到单一功能产品比如iPod,最终才到了iPhone。所以我们从今天的手机走向未来的眼镜也好,手表也好,未来还会有很多探索,不会是很轻松的,但最后肯定会找到。
其实第一个牺牲者已经出现了。美国有一个产品叫做Humane,苹果顶级的设计师出来做的,它是一款像别针的可穿戴AI设备,别在身上,always listening,always on,卖五六百块美金,最后这个价位消费者没法承受,体验也不够好,就死在沙滩上。
马克:对于创业公司,如果给他们找一个学习榜样,你会解剖哪家公司?
李开复:最近一个特别火的产品NotebookLM, Google出来的人做的,一个小团队做出来的,它很聪明地让你能把一本书或若干篇文章丢进去,把可能有点枯燥的东西做成Talk Show,自动生成音频,两个人对讲,听不出是机器人,话家常、讲笑话都栩栩如生。在美国,很多人喜欢一边听音频一边开车上班,所以可能每天都有1小时给NotebookLM。我觉得这是一个非常成功的产品,也给我们指点了一些路。我们现在过度地认为要做一个ChatGPT,做ChatBot就是大模型的必然之路,其实做一个非常平易近人、有趣幽默的产品,让大家能够很轻松地消费严肃内容,对我们的价值同样很大。大模型是一个很厉害的思考机器,我们如果只把它看作ChatBot,其实是低估了它。
【06】
AI会解放人类,也会让人类更加不平等
“AI也许就是为了解放我们,让我们真正找到人生的价值,把时间花在那些只有人类能做的事情上。”
马克:今年的诺奖有一个插曲,杰弗里·辛顿说,我很自豪我的一个学生解雇了Sam Altman。在OpenAI的争斗中,科学界好像都在支持Ilya,但商界人士大多支持Altman。你会支持谁?
李开复:我觉得两边都各有道理。但一定要二选一的话,我会支持伊利亚。Sam Altman是一个战略家、谋略家,商业的天才,所以他想尽快打造出AGI,然后就能成为垄断者,成为霸主。这个梦想我觉得每个企业家都会有,我也完全可以理解。Ilya和他周围这些人,包括最近从OpenAI离职这批人,更有理想主义,觉得AGI这么厉害,我们要负责地去做它,要确保它是安全的。本来其实OpenAI的架构是有一点制衡作用的。董事会在乎安全,Altman下面的几个人也比较在乎安全,Altman想推动,但是有上下两层(制衡)。但现在上面的一层切掉了,下面的一层离职了。我们作为AI从业者,也想看到AGI快点来,但绝对不放心让Altman这个人来控制AGI。
马克:几十年的技术浪潮已经深刻地改变了人类社会。但不幸的是,随着技术的进步,人类的不平等也在扩大。1989年,你博士毕业的第二年,美国最富的1%的人占有全美财富的23.5%。2001年,这个数字增加到32.2%,也就是说,1%的人占有全社会1/3的财富,而且这个趋势还在扩大。你觉得AI浪潮是不是会进一步扩大人类社会的不平等和贫富分化?
李开复:首先AI浪潮会给每一个人机会,就像Sam Altman说过,他认为会有第一家一个人做出来的10亿美元的公司。直接回答你的问题,贫富差距肯定会继续增加,除非政府出面阻止,向富人收税,分给其他人。如果没有这类措施,一方面, AI的赢家赚的钱会比移动互联网多,另一方面,很多人会因为AI失去工作,因为AI可以把部分工作取代。会有越来越多的重复性工作,尤其白领,面临失业。所以说最有钱的人变得更有钱,因为得到了AI的红利;而最没有钱的人,自己的工作还可能被AI取代。这会带来更多的不平衡。
马克:678乘以875等于多少?如果你算不出来的话,拿个计算器就能够迅速解决。这跟不会解二元二次方程,让ChatGPT帮你解决,有什么不同吗?
李开复:我觉得人的智能和人的能力应该不断升华,计算器让我们升华到一定程度,生成式AI可以让我们再升华一层。以后我们要去解难度更高的问题,无论是某一领域,比如数学的问题,还是跨领域的问题,比如一个CEO面临的各种抉择。这一类的问题是人类应该花时间去做的。
还有人类的独特性,AI能做的事情越来越多,应该让我们有一个很深刻的灵魂拷问:AI这么多事情做得比我们好,还有什么我们能做、AI不能做的?特别有创造性的,特别复杂的,或者是特别需要温度的、需要亲和力的,或者人与人之间的关系,或者是自我意识,这些是我们最珍贵的事情。
所以我们不要只是觉得AI做了很多事情,我们越来越渺小、越来越没有用。AI能做的事情,可能本来就不是我们应该花最多时间做的事情。AI帮我们把重复性的、相对简单的事情做了,把一些过去认为是思考,但不是深度思考的事情做了,也许就是为了解放我们,让我们真正找到人生的价值,把时间花在那些只有人类能做的事情上。
(《财经》记者刘以秦、研究员吴俊宇对此文亦有贡献)
责编 | 杨明慧
出处:微信公众号 @财经杂志