收藏文章 楼主
黑天鹅“DeepSeek”降临硅谷
网友【AI来了】 2025-01-27 13:16:59 分享在【时代发展的印记】版块    1    12

这是一个信息爆炸的时代,也是一个信息严重污染的时代。所以,我对任何信息都不会轻信,尤其是面对重大利好,更加「存疑」。对我来说,排除信息污染的最好办法,就是交叉对比,正反面都看。

过去48小时内,我几乎都泡在X上,浏览各种关于Deep Seek的消息,在英语世界,基本上是压倒性正面评价,这时候,我就特别想看看负面的评论,找了一圈,的确有。

主要分为两类:

一类,为了反而反,尤其是一些海外的反中人士,任何关于中国的新闻,他们都会给出负面的评价,这类信息简直就是垃圾。但看看也好,至少可以知道垃圾是什么样子。

网友分享在meiguo.com上的图片

另一类,是业内人士的负面评价,其中第一个,也是最鹰派的声音,居然来自一个华裔业内人士——Alexandr Wang。

首先,此人的名字有点奇怪,第一次看到,我以为是CNBC拼错了,一般情况下,Alexander是英语中最常见的拼写形式,也是国际通用的版本。而Alexandr,则是某些东欧语言(如俄语、捷克语等)的拼写形式。一个美国华裔,居然用东欧的名字,有点蹊跷。但我定睛一看,确实是Alexandr。

其次,这位王先生,不仅名字奇怪,更有着与众不同的背景。他出生于1997年,是Scale AI的创始人兼CEO。24岁时,Alexandr Wang成为了世界上最年轻的「白手起家」的亿万富翁。根据福布斯的说法,截至2024年7月,他的身价为20亿美元。

他是中国移民的儿子,父母都在洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)担任物理学家,核武器就诞生在这个实验室。中国人能在这种单位工作,非常罕见。

Alexandr 从小就对数学和计算机编程充满热情。他在2013年获得了美国队的数学奥林匹克资格。在十几岁时,他就在美版知乎Quora担任软件程序员。随后,他在麻省理工学院学习计算机科学,但中途退学,创办了Scale AI,成了硅谷的AI神童。

Alexandr说:Deep Seek至少有5万张英伟达H100显卡,只不过因为制裁的原因,不方便说而已。事后,我看了好几遍CNBC电视台的采访,他的原话是as my understanding,也就是「按照我的理解」,而没有任何实锤的证据。

根据Deep Seek的说法,训练模型只用了2048张H800显卡,也就是H100的阉割版,价格也只有H100(3万美刀)的三分之一。正因为用了低配的硬件,才体现了Deep Seek的创新价值。

网友分享在meiguo.com上的图片

而Alexandr Wang暗示了,Deep Seek只不过也是大力出奇迹而已,根本没有什么创新。

那么5万张H100显卡意味着什么呢?

今年,马斯克用全球最大AI超算Colossus轰动了整个世界,这台超算也只配备了10万张英伟达H100显卡。

即便Alexandr Wang说的是真话,5万张英伟达H100显卡,总价就至少15亿美元。折合一百多亿人民币。一个小小的幻方公司,能拿出这么多钱吗?就算有,H100美国禁运,中国大陆根本没货,也很难买到。

再退一步讲,就算Deep Seek能拿出这么多钱,买5万张英伟达H100显卡,他的成本就和Open AI不相上下了,但Deep Seek是开源免费的,而Open AI要200美元一个月。

因为Deep Seek,我也是人生第一次,学会了用API。我用中国手机开了一个账户,就送10元人民币,我用Deep Seek API翻译文本,百万输入 tokens才2元,用了一个晚上,才花了0.11元。这已经不能算白菜价了,几乎就是免费!从售价倒推成本,Deep Seek也不可能拥有5万张H100显卡。

总之,无论从哪个角度看,Alexandr Wang的论点都站不住脚,但他的说法,依然有价值。

一方面,证明了Deep Seek的技术真的牛叉,已经牛到要用5万张H100显卡才能训练。

另一方面,说明Deep Seek的影响力太大,以至于Alexandr Wang有点慌了,口不择言。

网友分享在meiguo.com上的图片

那么,为啥Alexandr Wang要慌呢?

我不是什么AI专家,但根据我这几天索阅读的大量信息理解,Deep Seek可能是一只巨型的黑天鹅,她正在硅谷的上空游荡。

1/ 目前,训练顶级AI大模型的成本极其高昂。OpenAI等巨头,需要拥有数万个H100显卡的大型数据中心。每块最低3万美元,总价就要十几亿美元,而且耗电量惊人,需要一整座发电厂提供电力。他们仅在训练模型上,就要花费数亿美元。

2/ Deep Seek突然出现并说:「哈哈,如果我们花 500 万美元做这件事会怎么样?」他们不只是说说而已,而是真的做到了。Deep Seek的模型在许多任务上,甚至击败了 GPT-4 和 Claude。硅谷的人工智能世界,瞬间就懵了,AI天才Alexandr Wang语无伦次了。

3/ DeepSeek怎么做到的?他们从头开始重新思考一切。传统AI就像是把每个数字都写成 32 位小数。而DeepSeek 说:「如果我们只使用8位小数呢?」结果,它仍然足够准确!瞬间,所需内存就减少了75%。

4/ 然后是他们的「多标记」系统。普通人工智能的阅读方式就像一年级学生一样:「鹅......鹅......鹅......曲......项......向......天......歌」,逐字阅读。但DeepSeek一次读完整段话。速度快2倍,准确率高90%,当你处理数十亿个单词时,这一点很重要。

5/ 但真正聪明的是:他们建立了一个「专家系统」,而没有使用一个试图了解一切的大型人工智能(比如让一个人同时成为医生、律师、工程师、木匠),只在需要时才激活特定专家,节省了大量参数。

6/ 而传统模型呢?所有1.8万亿参数始终处于活动状态。与此同时,DeepSeek总共6710亿个参数,一次只激活370亿。这就像拥有一支庞大的团队,但只召集每个任务真正需要的专家。

7/ 结果令人震惊,训练成本:数亿美元 → 500万美元;所需GPU:100000 → 2000 ; API 成本:便宜 95%;可以在普通游戏显卡上运行,而不是数据中心硬件。

8/ 最疯狂的部分——DeepSeek是开源的(完全免费)。任何人都可以使用,代码是公开的。技术论文解释了一切,这不是魔术,只是令人难以置信的巧妙工程。现在x最流行的一个梗,Open AI → Closed AI(闭源AI),取而代之的是DeepSeek,才是真正的Open AI (开源AI)。

9/ 为什么DeepSeek很重要?因为它打破了「只有大型科技公司才能涉足人工智能」的神话。你不再需要价值数十亿美元的数据中心,几个好的游戏显卡,就可以做到这一点。

10/ 对英伟达来说,这很可怕。他们的整个商业模式都建立在利润率高达90%的昂贵显卡的基础上,比如售价高达三四万美元的H100,奇货可居,有钱都买不到。如果每个人都能突然用普通的游戏显卡做AI……那么,你就知道问题所在了。

11/ 关键在于:DeepSeek 的团队不到200人,但Meta的团队仅薪酬就超过了DeepSeek 的整个训练预算……而Meta的模型却不如DeepSeek。

12/ 这是一个经典的颠覆故事:既有者优化现有流程,而颠覆者重新思考根本方法。

13/ DeepSeek就像一次地震,余震太大:人工智能开发变得更加容易,竞争加剧,大型科技公司的「护城河」看起来更像水沟,硬件要求(和成本)大幅下降

14/ 当然,OpenAI 等巨头不会坐以待毙。但一切都要颠覆,再也不是大力出奇迹的模式了。

DeepSeek这只黑天鹅,煽动翅膀,整个硅谷都会被波及,效应可以总结为以下几点。

AI初创企业危机:Deep Seek的高性能可能导致大量购买英伟达显卡的AI初创企业破产,释放大量二手GPU。对Scale AI的CEO兼创始人Alexandr Wang来说,这是攸关生死的存亡之争,口出恶言,也可以理解。

数据中心业务受挫:大型数据中心运营商,其租用英伟达显卡的商业模式将受到冲击。

科技巨头减缓采购:科技巨头们可能因库存积压,减少对英伟达显卡的采购。

英伟达前景堪忧:上述因素叠加,可能导致英伟达的业务全面下滑。

X上,有一个金融大V说了一句:deepseek better not be the real deal...(deepseek 最好不是真的......)然后配了一张让人不寒而栗的图。

网友分享在meiguo.com上的图片

75年高点:图表显示,美国股市位于75年来的最高点。

Magnificent 7:这个词指的是目前美国股市中表现最好的七家科技巨头公司,它们在很大程度上推动了美国股市的上涨。

两次泡沫:分别是上世纪60年代的Nifty 50泡沫和90年代的互联网泡沫。这两次泡沫都导致了股市崩盘,这一次,deepseek来了...美股会崩吗?

网友分享在meiguo.com上的图片

最后,我们在看一看,Deep Seek团队刚在康奈尔发表的论文,其中每一个作者都值得我们铭记,大部分都是30岁以下的年轻人,来自国内的顶尖大学,有的还在读博士,其中,无人具有海外的学术背景。这再次表明中国在大学教育质量上已经赶上美国,并且未来几十年中国在STEM毕业生方面将占据绝对的数量优势。

正如DeepSeek创始人梁文锋所说:我们的价值在于团队,通过这个过程不断成长和积累专业知识。建立一个能够持续创新的团队,才是我们真正的护城河。

出处:见配图右下角

meiguo.com 发布人签名/座右铭这家伙浪费了“黄金广告位”,啥也没签!
大家都在看
楼主新近贴
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

12   2025-01-27 13:16:59  回复

回复/评论:黑天鹅“DeepSeek”降临硅谷

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 马斯克声称川普在“爱泼斯坦名单”,白宫回应:局面令人遗憾!
  2. 盖茨列出了10项改变世界的技术名单
  3. 川普总统:加拿大可以免费加入“金穹”导弹防御系统
  4. 美国企业在强化回归办公室的工作要求
  5. 英国2岁男童竟然刷新了门萨俱乐部“最年轻男性”会员纪录
  6. QQ等级256级用户诞生,首次解锁“时光企鹅”图标!
  7. 美国对华为“HarmonyOS”采取行动,引发科技领域的新争议!
  8. 世界瞩目的电话,十个不寻常的细节剖析!
  9. 出乎全世界意料,中美两国的“2025日内瓦谈判”太亲密了吧?
  10. 美国暂停了学生签证预约,申请者在社交媒体平台的活动须谨慎!
  11. 属于中国的世纪可能已经到来
  12. 美国政府“管不着”加州?纽森州长说继续做中国生意!
  13. 鲁比奥声称将会收紧中国留学生的签证审批政策
  14. 互联网女皇“340页AI报告”猛料刷屏
  15. 川普和马斯克的公开交锋升级了
  16. 判刑15年!发币ICO的定性为诈骗
  17. 金星地壳似乎剧烈变化了,NASA即将启动新任务探索求证!
  18. 中美贸易战的谈判再起,稀土贸易成为焦点
  19. 嘴唇经常干裂起皮,或许并非缺水!
  20. 能熟练运用AI也不行?硅谷的40万人在近期被炒鱿鱼
  21. 中美两国元首针对当下双边关系和经贸合作,☎️通话交流!
  22. 中美通话的内容简短,但意味深长!
  23. 美国“非法移民家庭”遣返行动引发了“婴幼儿无国籍”的危机
  24. 川普家族“哈佛风波”和签证政策的突变
  25. 任天堂的Switch 2正式发售,参数细节全曝光!
  26. 旅居海外十几年,母亲是心头之痛!
  27. 川普政府的关税政策或将加速中国崛起,助力中国成为全球的经济主导力量!
  28. 在美国,千万别做的这些事盘点!
  29. 韦伯望远镜(JWST)发布迄今为止最大的早期宇宙地图
  30. “蜗居”纽约的中国穷人:男女同住,毫无私隐… 却坚持不肯回国
  31. 美国联邦调查局警示:“新型医疗保险”骗局泛滥
  32. 马斯克的“130天政府生涯”终结后…
  33. 手机充电习惯是影响电池寿命的根本原因
  34. 美国房价仍然高位,“美国梦”成奢望!
  35. 中美各自取消91%关税!为防🇺🇸川普政府反悔,🇨🇳重申关键问题!
  36. 全球AI人才的争夺战白热化,顶尖研究员成为了科技巨头争夺焦点

美国动态 美果搜索

Your IP: 216.73.216.159, 2025-07-01 16:09:14

Processed in 0.07976 second(s)

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息