收藏文章 楼主
黑天鹅“DeepSeek”降临硅谷
网友【AI来了】 2025-01-27 13:16:59 分享在【时代发展的印记】版块    1    12

这是一个信息爆炸的时代,也是一个信息严重污染的时代。所以,我对任何信息都不会轻信,尤其是面对重大利好,更加「存疑」。对我来说,排除信息污染的最好办法,就是交叉对比,正反面都看。

过去48小时内,我几乎都泡在X上,浏览各种关于Deep Seek的消息,在英语世界,基本上是压倒性正面评价,这时候,我就特别想看看负面的评论,找了一圈,的确有。

主要分为两类:

一类,为了反而反,尤其是一些海外的反中人士,任何关于中国的新闻,他们都会给出负面的评价,这类信息简直就是垃圾。但看看也好,至少可以知道垃圾是什么样子。

网友分享在meiguo.com上的图片

另一类,是业内人士的负面评价,其中第一个,也是最鹰派的声音,居然来自一个华裔业内人士——Alexandr Wang。

首先,此人的名字有点奇怪,第一次看到,我以为是CNBC拼错了,一般情况下,Alexander是英语中最常见的拼写形式,也是国际通用的版本。而Alexandr,则是某些东欧语言(如俄语、捷克语等)的拼写形式。一个美国华裔,居然用东欧的名字,有点蹊跷。但我定睛一看,确实是Alexandr。

其次,这位王先生,不仅名字奇怪,更有着与众不同的背景。他出生于1997年,是Scale AI的创始人兼CEO。24岁时,Alexandr Wang成为了世界上最年轻的「白手起家」的亿万富翁。根据福布斯的说法,截至2024年7月,他的身价为20亿美元。

他是中国移民的儿子,父母都在洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)担任物理学家,核武器就诞生在这个实验室。中国人能在这种单位工作,非常罕见。

Alexandr 从小就对数学和计算机编程充满热情。他在2013年获得了美国队的数学奥林匹克资格。在十几岁时,他就在美版知乎Quora担任软件程序员。随后,他在麻省理工学院学习计算机科学,但中途退学,创办了Scale AI,成了硅谷的AI神童。

Alexandr说:Deep Seek至少有5万张英伟达H100显卡,只不过因为制裁的原因,不方便说而已。事后,我看了好几遍CNBC电视台的采访,他的原话是as my understanding,也就是「按照我的理解」,而没有任何实锤的证据。

根据Deep Seek的说法,训练模型只用了2048张H800显卡,也就是H100的阉割版,价格也只有H100(3万美刀)的三分之一。正因为用了低配的硬件,才体现了Deep Seek的创新价值。

网友分享在meiguo.com上的图片

而Alexandr Wang暗示了,Deep Seek只不过也是大力出奇迹而已,根本没有什么创新。

那么5万张H100显卡意味着什么呢?

今年,马斯克用全球最大AI超算Colossus轰动了整个世界,这台超算也只配备了10万张英伟达H100显卡。

即便Alexandr Wang说的是真话,5万张英伟达H100显卡,总价就至少15亿美元。折合一百多亿人民币。一个小小的幻方公司,能拿出这么多钱吗?就算有,H100美国禁运,中国大陆根本没货,也很难买到。

再退一步讲,就算Deep Seek能拿出这么多钱,买5万张英伟达H100显卡,他的成本就和Open AI不相上下了,但Deep Seek是开源免费的,而Open AI要200美元一个月。

因为Deep Seek,我也是人生第一次,学会了用API。我用中国手机开了一个账户,就送10元人民币,我用Deep Seek API翻译文本,百万输入 tokens才2元,用了一个晚上,才花了0.11元。这已经不能算白菜价了,几乎就是免费!从售价倒推成本,Deep Seek也不可能拥有5万张H100显卡。

总之,无论从哪个角度看,Alexandr Wang的论点都站不住脚,但他的说法,依然有价值。

一方面,证明了Deep Seek的技术真的牛叉,已经牛到要用5万张H100显卡才能训练。

另一方面,说明Deep Seek的影响力太大,以至于Alexandr Wang有点慌了,口不择言。

网友分享在meiguo.com上的图片

那么,为啥Alexandr Wang要慌呢?

我不是什么AI专家,但根据我这几天索阅读的大量信息理解,Deep Seek可能是一只巨型的黑天鹅,她正在硅谷的上空游荡。

1/ 目前,训练顶级AI大模型的成本极其高昂。OpenAI等巨头,需要拥有数万个H100显卡的大型数据中心。每块最低3万美元,总价就要十几亿美元,而且耗电量惊人,需要一整座发电厂提供电力。他们仅在训练模型上,就要花费数亿美元。

2/ Deep Seek突然出现并说:「哈哈,如果我们花 500 万美元做这件事会怎么样?」他们不只是说说而已,而是真的做到了。Deep Seek的模型在许多任务上,甚至击败了 GPT-4 和 Claude。硅谷的人工智能世界,瞬间就懵了,AI天才Alexandr Wang语无伦次了。

3/ DeepSeek怎么做到的?他们从头开始重新思考一切。传统AI就像是把每个数字都写成 32 位小数。而DeepSeek 说:「如果我们只使用8位小数呢?」结果,它仍然足够准确!瞬间,所需内存就减少了75%。

4/ 然后是他们的「多标记」系统。普通人工智能的阅读方式就像一年级学生一样:「鹅......鹅......鹅......曲......项......向......天......歌」,逐字阅读。但DeepSeek一次读完整段话。速度快2倍,准确率高90%,当你处理数十亿个单词时,这一点很重要。

5/ 但真正聪明的是:他们建立了一个「专家系统」,而没有使用一个试图了解一切的大型人工智能(比如让一个人同时成为医生、律师、工程师、木匠),只在需要时才激活特定专家,节省了大量参数。

6/ 而传统模型呢?所有1.8万亿参数始终处于活动状态。与此同时,DeepSeek总共6710亿个参数,一次只激活370亿。这就像拥有一支庞大的团队,但只召集每个任务真正需要的专家。

7/ 结果令人震惊,训练成本:数亿美元 → 500万美元;所需GPU:100000 → 2000 ; API 成本:便宜 95%;可以在普通游戏显卡上运行,而不是数据中心硬件。

8/ 最疯狂的部分——DeepSeek是开源的(完全免费)。任何人都可以使用,代码是公开的。技术论文解释了一切,这不是魔术,只是令人难以置信的巧妙工程。现在x最流行的一个梗,Open AI → Closed AI(闭源AI),取而代之的是DeepSeek,才是真正的Open AI (开源AI)。

9/ 为什么DeepSeek很重要?因为它打破了「只有大型科技公司才能涉足人工智能」的神话。你不再需要价值数十亿美元的数据中心,几个好的游戏显卡,就可以做到这一点。

10/ 对英伟达来说,这很可怕。他们的整个商业模式都建立在利润率高达90%的昂贵显卡的基础上,比如售价高达三四万美元的H100,奇货可居,有钱都买不到。如果每个人都能突然用普通的游戏显卡做AI……那么,你就知道问题所在了。

11/ 关键在于:DeepSeek 的团队不到200人,但Meta的团队仅薪酬就超过了DeepSeek 的整个训练预算……而Meta的模型却不如DeepSeek。

12/ 这是一个经典的颠覆故事:既有者优化现有流程,而颠覆者重新思考根本方法。

13/ DeepSeek就像一次地震,余震太大:人工智能开发变得更加容易,竞争加剧,大型科技公司的「护城河」看起来更像水沟,硬件要求(和成本)大幅下降

14/ 当然,OpenAI 等巨头不会坐以待毙。但一切都要颠覆,再也不是大力出奇迹的模式了。

DeepSeek这只黑天鹅,煽动翅膀,整个硅谷都会被波及,效应可以总结为以下几点。

AI初创企业危机:Deep Seek的高性能可能导致大量购买英伟达显卡的AI初创企业破产,释放大量二手GPU。对Scale AI的CEO兼创始人Alexandr Wang来说,这是攸关生死的存亡之争,口出恶言,也可以理解。

数据中心业务受挫:大型数据中心运营商,其租用英伟达显卡的商业模式将受到冲击。

科技巨头减缓采购:科技巨头们可能因库存积压,减少对英伟达显卡的采购。

英伟达前景堪忧:上述因素叠加,可能导致英伟达的业务全面下滑。

X上,有一个金融大V说了一句:deepseek better not be the real deal...(deepseek 最好不是真的......)然后配了一张让人不寒而栗的图。

网友分享在meiguo.com上的图片

75年高点:图表显示,美国股市位于75年来的最高点。

Magnificent 7:这个词指的是目前美国股市中表现最好的七家科技巨头公司,它们在很大程度上推动了美国股市的上涨。

两次泡沫:分别是上世纪60年代的Nifty 50泡沫和90年代的互联网泡沫。这两次泡沫都导致了股市崩盘,这一次,deepseek来了...美股会崩吗?

网友分享在meiguo.com上的图片

最后,我们在看一看,Deep Seek团队刚在康奈尔发表的论文,其中每一个作者都值得我们铭记,大部分都是30岁以下的年轻人,来自国内的顶尖大学,有的还在读博士,其中,无人具有海外的学术背景。这再次表明中国在大学教育质量上已经赶上美国,并且未来几十年中国在STEM毕业生方面将占据绝对的数量优势。

正如DeepSeek创始人梁文锋所说:我们的价值在于团队,通过这个过程不断成长和积累专业知识。建立一个能够持续创新的团队,才是我们真正的护城河。

出处:见配图右下角

meiguo.com 发布人签名/座右铭这家伙浪费了“黄金广告位”,啥也没签!
大家都在看
楼主新近贴
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

12   2025-01-27 13:16:59  回复

回复/评论:黑天鹅“DeepSeek”降临硅谷

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 美国年轻人的“中国观”悄然转变
  2. 2025年度的美国公立高中排名发布,咱只关注前三!
  3. 华人科学家身陷“杀猪盘”,短短数月就被掏光250万美元积蓄!
  4. 白宫开通了TikTok 账号,传播政策信息!
  5. 苹果投资了6000亿美元,加速“美国制造”计划!
  6. 为激励员工,OpenAI打算豪掷96亿美元!
  7. 选择西雅图、圣地亚哥还是洛杉矶?全面对比“三城生活”
  8. 马斯克“xAI”起诉前工程师“泄露机密”
  9. ICE抓捕的非法移民中,中国人数量激增?
  10. 加州州长竟然模仿川普总统的风格发帖,粉丝数和支持率“都涨了”!
  11. 房子属于你,但你得付费受他们管着!关于美国HOA
  12. 先交押金!美国重启了“签证保证金”试点计划
  13. 蔡文胜的2025大动作之五,香港投资版图在持续扩张!
  14. 疯狂打压华人精英,勒令华人CEO辞职… 川普政府的致命错误?
  15. 持中国大陆护照在申请美国签证的注意事项更新(2025年8月版本)
  16. 不输常春藤!盘点学费低、薪资高的25所美国公立大学
  17. 中国留学生在入境美国时遭遇盘查,中方大使馆发布安全提醒!
  18. 川普总统的态度突变,暗示乌克兰应该反击俄罗斯本土?
  19. 香港永居 vs 美国国籍:身份选择背后的生活考量
  20. 休斯顿机场“小黑屋内的铝箔纸”:中国留学生遭遇遣返的36小时煎熬
  21. 川普总统“访华表态”继续反复
  22. 川普政府的对华政策突然改变了?
  23. 华人留学生“索赔1亿美元控诉”大学期间的农药伤害
  24. 中国🇨🇳开始质疑英伟达芯片“存后门”
  25. 川普家族竟然靠它狂揽45亿美金!操盘手是赵长鹏?
  26. YouTube“反诈频道”助力警方,破获6500万美元诈骗案!
  27. 敌友即友?马斯克和扎克伯格开始接触,图谋合伙收购OpenAI?
  28. 相差3米!星舰试飞“精准溅落”展现技术突破
  29. 中国留学生在入境美国时遭遇驱逐,禁止五年内再入境!
  30. SpaceX的星舰“第十次试飞”成功了
  31. 全美房地产市场在趋向中性,区域分化明显!
  32. 工作日没空?周末集中运动同样有益健康!
  33. 麻省理工学院发布AI学习平台“MIT Learn”
  34. 植物油更健康?动物油脂摄入或将加速肿瘤生长
  35. 美国华裔二代坦言:中国发展现状,让父辈移民后悔了!
  36. 美国“真放宽”了对中国留学生的入境政策?

美国动态 美果搜索

Your IP: 216.73.216.105, 2025-09-09 12:45:47

Processed in 0.28513 second(s)

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
已有0次打赏
(12) 分享
分享
取消