收藏文章 楼主
黑天鹅“DeepSeek”降临硅谷
网友【AI来了】 2025-01-27 13:16:59 分享在【时代发展的印记】版块    1    10

这是一个信息爆炸的时代,也是一个信息严重污染的时代。所以,我对任何信息都不会轻信,尤其是面对重大利好,更加「存疑」。对我来说,排除信息污染的最好办法,就是交叉对比,正反面都看。

过去48小时内,我几乎都泡在X上,浏览各种关于Deep Seek的消息,在英语世界,基本上是压倒性正面评价,这时候,我就特别想看看负面的评论,找了一圈,的确有。

主要分为两类:

一类,为了反而反,尤其是一些海外的反中人士,任何关于中国的新闻,他们都会给出负面的评价,这类信息简直就是垃圾。但看看也好,至少可以知道垃圾是什么样子。

网友分享在meiguo.com上的图片

另一类,是业内人士的负面评价,其中第一个,也是最鹰派的声音,居然来自一个华裔业内人士——Alexandr Wang。

首先,此人的名字有点奇怪,第一次看到,我以为是CNBC拼错了,一般情况下,Alexander是英语中最常见的拼写形式,也是国际通用的版本。而Alexandr,则是某些东欧语言(如俄语、捷克语等)的拼写形式。一个美国华裔,居然用东欧的名字,有点蹊跷。但我定睛一看,确实是Alexandr。

其次,这位王先生,不仅名字奇怪,更有着与众不同的背景。他出生于1997年,是Scale AI的创始人兼CEO。24岁时,Alexandr Wang成为了世界上最年轻的「白手起家」的亿万富翁。根据福布斯的说法,截至2024年7月,他的身价为20亿美元。

他是中国移民的儿子,父母都在洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)担任物理学家,核武器就诞生在这个实验室。中国人能在这种单位工作,非常罕见。

Alexandr 从小就对数学和计算机编程充满热情。他在2013年获得了美国队的数学奥林匹克资格。在十几岁时,他就在美版知乎Quora担任软件程序员。随后,他在麻省理工学院学习计算机科学,但中途退学,创办了Scale AI,成了硅谷的AI神童。

Alexandr说:Deep Seek至少有5万张英伟达H100显卡,只不过因为制裁的原因,不方便说而已。事后,我看了好几遍CNBC电视台的采访,他的原话是as my understanding,也就是「按照我的理解」,而没有任何实锤的证据。

根据Deep Seek的说法,训练模型只用了2048张H800显卡,也就是H100的阉割版,价格也只有H100(3万美刀)的三分之一。正因为用了低配的硬件,才体现了Deep Seek的创新价值。

网友分享在meiguo.com上的图片

而Alexandr Wang暗示了,Deep Seek只不过也是大力出奇迹而已,根本没有什么创新。

那么5万张H100显卡意味着什么呢?

今年,马斯克用全球最大AI超算Colossus轰动了整个世界,这台超算也只配备了10万张英伟达H100显卡。

即便Alexandr Wang说的是真话,5万张英伟达H100显卡,总价就至少15亿美元。折合一百多亿人民币。一个小小的幻方公司,能拿出这么多钱吗?就算有,H100美国禁运,中国大陆根本没货,也很难买到。

再退一步讲,就算Deep Seek能拿出这么多钱,买5万张英伟达H100显卡,他的成本就和Open AI不相上下了,但Deep Seek是开源免费的,而Open AI要200美元一个月。

因为Deep Seek,我也是人生第一次,学会了用API。我用中国手机开了一个账户,就送10元人民币,我用Deep Seek API翻译文本,百万输入 tokens才2元,用了一个晚上,才花了0.11元。这已经不能算白菜价了,几乎就是免费!从售价倒推成本,Deep Seek也不可能拥有5万张H100显卡。

总之,无论从哪个角度看,Alexandr Wang的论点都站不住脚,但他的说法,依然有价值。

一方面,证明了Deep Seek的技术真的牛叉,已经牛到要用5万张H100显卡才能训练。

另一方面,说明Deep Seek的影响力太大,以至于Alexandr Wang有点慌了,口不择言。

网友分享在meiguo.com上的图片

那么,为啥Alexandr Wang要慌呢?

我不是什么AI专家,但根据我这几天索阅读的大量信息理解,Deep Seek可能是一只巨型的黑天鹅,她正在硅谷的上空游荡。

1/ 目前,训练顶级AI大模型的成本极其高昂。OpenAI等巨头,需要拥有数万个H100显卡的大型数据中心。每块最低3万美元,总价就要十几亿美元,而且耗电量惊人,需要一整座发电厂提供电力。他们仅在训练模型上,就要花费数亿美元。

2/ Deep Seek突然出现并说:「哈哈,如果我们花 500 万美元做这件事会怎么样?」他们不只是说说而已,而是真的做到了。Deep Seek的模型在许多任务上,甚至击败了 GPT-4 和 Claude。硅谷的人工智能世界,瞬间就懵了,AI天才Alexandr Wang语无伦次了。

3/ DeepSeek怎么做到的?他们从头开始重新思考一切。传统AI就像是把每个数字都写成 32 位小数。而DeepSeek 说:「如果我们只使用8位小数呢?」结果,它仍然足够准确!瞬间,所需内存就减少了75%。

4/ 然后是他们的「多标记」系统。普通人工智能的阅读方式就像一年级学生一样:「鹅......鹅......鹅......曲......项......向......天......歌」,逐字阅读。但DeepSeek一次读完整段话。速度快2倍,准确率高90%,当你处理数十亿个单词时,这一点很重要。

5/ 但真正聪明的是:他们建立了一个「专家系统」,而没有使用一个试图了解一切的大型人工智能(比如让一个人同时成为医生、律师、工程师、木匠),只在需要时才激活特定专家,节省了大量参数。

6/ 而传统模型呢?所有1.8万亿参数始终处于活动状态。与此同时,DeepSeek总共6710亿个参数,一次只激活370亿。这就像拥有一支庞大的团队,但只召集每个任务真正需要的专家。

7/ 结果令人震惊,训练成本:数亿美元 → 500万美元;所需GPU:100000 → 2000 ; API 成本:便宜 95%;可以在普通游戏显卡上运行,而不是数据中心硬件。

8/ 最疯狂的部分——DeepSeek是开源的(完全免费)。任何人都可以使用,代码是公开的。技术论文解释了一切,这不是魔术,只是令人难以置信的巧妙工程。现在x最流行的一个梗,Open AI → Closed AI(闭源AI),取而代之的是DeepSeek,才是真正的Open AI (开源AI)。

9/ 为什么DeepSeek很重要?因为它打破了「只有大型科技公司才能涉足人工智能」的神话。你不再需要价值数十亿美元的数据中心,几个好的游戏显卡,就可以做到这一点。

10/ 对英伟达来说,这很可怕。他们的整个商业模式都建立在利润率高达90%的昂贵显卡的基础上,比如售价高达三四万美元的H100,奇货可居,有钱都买不到。如果每个人都能突然用普通的游戏显卡做AI……那么,你就知道问题所在了。

11/ 关键在于:DeepSeek 的团队不到200人,但Meta的团队仅薪酬就超过了DeepSeek 的整个训练预算……而Meta的模型却不如DeepSeek。

12/ 这是一个经典的颠覆故事:既有者优化现有流程,而颠覆者重新思考根本方法。

13/ DeepSeek就像一次地震,余震太大:人工智能开发变得更加容易,竞争加剧,大型科技公司的「护城河」看起来更像水沟,硬件要求(和成本)大幅下降

14/ 当然,OpenAI 等巨头不会坐以待毙。但一切都要颠覆,再也不是大力出奇迹的模式了。

DeepSeek这只黑天鹅,煽动翅膀,整个硅谷都会被波及,效应可以总结为以下几点。

AI初创企业危机:Deep Seek的高性能可能导致大量购买英伟达显卡的AI初创企业破产,释放大量二手GPU。对Scale AI的CEO兼创始人Alexandr Wang来说,这是攸关生死的存亡之争,口出恶言,也可以理解。

数据中心业务受挫:大型数据中心运营商,其租用英伟达显卡的商业模式将受到冲击。

科技巨头减缓采购:科技巨头们可能因库存积压,减少对英伟达显卡的采购。

英伟达前景堪忧:上述因素叠加,可能导致英伟达的业务全面下滑。

X上,有一个金融大V说了一句:deepseek better not be the real deal...(deepseek 最好不是真的......)然后配了一张让人不寒而栗的图。

网友分享在meiguo.com上的图片

75年高点:图表显示,美国股市位于75年来的最高点。

Magnificent 7:这个词指的是目前美国股市中表现最好的七家科技巨头公司,它们在很大程度上推动了美国股市的上涨。

两次泡沫:分别是上世纪60年代的Nifty 50泡沫和90年代的互联网泡沫。这两次泡沫都导致了股市崩盘,这一次,deepseek来了...美股会崩吗?

网友分享在meiguo.com上的图片

最后,我们在看一看,Deep Seek团队刚在康奈尔发表的论文,其中每一个作者都值得我们铭记,大部分都是30岁以下的年轻人,来自国内的顶尖大学,有的还在读博士,其中,无人具有海外的学术背景。这再次表明中国在大学教育质量上已经赶上美国,并且未来几十年中国在STEM毕业生方面将占据绝对的数量优势。

正如DeepSeek创始人梁文锋所说:我们的价值在于团队,通过这个过程不断成长和积累专业知识。建立一个能够持续创新的团队,才是我们真正的护城河。

出处:见配图右下角

meiguo.com 发布人签名/座右铭这家伙浪费了“黄金广告位”,啥也没签!
大家都在看
楼主新近贴
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

10   2025-01-27 13:16:59  回复

回复/评论:黑天鹅“DeepSeek”降临硅谷

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 福布斯曝光了Deepseek 梁文锋的净资产
  2. 大S【徐熙媛】病逝,享年48岁!
  3. 遭遇“断粮”的BBC叛变了?
  4. 在美国买房,看Open House时需要注意的问题汇总
  5. 陆地入境美国受阻,“华人偷渡客”已经改用快艇登陆了?
  6. 川普政府的“朝令夕改”最短纪录再次刷新
  7. 赴美生子的中国人在纠结剖不剖?美国人在寻思“移民鹤岗”呢!
  8. 川普总统竟然帮马斯克“带娃儿加带货”,特斯拉市值保得住了?
  9. 李嘉诚在全球的港口“几乎清仓”,套现190亿美元!
  10. 北美留学生注意,美国和加拿大即将共享所有移民和签证讯息!
  11. 滞留太空的NASA宇航员即将返回地球
  12. 美国房产的保值要点,但却被九成华人买家忽视了!
  13. 23岁中国女留学生在南加州的住所内遇害,曾控诉白人男友“性虐待”!
  14. 谷歌地图和苹果地图已经都修改了美国湾(墨西哥湾)
  15. 华人害华人!涉及1500万美元的芝加哥“大型持枪绑架案”嫌疑人半数落网
  16. Google决定终止开源Android啦?
  17. 赵本山在纽约:前排票价1400美元,团队聚餐画面曝光!
  18. 王毅定调了中国统一,马英九发出了战争预警!
  19. 成也“马老板”,败也“马部长”?关于伊隆·马斯克的现状
  20. 风向有变?🇨🇳中央召开民企座谈会,寓意深刻!
  21. 泽连斯基和川普、万斯在白宫当众吵架,饭都没吃着!
  22. 全美境内,非法移民“驱逐战”打响了!
  23. 在美国生活,这四证缺一不可!
  24. 美国留学的政策大变?众多名校陷入财政危机,扩招中国学生?
  25. 美国首都机场为何全美风险最高?川普总统“怒喷航管弱智”
  26. DeepSeek已经让成人玩具“率先受益”
  27. 全面盘点:加州大学的9大分校
  28. DOGE让1.4万公务员失业?马斯克已经做好最坏心理准备!
  29. 重庆妹子“盯美国男人不放”,前后嫁给美国医生和美国律师!
  30. SpaceX在13小时内3连发,全力拯救被困宇航员!
  31. 美国“H1B签证”新一轮抽签在3月份开启,新变化真不少!
  32. 滞留美国的华裔非法移民“遭遇流放”,首批119人已起飞!
  33. 男性精液质量和预期寿命“真有关系”
  34. 《纽约时报》刊登的中国父子文章:为何送儿子留学美国
  35. 美签面签后的全面复盘:审核原因和拒签因素剖析
  36. 时至2025年3月中旬,地球上最顶尖的五大芯片品牌,均由华人掌舵!

美国动态 美果转盘 美果商店

Your IP: 3.144.47.192, 2025-04-04 05:37:05

Processed in 0.06848 second(s)

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
已有0次打赏
(10) 分享
分享
取消