收藏文章 楼主
ChatGPT的这波更新,让人不敢上网了?
网友【AI来了】 2025-04-18 12:46:15 分享在【时代发展的印记】版块    1    6

兄弟们,完犊子了…… OpenAI 昨天凌晨放出 2 个新模型,一个 o3,一个 o4-mini。

主要就是有了Thinking with images 图像思考能力。就是说,它们可以把图像整合到思维链中,作为推理的一部分。

听起来咋咋呼呼的,实际如何?

世超把一张 3 年前的照片发给 o3。

结果它只用了 7 分钟,就分析出

我是在哪个城市哪个园区甚至哪条河旁边拍摄的。。。

不儿,你这开盒能力也太猛了。

网友分享在meiguo.com上的图片

你可能好奇,就这些清一色的瓦房,它凭啥猜到?

看完思考过程,世超只能说,它真把观察、搜索、推理、验证发挥到了极致。

首先,o3 通过屋脊上的现代天窗,岸边的铁链护栏,还有屋檐下的“隐藏式线条灯”,猜出这是一个近些年才规划的新晋景区或特色小镇,并非乌镇周庄那些老牌水乡。

网友分享在meiguo.com上的图片

接下来,是突破口。

照片中有一处招牌,o3 不断放大发现了文字“ lestay 仓乾居 ”

它通过搜索发现,这是浙江某集团推出的民宿子品牌,接着它居然又跑到集团官网,通过介绍找到了这家酒店的位置:杭州未来科技城梦想小镇核心位置,南临余杭塘河。

网友分享在meiguo.com上的图片

到这里,o3 并不认为就完全实锤是在杭州拍的,它还要进行验证。

或者说,它想继续秀肌肉。

因为照片里有积雪,而照片文件名又包含“ 2022-02-17 ”,于是 o3 结合着日期和天气查询了一下,发现 3 年前的那天杭州确实下了大雪

最后,它又点开了各种官方报道和游记分享,发现梦想小镇的整体规划风格,也是和照片是一致的

网友分享在meiguo.com上的图片

至此,招牌、地形、建筑风格、拍摄日的天气全部吻合, 最终 o3 推导完毕,把地点锁定在了余杭区梦想小镇。

网友分享在meiguo.com上的图片

嚯,一开始我还嫌 o3 思考时间太久,怀疑它的水平,但看完推理过程,我开始觉得 7 分钟太快了——

真就是福尔摩斯和列文虎克结合体,不断地放大图片,查看细节,再结合着搜索,一步步推导,验证拍摄地点。

也许有差友会说,这也不难吧,把招牌放网上一搜不就好了。

好,那我们再来看看这张。

这次照片里没有任何文字了,能提供信息的似乎也只有眼前的植物、远处的风车和山脉。

网友分享在meiguo.com上的图片

但仅仅思考了 1 分 39 秒,o3 很“自信”地给出了正确答案——贵州的乌蒙大草原。

这又是怎么猜出来的?

对普通人来说,这张照片看起来没有任何特征,但对 o3 来说,处处是玄机。

首先,视野宽阔,地面是高山草甸而非农田,o3 判断拍摄地属于高海拔,是高原草场

其次近处的植物是矮杜鹃,远处还有一些大风车

同时存在“ 矮杜鹃、大风车、高原草场 ”这些特征,o3 判断这是乌蒙大草原的独有组合,

国内其他几个赏花地点都没有的,所以很自信给出了答案。

网友分享在meiguo.com上的图片

是不是有点意思了?

别急,还有。

这是一张 1996 年冬天我父母在上海拍摄的照片,我让 o3 推测出拍摄日期。

o3 看到照片里有东方明珠塔,但是旁边却没有金茂大厦、环球金融中心。

所以时间一定是在东方明珠塔建成后,金茂大厦建成之前。

于是它搜索了这些建筑竣工时间,再结合我父母的穿着,成功把时间圈在了 1995 年~1998年冬天或初春。

网友分享在meiguo.com上的图片

当然,o3 的图片推理能力,并非只能用来推测照片拍摄地和时间。

世超发送了一张同事照片和一张古早的大合照,虽然头发掉了不少,但 o3 还是成功在人群锁定了他。

网友分享在meiguo.com上的图片

接着我又发了一张汽车仪表盘照片。

很快噢,o3 一眼判断出这种典型设计是出现在斯巴鲁上,它甚至还告诉你,这款车型国内通俗称为力狮/傲虎,这辆车还配备了 SI-Drive系统。

这,可能只有真正的老司机才能做到吧?

网友分享在meiguo.com上的图片

网友分享在meiguo.com上的图片

后来,世超又跑到博物杂志的微博,找到一张网友@博物杂志的鸟类照片。

结果,o3 也能判断出这是红头长尾山雀。

网友分享在meiguo.com上的图片

看到这,你心里可能会想:这下好了,别说普通人了,连博物杂志这种博学多识的人都要被 AI 替代了。

别慌。

经过我们大量测试,o3 也并非百战百胜,恰恰相反,它翻车的次数其实非常多。

比如我这张在平潭拍摄的照片,它猜成了厦门,位置差了足足几百公里。

网友分享在meiguo.com上的图片

还有这张广东韶关站的照片,o3一看到有喀斯特地貌,直接锁定了广西和贵州,最后猜成了广西恭城。

网友分享在meiguo.com上的图片

哥们给他发了一个 Mac App 的截图,它也报成了另外一款 UI 近似的软件。

甚至这个背带裤和篮球的组合这么明显,它也能没找出答案。

网友分享在meiguo.com上的图片

总之呢,这个 o3 啊,它确实比以往的AI 都强,但也还有一定的进步空间。

世超也去官网研究了一下资料,我发现这次 o3 能力大升级的背后,核心是“ 强化学习 ”这四个字。

OpenAI 发现和算力越大,AI性能越强的行业黄金法则一样,在强化学习中,给模型的思考时间越长,模型的能力也会越逆天。

按照这路子,他们直接让 AI 学会了咋用工具、并且推理啥时候该用什么工具。

所以这才有了 o3 不断放大图片,以像素级精度查看图片的每个角落,观察到普通人往往忽略的细节,再把所有获取到的信息放在网络上搜索——

足够多的信息量,足够长的时间,配合着足够强大的推理能力,就爆发出了这种恐怖如斯的效果。

虽然 o3 的出现,把 AI 进程又往前狠狠推动了一大步,但说实话世超也有点担心:

在 AI 能读懂照片的时代,我们的个人信息是不是更不好保护了?

出处:头条号 @差评X.PIN

meiguo.com 发布人签名/座右铭这家伙浪费了“黄金广告位”,啥也没签!
大家都在看
楼主新近贴
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

6   2025-04-18 12:46:15  回复

回复/评论:ChatGPT的这波更新,让人不敢上网了?

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 联邦法院驳回了川普政府的“出生公民权”行政令
  2. AWS最大区域故障,带崩多项服务!
  3. 全球高等教育的新趋势:留学生求学地“多元化”
  4. 川普政府“双失利”?
  5. 母亲给大一女儿恋爱八项要求
  6. 马斯克成为全球首位身家5000亿美元的富豪
  7. 美国青少年“67”流行语的现象引关注
  8. 马斯克的模块化生产技术在革新汽车行业
  9. 联合国大会“史上最尴尬”一幕:他上台后,观众纷纷撤离!
  10. 川普政府打算发放两千美元的关税补贴
  11. 川普政策变动,竟然催生了智利的生育旅游热潮?
  12. 川普总统签署了备忘录,贩毒集团成为“国家之敌”!
  13. 美国“H-1B”签证新规:在境内的申请人,免缴10万美元费用!
  14. 45岁后“人生黄金期”是认知和创造力的新高峰
  15. Zillow和Redfin“摊上大事儿”!五大州的总检察长起诉了房产平台合谋做局
  16. 中美贸易的争端升级,中国实施“长臂管辖”颁布3项针对性措施!
  17. 美国司法部起诉了柬埔寨“电信诈骗集团”的头目
  18. 700万人参与了反川普集会?
  19. 福建舰“电磁弹射系统技术”获全球关注
  20. 中美航班“绕行俄罗斯领空”政策引关注
  21. 中美因为“稀土管制”引发的贸易摩擦升级了
  22. 美股市值突破“全球GDP半数”大关
  23. 骨胶水的研发获突破,临床试验显示了安全有效!
  24. 中美稀土博弈,美国政策在急转直下!
  25. 佛罗里达的一名中学生在AI提问,然后被捕了!
  26. TikTok美国业务的“合规运营”方案细节披露
  27. 美国“风行者”超大运输机计划曝光
  28. 马斯克的净资产创纪录,突破5000亿美元!
  29. 美国的房地产市场显现了矛盾信号
  30. 我的人生有三个账户!伊隆·马斯克在斯坦福大学的最新演讲
  31. 川普总统宣布加沙战争结束,峰会聚焦“中东和平”!
  32. 谷歌的科学家已经连续两年摘得了诺贝尔奖
  33. 大学排名更新:顶尖学府稳固,新兴学校快速上升
  34. 华人购房遭遇国籍歧视,法院裁决后依然隐忧犹存!
  35. 川普总统在联合国演讲,声称中国不愿用风力发电?
  36. 在美国买房半年后,总结了两个扎心感受!

美国动态 美果搜索

Your IP: 216.73.216.0, 2025-11-04 16:37:37

Processed in 0.09749 second(s)

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
已有0次打赏
(6) 分享
分享
取消