收藏文章 楼主
谷歌发布Gemini 2.0,“硬刚”OpenAI
网友【AI来了】 2024-12-12 04:44:41 分享在【时代发展的印记】版块    1    2

就在 OpenAI“12 天连续轰炸”的第五天,谷歌终于坐不住了。

刚刚,谷歌正式发布了 Gemini 2.0 系列人工智能模型的首个版本,该模型名为 Gemini 2.0 Flash,提供聊天版本供全球用户使用,同时还有一个实验版的模型可供开发人员免费使用,该版本具有文本转语音和图像生成功能。

据谷歌称,这是Agent 时代迄今为止为最强大的 AI 模型,相比上一代 Gemini 模型,2.0 在速度上快两倍,并且比更大的“专业”版 Gemini 1.5 更加强大。此外,该版本带来了增强的性能、更多的多模态性和新的原生工具。

相比上一代模型,Gemini 2.0 增加了什么?

谷歌首席执行官 Sundar Pichai 在一份声明中表示:“如果 Gemini 1.0 致力于组织和理解信息,那么 Gemini 2.0 则致力于让信息变得更加有用。”

网友分享在meiguo.com上的图片

谷歌最新的大语言模型在大多数用户请求领域都比其前代产品表现更好,例如代码生成和根据用户请求提供事实正确响应的能力。

在谷歌 DeepMind CEO Demis Hassabis 和谷歌 DeepMind CTO Koray Kavukcuoglu 代表 Gemini 团队撰写的博文中,详细介绍了 Gemini 2.0 版本的具体特性。

据他们称,Gemini 2.0 Flash 以 1.5 Flash 的成功为基础,是谷歌目前最受开发者欢迎的版本,在同样快速的响应时间下具有增强的性能。值得注意的是,2.0 Flash 在关键基准测试中甚至比 1.5 Pro 更快,速度是 1.5 Pro 的两倍。2.0 Flash 还具有新功能。除了支持图像、视频和音频等多模式输入外,2.0 Flash 现在还支持多模式输出,例如与文本混合的原生生成的图像和可操纵的文本转语音 (TTS) 多语言音频。它还可以原生调用 Google 搜索、代码执行以及第三方用户定义函数等工具。

网友分享在meiguo.com上的图片

过去一个月,Gemini 团队一直在分享 Gemini 2.0 的早期实验版本,并得到了开发人员的积极反馈。

Gemini 2.0 Flash 现已作为实验模型通过 Google AI Studio 和 Vertex AI 中的 Gemini API 向开发者提供,所有开发者均可使用多模式输入和文本输出,早期合作伙伴可使用文本转语音和原生图像生成功能。

1 月份将全面上市,同时将推出更多模型尺寸。为了帮助开发人员构建动态和交互式应用程序,谷歌还发布了新的 Multimodal Live API,它具有实时音频、视频流输入以及使用多个组合工具的能力。

要访问实验版本 Flash 2.0 的聊天优化版本,Gemini 用户可以在桌面和移动网络上的模型下拉菜单中选择它。该公司表示,它将很快在 Gemini 移动应用程序上提供。

Gemini Flash 2.0 的多模版本将通过 Google 的 AI Studio 和 Vertex AI 开发者平台提供。

该公司还表示,计划在 2025 年初将 Gemini 2.0 扩展到更多谷歌产品。

推出 Deep Search 新功能

谷歌此次发布的还不仅仅是大模型。谷歌宣布将推出一项名为 Deep Research 的新功能,它使用高级推理和长上下文功能充当研究助手,探索复杂主题并代表用户编写报告。它今日起已经 Gemini Advanced 中可用。

据谷歌方面称,Search 无疑是受到人工智能影响最深远、变革最显著的产品。如今,AI Overviews 已触达 10 亿用户,该功能使用户能够提出全新的问题类型,迅速成为 Search 有史以来最受欢迎的功能之一。接下来,谷歌会将 Gemini 2.0 的高级推理能力融入 AI Overviews,以攻克更复杂的主题和多步骤问题,包括高等数学方程、多模态查询和编码。同时,谷歌还计划明年将 AI Overviews 功能面向更多国家开放,适配更多语言。

网友分享在meiguo.com上的图片

2.0 基于谷歌定制的硬件第六代 TPU Trillium 构建而成。TPU 为 Gemini 2.0 的训练和推理提供 100% 算力支持,今天 Trillium 也全面向用户开放,以便他们能够基于此进行开发。

通过 Gemini 2.0 解锁 Agent 体验

Gemini 2.0 Flash 已经进行了原生用户界面操作能力的改进,其他改进还包括多模式推理、长上下文理解、复杂指令跟踪和规划、组合函数调用、原生工具使用和改进的延迟等。

自大模型诞生以来,AI Agent 的实际应用是一个非常火爆的研究领域。谷歌正在通过一系列原型探索这一新领域,这些原型可以帮助人们完成任务并完成工作。其中包括对 Project Astra 的更新,这是谷歌的研究原型,旨在探索通用人工智能助手的未来功能;新 Project Mariner,它从浏览器开始探索人机交互的未来;以及 Jules,一个可以帮助开发人员的 AI 代码 Agent。

Gemini API 集团产品经理 Shrestha Basu Mallick 和谷歌实验室产品总监 Kathy Korevec 表示:“从今天开始(对于受信任的测试人员),你可以将 Python 和 JavaScript 编码任务转移给 Jules。Jules 可以异步工作并与你的 GitHub 工作流程集成,处理错误修复和其他耗时任务,而你则专注于你真正想要构建的内容。

谷歌也表示,即便技术持续迭代,但 Gemini 系列模型仍处于开发的早期阶段,他们很高兴看到那些值得信赖的测试人员如何使用这些新功能以及他们可以从中学到什么经验,这样就可以在未来的产品中更广泛地使用它们。

硬刚一众 AI 独角兽,谷歌更胜一筹?

Gemini 2.0 是谷歌在科技行业日益激烈的人工智能竞赛中的最新成果。谷歌正在与科技巨头微软、Meta 以及一众 AI 明星独角兽如 OpenAI、Perplexity 和 Anthropic 等初创公司展开激烈战争。

谷歌这一波出手在技术社区引发了热议,一名 Reddit 用户对 Gemini 2.0 的发布表示震惊,他评论道:

“我不知道我现在的感受是什么。兴奋、担忧、不安、好奇以及对 AI 的绝对敬畏交织在一起。超现实的是,我们正在经历这种改进,并且每次发布的迭代都给我们留下了深刻的印象。我甚至都不敢想象 10 年后的情况。看看 2004 年到 2014 年的科技各个方面都取得了巨大进展,但与这两年 AI 势头相比还有很大差距。”

有用户调侃,谷歌甚至都等不及 OpenAI 把“疯狂发布周”过完再来炸场,结合前两日 Sora 潦草发布,有不少网友直接站队谷歌:

“谷歌的 Gemini 绝对是是 GPT-5 级别的威胁,我从未见过一家公司发布如此强大的模型让开发者免费试用。”

随着新 Flash 模型的发布,这场 AI 军备竞赛已经进入白热化阶段。据谷歌公司称,Agent 模型“可以更好地了解你周围的世界,提前思考多个步骤,并在你的监督下代表你采取行动。”

上周,在《纽约时报》 DealBook 峰会上与安德鲁·罗斯·索尔金 (Andrew Ross Sorkin) 的对话中,谷歌 CEO 皮查伊对微软的人工智能进步提出了质疑,表示他“很乐意在任何时候”对两家公司的模型进行并排比较。

安德鲁·罗斯·索尔金问皮查伊:“相对于其他参与者,你认为自己处于什么位置?”

皮查伊表示他很想进行并排比较,随后他补充道:“他们使用了别人的模型。”

“你这是在向我发起挑战。”索金回答道。

皮查伊笑着摇了摇头,补充道:“我只是——我非常尊重他们和他们的团队。”

微软当家人纳德拉对于谷歌技术实力也给予了很高的肯定。

早在今年 3 月份,微软 CEO 纳德拉在挪威银行投资管理播客上表示:“谷歌本应就是大型科技公司 AI 竞赛的默认赢家。谷歌是一家非常有能力的公司,他们既有人才,又有计算能力。他们是这个领域的垂直整合参与者。他们拥有从数据到芯片到模型到产品和分销的一切。”

出处:微信公众号 @AI前线

meiguo.com 发布人签名/座右铭这家伙浪费了“黄金广告位”,啥也没签!
大家都在看
楼主新近贴
回复/评论列表
默认   热门   正序   倒序
meiguo.com 创始人

emotion

2   2024-12-12 04:44:41  回复

回复/评论:谷歌发布Gemini 2.0,“硬刚”OpenAI

暂无用户组 升级
退出
等级:0级
美果:
美过
精华推荐
  1. 习近平主席在利马会见了拜登总统
  2. 拜登政府接连遣返来自中国的非法移民… 深层剖析一下!
  3. 中国竟然释放多名美籍重犯?美国“借坡下驴”
  4. 伊隆·马斯克的特斯拉,中国《人民日报》点名了!
  5. 时代在继续推进:“中国边检”已经改名为“中国移民管理”
  6. 伊万卡·特朗普在迈阿密的豪宅
  7. 到美国旅游,必去城市盘点 ~ Top 20
  8. 中国人民央行:不能以反诈名义随意管控个人银行账户
  9. 免签力量!外籍人士“中国游”持续火热
  10. 中国护照的免签含金量再次提升了
  11. 法官算老几?马斯克:公司应当由股东控制!
  12. “赴美生子”这次真完了,特朗普政府即将终结“最容易移民方法”
  13. 南加州的海滩评测(图文版)
  14. 特朗普政府的乌克兰计划曝光
  15. ChatGPT竟然拒绝谈论此人,无人知道为什么!
  16. 对话李开复:“勤俭持家”的中国大模型道路
  17. 美国人民可以立碑歌颂特朗普总统了
  18. 怪自己心善帮错人!美国华人在Costco购物后,被警察抄家!
  19. 阔别四年,回国大谈AI的马云可以再次盘活阿里吗?
  20. 在拜登赦免儿子后… 特朗普总统的特赦名单开始受关注了
  21. 绝非泛泛之辈!枪杀了美国医保巨头公司高管的嫌疑人落网
  22. 时至2024年底,美国民间的最畅销枪支盘点!
  23. 伊隆·马斯克和任正非纷纷上榜!福布斯的2024年度·商界人物公布
  24. 态度“回归自然”了?特朗普胜选后首次接受电视访谈
  25. 拿英伟达“开刀”,是中国GPU自主化的一步险棋!
  26. 特朗普总统在2025年接任前,留学生应该速速返美,否则可能回不来?
  27. 高开低走,Costco在中国如何自救?
  28. 一场豪赌吗?33岁辞职的她花光积蓄,出国留学!
  29. 公司高管和生娃“冲突吗”?38岁印度裔职业女性“齐里斯·马斯克”
  30. 两大巨头20年恩怨何解?特朗普政府“给撑腰”的马斯克可以直接攻击贝佐斯了?
  31. 在南加州,学车考驾照的全记录
  32. 美国人视角解读的最新中国出口管制:中国开创先例,禁止他国向美国出售商品!
  33. 签证受阻、offer遭拒… 出国留学为何越来越难
  34. 绝非野鸡大学!因为太过低调,盘点被低估的8所美国大学
  35. 在中国工作生活多年的前世界500强CEO被提名为美国驻华大使
  36. 针对TikTok,联邦法院坚持“不卖就禁”!扎克伯格或将成为最大赢家

美国动态美果转盘美果商店

Your IP: 3.145.61.202, 2024-12-22 00:39:24

Processed in 0.16806 second(s)

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
已有0次打赏
(2) 分享
分享
取消