多项力压 Grok 4、OpenAI o3,谷歌推出 Gemini 2.5 Deep Think 模型

发布时间:2025-08-02 14:51:21 来源:互联网

感谢本站网友 GreatMOLA 的线索投递!

本站 8 月 1 日消息,谷歌今晚宣布,Gemini 2.5 Deep Think 模型现已正式上线,现已在 Gemini 应用中向 Google AI Ultra 订阅用户开放。这款新模型在多个关键基准测试中超越了 OpenAI 的 o3 和 xAI 的 Grok 4。

据外媒 Neowin 报道,今年 5 月,谷歌在 Google I/O 大会上首次介绍了 Gemini 2.5 Pro 的 Deep Think 模式,采用全新研究方法,可在作答前综合多个假设进行推理。本次发布的是该功能的升级版,结合早期内测用户的反馈和最新研究成果进行了优化。谷歌表示,新版本在性能上相比最初的 I/O 版本有了显著提升。

谷歌还透露,这一模型是此前模型的一个变体(本站注:前述模型已在国际数学奥林匹克竞赛中获得金牌)。为适应日常使用场景,谷歌对其进行了加速优化,因此在 2025 年 IMO 基准测试中仅达到铜牌水平。

从基准测试结果可知,Gemini 2.5 Deep Think 在 LiveCodeBench V6、Humanity’s Last Exam、IMO 2025 和 AIME 2025 等项目中均表现优异。

目前,Google AI Ultra 用户每天可以在 Gemini 应用中以限定次数使用 Deep Think。当启用 Gemini 2.5 Pro 模型时,输入栏会显示“Deep Think”选项。谷歌指出,该功能将自动集成代码执行和谷歌搜索等工具。谷歌还计划在未来几周内,通过 Gemini API 向部分开发者提供带工具与不带工具的 Deep Think 模型版本。

本周热门教程

1
如何制作出具有A级效果的AE视频?掌握这些步骤让你轻松创作高质量视频!

如何制作出具有A级效果的AE视频?掌握这些步骤让你轻松创作高质量视频!

2025/03/07

2
暗黑爆料热传,在线吃瓜盛宴!免费观看爆料大揭秘,真相究竟如何?

暗黑爆料热传,在线吃瓜盛宴!免费观看爆料大揭秘,真相究竟如何?

2025/01/29

3
四川人“BBBBB桑BBBB”到底是什么?了解四川人独特的文化密码和生活态度

四川人“BBBBB桑BBBB”到底是什么?了解四川人独特的文化密码和生活态度

2025/01/25

4
你知道小寡妇汆白肉最经典的十首歌曲吗?快来了解这些不可错过的动听旋律!

你知道小寡妇汆白肉最经典的十首歌曲吗?快来了解这些不可错过的动听旋律!

2025/01/27

5
NPC大佬的浇灌日常是如何塑造虚拟世界中的真实生活的?

NPC大佬的浇灌日常是如何塑造虚拟世界中的真实生活的?

2025/01/30

6
关于被系统浇灌后的日常(双/产)海棠,其汉字变化究竟是何原因?

关于被系统浇灌后的日常(双/产)海棠,其汉字变化究竟是何原因?

2025/01/30

7
日本免费SAAS CRM如何助力企业提升客户管理效率?

日本免费SAAS CRM如何助力企业提升客户管理效率?

2025/02/05

8
丰满的岳理论片50岁:为何这一年龄段的影视作品充满魅力与深度?

丰满的岳理论片50岁:为何这一年龄段的影视作品充满魅力与深度?

2025/02/13

9
日本医疗探索:护士护士制在日本盛行的JapanHD背景究竟如何?

日本医疗探索:护士护士制在日本盛行的JapanHD背景究竟如何?

2025/02/15

10
妖精动漫浏览页面弹窗登录常见问题解析及解决方案

妖精动漫浏览页面弹窗登录常见问题解析及解决方案

2025/02/15