就在开源的 DeepSeek-R1 被整合进各路 AI 搜索工具之际,OpenAI 临时举行小型发布会。4 点 27 通知,8 点开始直播。ChatGPT 上新“Deep Research”,把推理大模型的思考能力用于联网搜索。据介绍,Deep Research 功能可在数十分钟完成人类专家需要几个小时的复杂研究任务。在“人类最后的考试”上,Deep Research 刷新了最高分,比 o3-mini 高推理设置分数高出一倍。该测试包括 3000 多个多选和简答题,涵盖从语言学、火箭科学到生态学的 100 多个主题。与 o1 相比,Deep Research 最突出的地方在化学,人文和社会科学以及数学中,表现出类似人类的“在必要时寻找专业信息”的能力。另一项测试 GAIA,在现实世界问题上评估 AI 的公开基准测试,Deep Research 在 3 个级别的难度上均刷新记录。出于保护基准测试的目的,OpenAI 只展示了 Deep Research 在完成这些任务时的搜索过程,隐去了最终答案。Deep Research 功能接下来将对 Pro、Plus 和 Team 用户开放。奥特曼后面补充,目前版本基于 o3 构建,Plus 用户(20 美元 / 月)每个月能用约 10 次,且正在构建一个更高效的版本。此外,免费用户也能获得非常少量的使用额度。推理 Agent 的第一步OpenAI 表示,Deep Research 专门为在金融 / 科学 / 工程等领域从
OpenAI ChatGPT 上新 Deep Research:持续思考 30 分钟输出 1 万字,刷榜“人类最后的考试”
2025-02-03 15:03:48来源: IT之家

关注公众号
赞
你的鼓励是对作者的最大支持
- 新增银行卡进行扫码支付等功能,华为 WATCH GT 5 系列手表获鸿蒙 HarmonyOS 5.0.0.159 升级2025-02-10 19:04:23
- OpenHarmony 社区:截至 1 月 31 日,生态伙伴发展至 401 家2025-02-10 22:06:16
- Trump’s $4 Billion Funding Cut Might Trigger Departure of Ch…2025-02-10 17:22:00
- 亿咖通 ECARX AutoGPT 完成 DeepSeek-R1 模型深度适配2025-02-08 22:38:49
- U.S. Cross-Border Sellers Move to Build Overseas Wearehouse …2025-02-08 16:40:00
- 新王诞生:DeepSeek 双模型 GitHub Star 数首次超越 OpenAI 创造历史2025-02-07 18:46:50
- 华为 MatePad Pro 12.2 英寸平板开启鸿蒙 HarmonyOS NEXT 花粉 Beta 版升级招募2025-02-06 17:48:50
- 高通 CEO 安蒙称 Arm 已撤回终止许可协议的“威胁”2025-02-06 19:42:00
- Neuralink 迎来 PRIMARY 首位测试患者,用大脑控制辅助机器人设备2025-02-06 19:48:14
- 波音 Starliner 项目 2024 年亏损超 5 亿美元再创新高,累计损失超 20 亿美元2025-02-04 23:26:28
- 1闪迪介绍高带宽闪存 HBF:单 AI 推理 GPU 存储容量即可满足前沿模型需求
- 2百度 Apollo 智舱大模型完成 DeepSeek 接入,将在凯迪拉克、别克新车搭载
- 3《哪吒之魔童闹海》首批海外上映地区定档,今日起强势登陆美澳
- 4股市龙虎榜是什么?用它来分析股票的原理是什么?
- 5上海自贸试验区数据跨境服务中心成立,提供“一站式”服务
- 6DeepSeek突袭,英伟达算力霸权是否会走入危局?
- 7索尼 2024 财年 Q3 销售额 4.41 万亿日元同比增长 18%,PS5 主机销量累计达 7510 万台
- 8《守望先锋 2》游戏迎来天赋升级系统,战利品箱、303 模式回归
- 9消息称 iPhone 17 Pro Max 将落地金属超构透镜,折叠 iPad 也会运用该方案
- 10极氪汽车宣布进军非洲市场,001 埃及售价约 38.83 万元人民币起