IT之家 5 月 1 日消息,深度求索(DeepSeek)昨日(4 月 30 日)在 AI 开源社区 Hugging Face 上,发布名为 DeepSeek-Prover-V2-671B 的新模型,随后在 GitHub等平台上公布了论文信息。IT之家援引论文介绍,DeepSeek-Prover-V2 是一款专注于形式化数学推理的开源大型语言模型,基于 DeepSeek-V3-0324,通过递归定理证明管道生成初始数据。Deepseek 推出了 DeepSeek-Prover-V2-671B(结合 V3 基础大模型)、DeepSeek-Prover-V2-7B(增强模型)两个模型,以及 DeepSeek-ProverBench 数据集。DeepSeek-Prover-V2-671B 采用和 DeepSeek V3-0324 相同的架构,并非用于常规对话或者推理,而是用于形式化定理证明、专门增强数学能力的模型。DeepSeek 团队首先引导 DeepSeek-V3 模型将复杂定理分解为一系列子目标(subgoals),整合非形式与形式化数学推理,在 Lean 4 平台上形式化证明步骤。接着,利用一个较小的 7B 参数模型处理子目标的证明搜索,减轻计算负担。最终,结合完整的逐步证明与 DeepSeek-V3 的思维链(chain-of-thought),形成强化学习的“冷启动”数据。在训练中,团队筛选出一批 7B 模型无法直接解决但子目标已被证明的难题。通过整合子
DeepSeek-Prover-V2 登场:AI 数学推理新王者,88.9% 通过率设新标杆
2025-05-01 09:14:27来源: IT之家

关注公众号
赞
你的鼓励是对作者的最大支持
- 当DeepSeek遇上百年医院:解码AI医疗落地实践2025-05-14 19:39:44
- 香港科技大学成立冯诺依曼研究院:全力发展 AI 为关键产业2025-05-09 17:44:54
- 杜克大学研究:若在工作中使用生成式 AI,同事可能会质疑你的能力2025-05-09 19:05:54
- 小米盒子 5/5 Max 系列发布:杜比视界全景声、AI 小爱同学,299 元起2025-05-09 21:17:54
- 卡内基梅隆大学推出 AI 模型“乐高 GPT”,敲敲键盘就能生成可搭建积木2025-05-09 22:07:13
- 苹果的瑞士军刀挥向了AI2025-05-09 15:36:22
- 美国四大 AI 高管:政府需加大基础设施建设,并支持 AI 芯片出口2025-05-09 07:19:27
- 谷歌 AI 出击:冒充客服等骗局减少 80% 以上,Gemini Nano 护航网络安全2025-05-09 07:41:09
- 初探苹果最薄 iPhone 17 Air 戴手机壳效果:超薄美感不减2025-05-09 08:17:56
- Cadence 发布新型 AI 超级计算机:基于英伟达 Blackwell 芯片,单台成本 200 万美元2025-05-09 08:18:31
- 1英特尔携手壳牌推出至强处理器数据中心浸没式液冷散热方案
- 2【IT之家评测室】联想拯救者 Y9000P 2025 至尊版 AI 元启游戏本体验:性能猛兽,散热是亮点
- 3顺丰同城股价大涨,外卖大战的赢家其实是第三方即配
- 4Epic 游戏商城 2025 年大特卖开启:最高二五折优惠,赠送游戏道具
- 5OPPO Reno14体验:超美小OPhone 张张拍出“生命力”
- 6星纪魅族 Note 16 系列手机首销登顶京东价位段 &新品手机榜单双 TOP 1
- 7近亿元融资提速国产替代:中科玻声引领热电半导体创新|50×50
- 8小米米家微波炉 20L 节能版上市:升级二级能效,国补价 296.65 元起
- 9大疆推出 Inspire 3 基础版无人机套装:含飞行器 + 云台相机,49999 元起
- 10中国科学院上海微系统所开发出高性能 10mm 大口径压电 MEMS 快反镜