IT之家 5 月 1 日消息,微软昨日(4 月 30 日)发布 Phi-4-reasoning 系列推理模型,通过监督微调 Phi-4,并利用 o3-mini 生成的高质量“可教导”提示数据集训练,专为复杂推理任务设计。IT之家援引博文介绍,微软本次共推出 Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning 三款模型,官方称该系列模型不仅延续了小型模型的高效特性,还在推理能力上实现重大突破。该系列模型通过推理时间扩展(inference-time scaling)技术,擅长处理需要多步骤分解和内部反思的复杂任务,尤其在数学推理和代理型应用中表现突出,具备媲美大型前沿模型的潜力。Phi-4-reasoning 是一款拥有 140 亿参数的开源推理模型,通过监督微调(Supervised Fine-Tuning,SFT)Phi-4,结合 OpenAI o3-mini 的高质量推理演示数据,并充分利用额外计算资源,生成详细的推理链条。Phi-4-reasoning-plus 增强版通过强化学习(Reinforcement Learning,RL)进一步提升性能,tokens 用量比标准版多 1.5 倍,支持更高精度。两款模型在数学推理和博士级科学问题测试中,均超越 OpenAI o1-mini 和 DeepSeek-R1-Distill-Llama-70B,甚至在 AIME 2025(美国数学奥林匹
微软发布 Phi-4 系列小语言 AI 推理模型,AIME 2025 跑分超满血版 Deepseek R1
2025-05-01 15:07:20来源: IT之家

关注公众号
赞
你的鼓励是对作者的最大支持
- 当DeepSeek遇上百年医院:解码AI医疗落地实践2025-05-14 19:39:44
- 联想 YOGA Pad Pro 14.5 AI 元启版发布:搭载端侧 DeepSeek,4999 元起2025-05-08 21:14:15
- DeepSeek 致谢腾讯技术团队,DeepEP 开源通信框架性能显著提升2025-05-07 19:55:10
- 理想汽车 CEO 李想称梁文锋特别自律,开源星环 OS 纯粹是为了感谢 DeepSeek2025-05-07 21:28:15
- 超越 DeepSeek-R1,英伟达开源模型 Llama-Nemotron 登顶2025-05-06 17:06:46
- DeepSeek-Prover-V2 登场:AI 数学推理新王者,88.9% 通过率设新标杆2025-05-01 09:14:27
- 【科股一线拆解】最强大模型集中发布,DeepSeek、阿里、小米等厂商均有新动作2025-04-30 17:23:10
- DeepSeek-Prover-V2-671B 新模型开源发布2025-04-30 17:56:53
- 抢先DeepSeek R2,阿里通义正式发布国内首个通用推理模型2025-04-30 14:40:45
- DeepSeek走红三个月,第一批想靠它赚钱的怎么样了?2025-04-23 14:45:16
- 1英特尔携手壳牌推出至强处理器数据中心浸没式液冷散热方案
- 2Epic 游戏商城 2025 年大特卖开启:最高二五折优惠,赠送游戏道具
- 3【IT之家评测室】联想拯救者 Y9000P 2025 至尊版 AI 元启游戏本体验:性能猛兽,散热是亮点
- 4顺丰同城股价大涨,外卖大战的赢家其实是第三方即配
- 5OPPO Reno14体验:超美小OPhone 张张拍出“生命力”
- 6星纪魅族 Note 16 系列手机首销登顶京东价位段 &新品手机榜单双 TOP 1
- 7近亿元融资提速国产替代:中科玻声引领热电半导体创新|50×50
- 8小米米家微波炉 20L 节能版上市:升级二级能效,国补价 296.65 元起
- 9大疆推出 Inspire 3 基础版无人机套装:含飞行器 + 云台相机,49999 元起
- 10中国科学院上海微系统所开发出高性能 10mm 大口径压电 MEMS 快反镜