GPT-4o 更新后“变谄媚”?后续技术报告来了。OpenAI 一篇新鲜出炉的认错小作文,直接引来上百万网友围观。CEO 奥尔特曼也做足姿态,第一时间转发小作文并表示:(新报告)揭示了 GPT-4o 更新失败是因为什么,从中 OpenAI 学到了什么,以及我们将会采取的应对措施是什么。概括而言,最新报告提到,大约一周前的 bug 原来出在了“强化学习”身上 ——上次更新引入了一个基于用户反馈的额外奖励信号,即对 ChatGPT 的点赞或点踩。虽然这个信号通常很有用,但可能使模型逐渐倾向于做出更令人愉快的回应。此外,尽管还没有明确证据,但用户记忆在某些情况下也可能加剧奉承行为的影响。一言以蔽之,OpenAI 认为一些单独看可能对改进模型有益的举措,结合起来后却共同导致了模型变得“谄媚”。而在看到这篇报告后,目前大多数网友的反应 be like:(你小汁)认错态度不错~甚至有人表示,这算得上 OpenAI 过去几年里最详细的报告了。具体咋回事儿?接下来一起吃瓜。完整事件回顾4 月 25 日,OpenAI 对 GPT-4o 进行了一次更新。在官网的更新日志中,当时提到“其更加主动,能够更好地引导对话走向富有成效的结果”。由于只留下这种模糊描述,网友们无奈之下只能自己测试去感受模型变化了。结果这一试就发现了问题 ——GPT-4o 变得“谄媚”了。具体表现在,即使只问“天为什么是蓝的?”这种问题,GPT-4o 张口就是一堆彩虹屁(就是不说答案):你这问题真是太有见地了
OpenAI 发布最新技术报告,揭秘 GPT-4o 变谄媚的原因
2025-05-03 15:32:32来源: IT之家

关注公众号
赞
你的鼓励是对作者的最大支持
- 首个 AI 冠军:Gemini 2.5 Pro 大模型直播通关《宝可梦蓝》,谷歌 CEO 第一时间官宣2025-05-03 15:26:20
- 梅赛德斯-奔驰设计主管:我们制造的不是轮上家电2025-05-03 15:28:17
- 乐道汽车公布“五一购车福利”:购买 L60 车型赠 2880 元“52L 车载家庭大冰柜”2025-05-03 15:46:52
- Android“桌面模式”展望:界面更像 PC,但尚未完全成熟2025-05-03 16:04:10
- 工信部:一季度规模以上电子信息制造业营收 3.79 万亿元,同比增长 10.6%2025-05-03 16:07:23
- 任天堂发布 Switch 掌机 V20.0.1 更新,修复启动错误问题2025-05-03 16:20:44
- 央视介绍中国移动“九天大模型”AI:重点围绕电气工程应用 / 信号处理优化,已进入通信生产等领域2025-05-03 16:24:51
- Ulefone Armor X32 三防手机发布:Helio G91 芯片、48MP 夜视镜头,1399 港币2025-05-03 16:36:22
- 《GTA 6》官宣延期后,发行商 Take-Two 股价一度下挫 10%2025-05-03 16:38:51
- 曜越推出 AX700 工作站机箱:18 盘位,上下可加装 AX100 扩充舱2025-05-03 16:40:28
- 1吉利银河 App 出现服务问题,官方回应称运营服务商网络波动
- 2德国 ONOX 公司推出全电动拖拉机,采用换电设计
- 3全新智己 L6 上市:全系四轮转向、最高续航 850 公里,上市权益价 20.49 万元起
- 4一加平板 2 Pro 发布:骁龙 8 至尊版、13.2 英寸屏,国补后 2719.15 元起
- 5消息称苹果与 Synchron 合作,今年上线脑机接口操控 iPhone 功能
- 6KTC 推出“H27P6”27 英寸显示器:4K 160Hz / FHD 320Hz 双模 + 90W USB-C,15…
- 7李想一年赚6个亿,合理吗?
- 8张永斌:破局与启航——汽车产业链出海的路径探索与投资抉择 | 钛资本智能汽车组
- 9苹果公布今年将推出的全新辅助功能:App Store 增无障碍标签,Mac 首迎放大镜应用
- 10松下 LUMIX S1M2 和 S1M2E 相机发布,推出 S 24-60mm F2.8 镜头