IT之家 7 月 31 日消息,人们正在越来越多地使用大模型完成各种任务,不论是翻译、总结文章还是识别金融诈骗,大模型都是“无所不包”。尽管这些模型都具有“惊人”能力,但它们偶尔也会生成错误答案,并对错误答案过于自信、对正确答案信心不足,使用户对大模型是否值得信任表示怀疑。据 MIT NEWS 今日报道,麻省理工学院(MIT)和 MIT-IBM Watson AI Lab 的研究人员提出了一种专为大型语言模型量身定制的校准方法。他们的方法被称为“温度计”,其原理是在大语言模型之上构建一个较小的辅助模型来对其进行校准。图源 Pexels据悉,这种被叫作“温度计”的方法所需的计算能力更少,但同时又能保持模型的准确性,并使其能够在未曾遇到过的任务中做出更好的校准响应。通过针对各种任务对大语言模型进行高效校准,“温度计”可以帮助用户找出模型对错误预测过于自信的情况,最终防止用户在可能失败的情况下部署该模型。有关论文的第一作者、麻省理工学
专治 AI 大模型对错误答案“过于自信”,麻省理工学院提出新型高效低耗校准方法
2024-07-31 15:02:13来源: IT之家

关注公众号
赞
你的鼓励是对作者的最大支持
- 香港科技大学成立冯诺依曼研究院:全力发展 AI 为关键产业2025-05-09 17:44:54
- 杜克大学研究:若在工作中使用生成式 AI,同事可能会质疑你的能力2025-05-09 19:05:54
- 小米盒子 5/5 Max 系列发布:杜比视界全景声、AI 小爱同学,299 元起2025-05-09 21:17:54
- 卡内基梅隆大学推出 AI 模型“乐高 GPT”,敲敲键盘就能生成可搭建积木2025-05-09 22:07:13
- 苹果的瑞士军刀挥向了AI2025-05-09 15:36:22
- 美国四大 AI 高管:政府需加大基础设施建设,并支持 AI 芯片出口2025-05-09 07:19:27
- 谷歌 AI 出击:冒充客服等骗局减少 80% 以上,Gemini Nano 护航网络安全2025-05-09 07:41:09
- 初探苹果最薄 iPhone 17 Air 戴手机壳效果:超薄美感不减2025-05-09 08:17:56
- Cadence 发布新型 AI 超级计算机:基于英伟达 Blackwell 芯片,单台成本 200 万美元2025-05-09 08:18:31
- Imagination 宣布推出 E 系列 GPU:AI 性能比上一代 D 系列提升至多 400%2025-05-09 08:56:47
- 1本土高端酒店在流拍,国际资本却在全球扫货
- 2日产汽车中国区 4 月销售 46295 台,同比下降 15.7%
- 3利尔达 × 上海海思推出基于 FB36 模组全新星闪 AI 开发板,支持三模通信协议
- 4《毁灭战士:黑暗时代》游戏 PS5 版遭偷跑,5 月 15 日正式解锁
- 5消息称三星 Galaxy Z Fold7 展开尺寸更大,屏幕边框收窄近半
- 6支持设定车辆最高速度,特斯拉陶琳介绍“家长控制”功能
- 7涉股权、技术授权等核心问题,消息称 OpenAI 正与微软展开“高风险”谈判
- 8三星推出全球首款 500Hz OLED 游戏显示器玄龙骑士 Odyssey OLED G6
- 9极米RS 20系列上市:无损4K画质+游戏超低延迟 售价6699元起
- 10任天堂 Switch 2 被曝实体卡带容量只有 64GB 可选