IT之家 7 月 2 日消息,科技媒体 phoronix 昨日(7 月 1 日)发布博文,报道称 AMD 公司发布了新的补丁系列,修复了由于显存和 Instinct 加速器过多,导致的系统休眠失败故障。IT之家援引博文介绍:如果一台服务器配有 8 个带有 192GB 显存的设备,系统内存超过 2TB,那么就会导致系统休眠出现故障。AMD 工程师 Samuel Zhang 解释称休眠过程中,系统尝试将显存迁移到 GTT 或共享内存,如果显存过多,可能会导致系统内存耗尽。Samuel Zhang 在最新发布的补丁中表示:现代数据中心 dGPU 通常配备有非常大的 VRAM。在配备此类 dGPU(192GB VRAM * 8)和 2TB 系统内存的服务器上,休眠会因为内存不足而失败。根本原因在于,休眠期间所有 vRAM 内存都会被迁移到 GTT 或共享内存。在两种情况下,它们都在系统内存中,内核会尝试将这些页面复制到休眠镜像。在最坏的情况下,这会在系统内存中创建两份 vRAM 内存副本,2TB 的内存不足以存储休眠镜像。修复方案包括以下两个变更:1. 将 GTT 迁移到共享内存,释放 GTT 页面;2. 强制将共享内存页面写入交换磁盘,释放共享内存页面。在休眠准备阶段将 GTT 迁移到共享内存后,在解冻阶段恢复缓冲对象需要大量时间(观察到 8 个 dGPU 需要 50 分钟)。由于后续休眠阶段不需要使用 GPU,这一步骤并非必要。第三个补丁就是跳过解冻阶段的缓冲对象
服务器显存过多引发休眠失败,AMD 发布新 Linux 补丁修复
2025-07-02 09:18:12来源: IT之家

关注公众号
赞
你的鼓励是对作者的最大支持
- 一盆冷水:英特尔与 AMD 下代大核显旗舰移动平台均被曝可能不推出2025-07-17 16:24:05
- AMD 确认锐龙 AI 5 330 处理器 "1x Zen 5 , 3x Zen 5c" 设计,中国版同步上线2025-07-17 08:43:45
- AMD 推出最低端锐龙 AI 300 系列处理器 Ryzen AI 5 330,保留完整 NPU2025-07-16 21:27:31
- AMD Ryzen Z2 Extreme 掌机处理器跑分曝光:单核比前代高 26.5%、多核高 27%2025-07-16 13:57:53
- 真爱:Linux 开发者为近 20 年前 AMD 显卡推新补丁,提高 OpenGL 兼容性2025-07-16 12:02:29
- 英伟达、AMD恢复向中国销售AI芯片,美国商务部长:中国只能买到英伟达“第四等”货2025-07-16 11:03:00
- 继英伟达 H20 后,AMD 确认将恢复向中国出口 MI308 芯片2025-07-15 21:03:20
- OpenAI 前 CTO 穆拉蒂初创公司获英伟达、AMD 投资,估值达 120 亿美元2025-07-16 08:16:35
- TensorWave 打造北美最大 AMD GPU 训练集群,含 8192 块 MI325X2025-07-13 22:34:37
- AMD 专利探索“智能开关”方案,解决多芯粒 GPU 延迟较高问题2025-07-12 10:01:36
- 1石头科技洗衣机裁员,“家电新势力“不行了?
- 2育碧的旧世界,腾讯的新叙事
- 3华为 × 云南交投发布“绿美通道・交通大模型”,实现通用与智能算力融合升级
- 4发布时间相隔 13 年的奇幻旅程:Steam Deck 游戏掌机原生运行 Win7
- 5比亚迪王朝秦宋元夏 4 大 IP 车型将开启 OTA 升级,新增偏置泊车、危险加塞提醒等功能
- 6小米汽车:YU7 Pro / Max 均配备「运动 +」驾驶模式,实现更多应用场景
- 7李楠提出汽车圈有水军恶意抹黑小米和华为,微博 CEO 王高飞称“不排除有第三方暗中撺掇”
- 8Trump Floats Five or Six Possible Deals after Trade Pact wit…
- 9王传福为和谐比亚迪海外第 100 家店 Caroline Springs 开业授牌,亲手交付新店首位车主
- 10京东外卖投入 20 亿升级全职骑手福利:五险一金 + 防寒暑补贴 + 15 万辆二轮车,达标可得