IT之家 5 月 9 日消息,摩尔线程今日宣布推出 Torch-MUSA v2.0.0 版本,这是其面向 PyTorch 深度学习框架的 MUSA 扩展库的重要升级。新版本基于 MUSA Compute Capability 3.1 计算架构,支持原生 FP8 数据类型,支持 PyTorch 2.5.0,并通过多项针对 MUSA 计算平台的性能优化,进一步提升了对 AI 模型和大规模数据处理的支持能力。作为本次升级的核心亮点,Torch-MUSA v2.0.0 率先在国产 GPU 上实现了对 FP8 数据类型的完整支持。FP8 是当前 AI 计算的一种前沿低精度格式,在支持原生 FP8 的 GPU 上,大语言模型(LLM)训练采用 FP8 混合精度可大幅提高 GPU 算力,显著降低显存占用。摩尔线程基于新一代 MUSA Compute Capability 3.1 计算架构的全功能 GPU 原生支持 FP8 计算,这为 Torch-MUSA v2.0.0 实现 FP8 矩阵乘法和分布式通信优化提供了基础。依托这一底层架构优势,Torch-MUSA v2.0.0 能够充分发挥 FP8 的计算效能,提升大语言模型训练和推理的效率。Torch-MUSA v2.0.0 在 MUSA 计算平台引入多项创新功能,进一步提升深度学习任务的执行效率: 新增虚拟内存管理支持:MUSA 虚拟内存管理技术能够有效缓解 GPU 内存碎片化问题,降低模型训练过程中的峰值内存占
支持原生 FP8 和 PyTorch 2.5.0,摩尔线程开源发布 Torch-MUSA v2.0.0
2025-05-09 22:05:52来源: IT之家

关注公众号
赞
你的鼓励是对作者的最大支持
- OpenAI 发布并开源医疗测试基准 HealthBench,旨在更好地衡量 AI 系统在医疗健康领域能力2025-05-13 08:41:48
- 开阳实验室与南洋理工大学达成战略合作,奇瑞全球开源计划首个海外协同创新中心落地2025-05-13 09:04:29
- 苏州 RISC-V 开源芯片产业创新中心启动,力争 5 年内实现“授权客户超 300 家、推动 1000 款芯片量产”2025-05-11 16:47:56
- OpenSearch 开源搜索项目转由社区主导治理后迎来 3.0 大版本:引入“向量搜索”、性能增强2025-05-11 19:53:08
- 阿里开源 ZeroSearch 模型:可“自学”搜索能力,无需外部搜索引擎2025-05-09 20:51:17
- 超谷歌搜索:阿里开源创新大模型搜索引擎 ZeroSearch,成本直降 80% 且能力更强2025-05-09 07:14:52
- DeepSeek 致谢腾讯技术团队,DeepEP 开源通信框架性能显著提升2025-05-07 19:55:10
- 理想汽车 CEO 李想称梁文锋特别自律,开源星环 OS 纯粹是为了感谢 DeepSeek2025-05-07 21:28:15
- 超越 DeepSeek-R1,英伟达开源模型 Llama-Nemotron 登顶2025-05-06 17:06:46
- 开源鸿蒙开发者大会 2025 官宣 5 月 24 日举行,将发布 5.1 Release 版本2025-05-06 20:04:53
- 1英特尔携手壳牌推出至强处理器数据中心浸没式液冷散热方案
- 2【IT之家评测室】联想拯救者 Y9000P 2025 至尊版 AI 元启游戏本体验:性能猛兽,散热是亮点
- 3顺丰同城股价大涨,外卖大战的赢家其实是第三方即配
- 4Epic 游戏商城 2025 年大特卖开启:最高二五折优惠,赠送游戏道具
- 5OPPO Reno14体验:超美小OPhone 张张拍出“生命力”
- 6星纪魅族 Note 16 系列手机首销登顶京东价位段 &新品手机榜单双 TOP 1
- 7近亿元融资提速国产替代:中科玻声引领热电半导体创新|50×50
- 8小米米家微波炉 20L 节能版上市:升级二级能效,国补价 296.65 元起
- 9大疆推出 Inspire 3 基础版无人机套装:含飞行器 + 云台相机,49999 元起
- 10中国科学院上海微系统所开发出高性能 10mm 大口径压电 MEMS 快反镜