维其互联 > 信息聚合 > 回归 Pascal:英伟达 RTX 50 显卡全部 CUDA 核心支持 FP32 / INT32 双功能

回归 Pascal:英伟达 RTX 50 显卡全部 CUDA 核心支持 FP32 / INT32 双功能

2025-02-01 13:27:28来源: IT之家

IT之家 2 月 1 日消息,英伟达现已公布 Blackwell GPU 架构白皮书,披露了 GeForce RTX 50 系列显卡的大量技术细节,其中相当值得注意的一点是 Blackwell 架构的全部单精度 CUDA 核心同时支持 FP32 / INT32 数据,这点上回归了九年前的 Pascal 架构。▲ Blackwell 架构 SM 设计▲ Pascal 架构 SM 设计英伟达在 GeForce 10 "Pascal" 世代仍采用单精度 CUDA 单元兼顾 FP32 / INT32 的设计,而在 Volta 和 Turing 两代上换用了两组 1:1 比例的 CUDA 核心分别承担 INT32 和 FP32 的方案。▲ Volta(左)、Turing(右)两代架构 SM 设计来到 Ampere 架构,英伟达则为每个 SM 流式处理器的四个处理块(IT之家注:Processing Block)之一提供了 1 组 16 个 FP32 / INT32 单元和 1 组 16 个纯 FP32 单元;而在 Ada GPU 上,这一设计得到延续。▲ Ampere(左)、Ada(右)两代架构 SM 设计Blackwell 架构上的统一 CUDA 使得每 SM 可能的 INT32 整数运算能力较 Ada 翻倍。不过在任何给定的时钟周期内,Blackwell 统一内核只能以 FP32 或 INT32 模式中的一种运行。英伟达提到,Ada 架构 SM

关注公众号
标签: 显卡 英伟达