欢迎来到今天的数码科技技术分析!我们来详细解析显卡架构解析:Blackwell 架构强在哪里。
一、Blackwell 架构概览
1.1 架构命名
Blackwell 架构以美国物理学家 David Blackwell 命名。他是信息论和博弈论的先驱。NVIDIA 延续以科学家命名架构的传统(Fermi、Kepler、Maxwell、Pascal、Volta、Turing、Ampere、Hopper、Ada Lovelace)。
1.2 核心代号
RTX 50 系列采用以下核心:
- GB202:旗舰核心(RTX 5090)
- GB203:高端核心(RTX 5080)
- GB204:中高端核心(RTX 5070)
- GB205:主流核心(RTX 5060)
1.3 工艺升级
Blackwell 架构采用台积电 4NP 工艺。这是 5nm 工艺的增强版。相比 Ada Lovelace 架构的三星 8N 工艺:
- 晶体管密度:提升约 30%
- 功耗:降低约 20%
- 频率:提升约 15%
二、CUDA 核心升级
2.1 核心数量
型号 CUDA 核心数 相比上代提升
RTX 5090 24576 个 +33%
RTX 5080 10752 个 +25%
RTX 5070 7168 个 +20%
RTX 5060 4608 个 +15%
2.2 核心效率
每个 CUDA 核心的效率提升:
- 指令发射:从每周期 1 条提升到 1.5 条
- 寄存器文件:容量增加 50%
- L1 缓存:带宽提升 40%
三、Tensor Core 升级
3.1 第四代 Tensor Core
Blackwell 架构采用第四代 Tensor Core。主要升级:
- FP8 支持:原生支持 FP8 精度。AI 推理速度提升 2 倍
- 稀疏计算:支持 2:4 和 4:8 稀疏性
- 张量核心数量:RTX 5080 配备 336 个
3.2 DLSS 3.5 技术
DLSS 3.5 主要特性:
- 帧生成:AI 生成中间帧。帧率翻倍
- 超分辨率:从 1080P 重建到 4K
- 光线重建:AI 优化光追效果
- 延迟降低:NVIDIA Reflex 2.0 技术
四、RT Core 升级
4.1 第三代 RT Core
光线追踪核心升级:
- 光线三角形求交:速度提升 50%
- BVH 遍历:效率提升 40%
- 不透明微图:支持更复杂的光线效果
4.2 光追性能对比
游戏(4K 光追超高) RTX 4080 RTX 5080 提升
赛博朋克 2077 45fps 68fps +51%
控制 52fps 78fps +50%
地铁:离去 58fps 85fps +47%
五、显存系统升级
5.1 GDDR7 显存
RTX 50 系列采用新一代 GDDR7 显存:
- 显存速率:28 Gbps(GDDR6X 为 22.4 Gbps)
- 显存带宽:RTX 5080 达 1024 GB/s
- 能效比:提升约 20%
5.2 显存容量
型号 显存容量 显存位宽 带宽
RTX 5090 32GB 512-bit 2048 GB/s
RTX 5080 16GB 256-bit 1024 GB/s
RTX 5070 12GB 192-bit 672 GB/s
RTX 5060 8GB 128-bit 448 GB/s
六、功耗与散热
6.1 功耗管理
Blackwell 架构的功耗优化:
- 独立电压域:核心、显存、缓存独立供电
- 动态频率:根据温度和功耗实时调整
- 电源效率:每瓦性能提升约 28%
6.2 散热设计
- 热管:均热板 + 热管组合
- 风扇:三风扇设计。支持智能启停
- 散热鳍片:增加 30% 散热面积
七、接口与输出
7.1 DisplayPort 2.1
RTX 50 系列首发支持 DisplayPort 2.1:
- 带宽:80 Gbps(DP 1.4a 为 32.4 Gbps)
- 分辨率:支持 8K 60Hz 或 4K 240Hz
- 压缩:支持 DSC 1.2a 压缩
7.2 HDMI 2.1
- 带宽:48 Gbps
- 分辨率:支持 4K 120Hz 或 8K 30Hz
- VRR:支持可变刷新率
八、对比竞品
8.1 vs AMD RX 8900 XT
测试项目 RTX 5080 RX 8900 XT 优势方
3DMark TS 32500 30000 RTX 5080
3DMark PR 28000 22000 RTX 5080
赛博朋克 4K 85fps 72fps RTX 5080
功耗 360W 420W RTX 5080
价格 8999 元 7999 元 RX 8900 XT
8.2 优势分析
- NVIDIA 优势:光追性能、DLSS、创作软件优化
- AMD 优势:价格、传统光栅性能、显存容量
九、架构总结
Blackwell 架构的主要创新:
- CUDA 核心效率提升 50%
- 第四代 Tensor Core 支持 FP8
- 第三代 RT Core 光追性能提升 50%
- GDDR7 显存带宽突破 1TB/s
- DisplayPort 2.1 接口
- 能效比提升 28%
关注我们获取更多硬件技术分析!

