更新时间:2024-06-18 10:56
RV770 GPU核心是地球上第一颗单芯片突破1万亿次单精度浮点运算能力、单芯片突破2000亿次双精度浮点运算能力的电脑芯片。AMD(ATI)公司在2008年第三季度发布的RV700系列中的中端核心架构(当时的AMD主攻中端市场因而并没有拿出高端芯片)该芯片就是 AMD RADEON HD4850、HD4870,及HD4830和HD4730显卡的显示核心。
RV770虽是中端芯片,但运算能力却胜过当时的NVIDIA顶级的G200核心,更令人震撼的是RV770实现如此强大的浮点运算能力仅仅集成了9.56亿个晶体管,而当时的G200核心则集成了14亿个晶体管。简单地说,RV770拥有更好的性能、更低的功耗、更低的发热量、以及更高的良品率。
运算能力对比
AMD RV770 单精度浮点运算能力为 1000 GFLOPs 、1200 GFLOPs
AMD RV770 双精度浮点运算能力为 200 GFLOPs、 240 GFLOPs
NVIDIA G200 单精度浮点运算能力为 933 GFLOPs
NVIDIA G200 双精度浮点运算能力为 116 GFLOPs
NVIDIA G92 单精度浮点运算能力为 432GFLOPs
NVIDIA G92 双精度浮点运算能力为 54GFLOPs
NVIDIA G80 单精度浮点运算能力为 384GFLOPs
NVIDIA G80 双精度浮点运算能力为 48GFLOPs
由上表可见,AMD RV770在运算能力方面拥有绝对的优势,因此由国防科技大学装配的中国的超级计算机 天河一号就采用了2560张AMD HD4870X2显卡,也就是5120个RV770核心来构建了这台曾经是2010年亚洲第一、世界第五的超级计算机。(超级计算机排名每年都有变动)
RV770的核心结构图如右
1.SIMD阵列扩充为10组,是原来的RV670的2.5倍,流处理器数量也由320个增加到800个。而且每组SIMD还绑定了专属的缓存及纹理单元,寄存器的容量也有所增加,纹理单元相应增加到10组,总数达到40个。
2.RV770的全屏抗锯齿能力大幅增强。RV770还是保持4组后处理单元,也就是通常所说的16个ROPs(光栅单元),但AMD重新设计了光栅单元的内部结构,改善了之前较弱的AA反锯齿性能。R600/670每组后处理单元内部包括了8个Z模板采样,而RV770则提高到16个,因此它的多重采样(MSAA)速度几乎可以达到以前的2倍。当然,RV770的反锯齿算法最终还是要由Shader来处理,而RV770的800个流处理器正好可以派上用场,最终抗锯齿性能有不小的提升。
3.RV770可以依靠800的流处理器的处理能力轻松突破1TFlop的浮点运算能力。成为第一款成功达到1TFlop的GPU核心,这是显卡史上具有里程碑意义的突破。
4.开源的GPGPU功能。NVIDIA所倡导的CUDA在科学计算领域取得了不小的成功,但是,CUDA并非一个完全免费的开放API,支持它的应用软件实际上都需要重新编译,这明显会加大软件生产商的研发成本。与此同时,AMD与苹果公司一起推广的通用计算行业的新一代标准API——OpenCL,旨在让GPU能与多核CPU互相协调工作,以提高系统的整体计算能力。未来这一标准将是公开而免费的。
5.内建第二代UVD视频解码引擎。相对于第一代UVD技术而言,主要在以下有所改进。1.更好地支持超高码率的视频编码与播放。2.支持2160P及更高分辨率视频编码。3.支持多流解码,即可同时解码多部高清影片,比NVIDIA在GTX280上实现的双流解码更强大。4.继续内置高清音频模块并可以通过HDMI接口输出7.1声道的AC3和DTS编码音频流。
6.业界率先采用55nm制造工艺的GPU核心,使晶圆成本得以降低,以控制成本,同时,55nm制程的热功耗设计比此前的显卡更出色,可以有效的降低发热量和提高超频能力。
7.RV770支持DirectX 10.1。DX10.1改善了Shader资源存取功能,在进行多样本反锯齿时间少了性能损失。它还能够提高游戏的阴影过滤效率,进一步提高光影效果。此外DX10.1还支持32位浮点过滤,能够提高渲染精度,改善HDR画质。
AMD(ATI)Radeon HD4730
AMD(ATI)Radeon HD4830
AMD(ATI)Radeon HD4850
AMD(ATI)Radeon HD4870
AMD(ATI)Radeon HD4850X2
AMD(ATI)Radeon HD4870X2
HD4850
核心代号 :RV770
显卡核心频率:625MHz
流处理器频率: 625MHz
显卡核心工艺 :55纳米
核心生产厂商 :AMD(ATI)
晶体管数目: 9.56亿
显存类型:GDDR3
纹理单元:40
光栅单元:16
显存封装:FBGA
显存频率:1986MHz
显卡显存容量:512MB
显存位宽:256bit
流处理单元:800个
接口类型: PCI Express X16 2.0
最大分辨率:2560×1600
3D API :DirectX 10.1, Shader Model 4.1, OpenGL 2.0
HD4870
核心代号 :RV770XT
显卡核心频率: 750MHz
显卡核心工艺 :55纳米
核心生产厂商 :AMD(ATI)
晶体管数目: 9.56亿
显存类型 :GDDR5
显存封装 :FBGA
显存频率 :3600MHz
显卡显存容量 :512MB
显存位宽 :256bit
流处理单元 :800个
接口类型: PCI Express X16 2.0
最大分辨率 :2560×1600
3D API :DirectX 10.1, Shader Model 4.1, OpenGL 2.0
多卡技术 :CrossFireX
多卡技术 :CrossFireX
HD4850X2
核心代号 :RV770
显卡核心频率:625MHz
流处理器频率: 625MHz
显卡核心工艺 :55纳米
核心生产厂商 :AMD(ATI)
晶体管数目: 9.56亿*2
显存类型 :GDDR3
纹理单元:40*2
光栅单元:16*2
显存封装 :FBGA
显存频率 :1986MHz
显卡显存容量 :512MB *2
显存位宽 :256bit *2
流处理单元 :800个 *2
接口类型: PCI Express X16 2.0
最大分辨率 :2560×1600
3D API :DirectX 10.1, Shader Model 4.1, OpenGL 2.0
HD4870X2
核心代号 :RV770XT
显卡核心频率: 750MHz
显卡核心工艺 :55纳米
核心生产厂商 :AMD(ATI)
晶体管数目: 9.56亿*2
显存类型 :GDDR5
显存速度:0.5ns
显存封装 :FBGA
显存频率 :3600MHz
显卡显存容量 :512MB *2
显存位宽 :256bit *2
光栅单元:16*2
流处理单元 :800个 *2
接口类型: PCI Express X16 2.0
最大分辨率 :2560×1600
3D API :DirectX 10.1, Shader Model 4.1, OpenGL 2.0
多卡技术 :CrossFireX