流处理单元 - 知识百科

流处理单元

更新时间：2022-07-29 12:08

流处理器（SP，Stream Processor）单元是统一架构GPU内通用标量着色器的称谓。

产品简介

流处理单元是全新的全能渲染单元，由以前的顶点着色器和像素着色器结合而成的新一代显卡核心架构，是继Pixel Pipelines（像素管线）和Vertex Pipelines（顶点管线）之后新一代的显卡渲染技术指标。流处理单元既可以完成VS（Vertex Shader，顶点着色器）运算，也可以完成PS（Pixel Shader，像素着色器）运算，而且可以根据需要组成任意VS/PS比例，从而给开发者更广阔的发挥空间。简而言之，过去按照固定的比例组成的渲染管线/顶点单元渲染模式如今被流处理单元组成的任意比例渲染管线/顶点单元渲染模式替代。

流处理单元是组成渲染管线的一部分，一条完整的渲染管线包括流处理器和纹理贴图处理器。这是DirectX 10引入的新概念统一渲染架构（DirectX 10在XP上还不能装，但是一些软件有这功能）。采用统一渲染架构能有效而充分的利用显卡闲置资源，不再需要上一代显卡依靠渲染管线执行命令排队并逐个执行。Nvidia GeForce 8800GTX是世界上第一块支持DirectX 10的PC桌面显卡，核心代号G80，同时也是结束显卡管线概念的第一块显卡，引入新的流处理单元的概念，是显卡发展史上一次重大的革新。

流处理单元直接影响处理能力，因为流处理单元是显卡的核心，也可称作大脑。流处理单元个数越多则处理能力越强，一般成正比关系，但这仅限于NVIDIA自家的核心或者AMD自家的核心比较范畴。NVIDIA和AMD的流处理单元比较可采取近似比较，即NVIDIA的1个流处理单元相当于AMD的5个流处理单元（随着发展可能会有所不同）。

流处理器直接将多媒体的图形数据流映射到流处理器上进行处理，有可编程和不可编程两种。市面上XX年公布的名为Cheops中的流处理器，是针对某一个特定的视频处理功能而设计的一种不可编程的流处理器。但为了得到一定的灵活性，系统中也包含一个通用的可编程处理器。从1996年到2001年，MIT和Standford针对图像处理的应用，研制了名为Imagine的可编程流处理器。Imagine流处理器没有采用Cache（高速缓冲存储器），而是采用一个SRF（Stream Register File，流寄存器文件），作为流（主）存储器与处理器寄存器之间的缓冲存储器，来解决存储器带宽问题的。流存储器与SRF之间的带宽是2GB/s，SRF与处理器寄存器之间的带宽是32GB/s，ALU Cluster（ALU簇）内寄存器与ALU之间的带宽是544GB/s，三种带宽的比例关系为1:16:272。

免责声明

隐私政策

用户协议

目录 22

0{{catalogNumber[index]}}. {{item.title}}