超标量

更新时间:2024-01-31 16:42

超标量(superscalar)CPU架构是指在一颗处理器内核中实行了指令级并行的一类并行运算。这种技术能够在相同的CPU主频下实现更高的CPU吞吐率(throughput)。

简介

超标量(superscalar)CPU架构是指在一颗处理器内核中实行了指令级并行的一类并行运算。这种技术能够在相同的CPU主频下实现更高的CPU吞吐率(throughput)。

原理

超流水线是通过细化流水、提高主频,使得在一个机器周期内完成一个甚至多个操作,其实质是以空间换取时间。例如Pentium 4的流水线就长达20级。将流水线设计的步(级)越长,其完成一条指令的速度越快,因此才能适应工作主频更高的CPU。但是流水线过长也带来了一定副作用,很可能会出现主频较高的CPU实际运算速度较低的现象,Intel奔腾4就出现了这种情况,虽然它的主频可以高达1.4G以上,但其运算性能却远远比不上AMD 1.2G的速龙甚至奔腾III

流水线技术、超标量。流水线(pipeline)是 Intel首次在486芯片中开始使用的。流水线的工作方式就象工业生产上的装配流水线。在CPU中由5~6个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成5~6步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高了CPU的运算速度。超流水线是指某型 CPU内部的流水线超过通常的5~6步以上,例如Pentium pro的流水线就长达14步。将流水线设计的步(级)数越多,其完成一条指令的速度越快,因此才能适应工作主频更高的CPU。超标量是指在一个时钟周期内CPU可以执行一条以上的指令。这在486或者以前的CPU上是很难想象的,只有Pentium级以上CPU才具有这种超标量结构;这是因为现代的CPU越来越多的采用了RISC技术,所以才会超标量的CPU。

超标量体系结构基础

早期的单发射结构微处理器的流水线设计目标是做到每个周期能平均执行一条指令 ,但这一目标不能满足处理器性能增长的要求,为了提高处理器的性能, 要求处理器具有每个周期能发射执行多条指令的能力 . 与超长指令字( VLIW , Very Long Instruction Word) 结构的数字信号处理器相似 ,超标量结构的处理器每个时钟周期也并行发射和执行多条指令 . 区别在于 ,VLIW的处理器采用静态调度, 而超标量结构的处理器采用动态指令调度 ,在指令执行时根据资源 、数据相关等情况 ,决定是否并行执行指令. 超标量结构是当代多发射微处理器所广泛采用的微体系结构

在超标量微处理器中 ,每个周期可同时发射执行多条指令, 但指令的高发射频率也意味着相关所发生的频率也很高 ; 而且其结构决定了相关的复杂性 . 因此 ,相关的检测和解决策略的优劣将直接影响超标量处理器的性能 . 为了有效地处理相关, 需采用静态和动态调度技术相结合的方法 . 静态调度可在编译过程中减少相关的产生; 而动态调度可根据处理器的动态信息,发掘出更多的 ILP . 动态调度简化了编译器的设计 ,减小了编译代码对硬件的依赖, 但却是以大量的硬件开销为代价的.

在超标量处理器中, 指令的发射策略是指在指令的发射过程中, 所采取的相关检测方法和相关处理措施, 决定指令队列中指令的发射顺序, 其算法效率的优劣将直接影响超标量处理器的性能 . 设计高效的指令发射策略是实现高性能超标量处理器的前提. 在超标量处理器中 ,由于指令乱序执行 ,判断指令执行结束的条件更为复杂 , 因此设计超标量处理器时 ,应考虑采取一定的措施以实现精确中断.

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}