|
G8X GPU技术分析:6.Steam Processing架构的运作
对geometry shader有了一定认识以后,我们现在具体看看Steam Processing架构的运作。
Geoforc8800 GPU通过一定数量的SP去完成shader操作,相邻的SP可以十分方便的分组发挥并行操作的威力,在Geforce8800 GPU架构中,每16个SP分为一组。
不同属性基础的数据流在整合了专门高速指令解和执行逻辑的SP和一些类似的操作中执行,内建的Cache快速的存储SP的输出,而这些Cache又可以作为input被其他的SP读取。SIMD操作非常高效地在已被分组的SP集合里面执行。

下图可以看到streaming processors和联立的texture Flitering(TF)和texture addressing(TA)。显然内建的L1/L2 Cache确保了平衡的设计,这是一个典型的Geforce8800 GPU unified shader设计。128个streaming processors并行构成了8800GTX的shader架构。每个SP都是通用的、不相关的和标量地,可以同时进行MAD和MUL操作,支持IEEE 754精度的浮点。
|