发布网友 发布时间:2022-04-30 10:49
共1个回答
热心网友 时间:2022-06-21 10:14
苹果新A7处理器采用PowerVR 6核心架构。PowerVR 6架构为统一超标量渲染引擎,着色器阵列设计,以四个着色器为一个SIMD 阵列设计。A7所采用的是IMG PowerVR G6430,4 个SIMD 阵列设计。
瑞芯微RK3288所采用的Mali-T764支持特性并不逊色于A7的PowerVR G6430。Mali-T764采用的是ARM最新的第三代MIDgard架构,也是采用当前PC上GPU一样的统一渲染架构,特点就是在提升通用处理功能的同时,依然保持足够的图形处理效率,包括有64-bit双精度浮点运算和64-bit整数运算,64-bit寻址,shader单元间的内存同步。不过,相对于PowerVR 6430核心所采用分解矢量引擎和scalar引擎的SIMD构架,Mali-T764的运算管线采用128-bit矢量引擎设计,拥有灵活的管线配置。特别是作为Mali –T700系列的最高型号,Mali-T764通过单一的调度机制,每个核心群都会分到相同的处理任务,可以根据需要实现性能最佳化。可以说,如果从硬性配置上,两者势均力敌,但在运算管线设计上Mali-T764更胜一筹。 A7的PowerVR G6430的性能来看,与A6X处理器PowerVR 554MP4相差不大:同频下浮点性能和iPad4上的SGX554MP4相同,三角填充率及纹理性能是SGX554MP4的两倍。
?Mali-T764每个着色器都配有四个ALU(算数逻辑单元)、一个LSU(本地存储单元)、一个纹理单元。而且Mali-T764的四个着色器族组都拥有独立的共享L2缓存的核心群,四个核心群之间则通过单一的dispatcher,每个核心群都会分到相同的处理任务。更重要的是,各个shader均拥有独立的线程调度,可对各自的管线分配来自各个线程的程序指令,从而使得各个管线可灵活用于执行来自各自线程的指令,这样如果有128条管线,那么就可以同时运行128个线程,而Mali-T764的shader单元最多能够控制800个以上的线程。这种灵活的线程调度方式,让Mali-T764的shader单元拥有更高的运算效率,甚至拥有媲美于桌面PC般的图形性能。
Mali- T760在搭配16个核心600MHz下,色器性能峰值为326.4 GFLOPS、1066M三角形生成率及9600M像素填充率,此时完胜于A7的PowerVR G6430。由于Mali- T764只搭配4个核心,因此性能只有Mali- T760mp16的四分之一,另外mali系列计算浮点为FP16情况下,而其他厂商GPU皆在FP32下计算,因此Mali- T760浮点性能实际上只有宣传数值一半左右的浮点性能,mali T764FP32下浮点为81.6 GFLOPS,实际FP16下浮点大约只有40.8 GFLOPS,而G6230在600mhz下FP16为 76.8GFLOPS,因此T764性能比不上G6230,但差距不太大。