核心带宽怎么算,显存带宽、核心频率、显存之间是什么关系才算完美
发布网友
发布时间:2022-05-09 13:24
我来回答
共3个回答
热心网友
时间:2024-01-30 16:00
1.
每秒钟134.4GB/s或者72GB/s的数据由谁(哪个部件)负责执行处理?:
。显存带宽是指GPU与显存之间的数据传输频率(不是PCI-E带宽,现在最先进的PCIE3.0最 大带宽才32G/S,还是理论值呢,实际还慢。内存带宽也与显存带宽没有毛关系,~~楼主你理 解错了吧~~)
。下面用你的水管比喻来解下究竟GPU能不能处理如此大的数据量;
。显存是水池,GPU是水处理器,带宽是水管。请注意这水管是双向的,水处理器(GPU)通 过水管(带宽)从水池(显存)抽水;同时水处理器(GPU)通过水管(带宽)向水池(显 存)注水(要不注水GPU处理后的数据放哪呢?直接放到屏幕?处理数据没有这么简单吧,要 多次处理才行,有兴趣看下汇编语言~~),如此一来,输送向GPU的带宽就更少了。
。如此大量的数据主要用流处理器(SP)处理,一个显卡流处理器多少?
HD4870 800个
hd5870 1600个
HD7990 4096个
GTXtitan 2688个
拿HD7990为例(带宽为576G/s),一个流处理器要处理多少数据?
576/4096=0.14G/s
十年前的赛扬(单核)数据吞吐量:
0.4X64/8=3.2G/S (基本是最差的DDR内存)
由此看来,显卡单个SP带宽真是小的可怜实际更小,由于双向传输数据,实际更小~~提高带 宽迫在眉睫。
2. “核心带宽”没有这个概念,具体如何算我也不知道
3. “840MHz或者900MHz核心频率的GPU带宽有134.4GB/s或者72GB/s吗?”
。由以上分析只能算出提高带宽的必要,1个840MHz或者900MHzsp实际能处理多大数据,估 计只有AMD/NVIDIA知道(设计GPU和显卡当然不是乱来,其数字电路设计处处都是计算来的, 你可以看看《数字电路基础》验证下,没有数学就没有电脑。AMD公司内部也必然有SP相关 数据,配置合适的显存),但是几千个SP也足以让带宽告急
。不过实际看来是有的,而且比如只帮助显存超频可以提高显卡性能,研究员们也在不断提高显存频率
。下面通过实际情况看下几千个SP构成的GPU到底有多快:
CPU:
Intel Xeon 3.6 GHz: <1.8 GFLOPS
Intel Pentium 4 HT 3.6Ghz: 7 GFLOPS
Intel Core 2 Duo E4300 14 GFLOPS
Intel Core 2 Duo E8400 24 GFLOPS
AMD Phenom 9950: 29.05 GFLOPS
Intel Core 2 Quad Q8200 37 GFLOPS
Intel Core 2 QX9770: 39.63 GFLOPS
AMD Phenom II x4 955: 42.13 GFlopS
Intel Core i7-965: 69.23 GFLOPS
Intel Core i7-980 XE : 107.6 GFLOPS
Intel Core i5-2500K @4.5GHz: 123.35 GFLOPS (w/AVX instruction set)
IBM POWER7: 264.96GFLOPS[2]
GPU:
PU:
nVIDIA Geforce 8800 Ultra(G80-450 GPU):393.6 GFLOPS
nVIDIA Geforce GTX 280(G200-300 GPU):720 GFLOPS
AMD Radeon HD 3870(RV670 GPU):497 GFLOPS
AMD Radeon HD 4870(RV770 GPU):1008 GFlops
AMD Radeon HD 7990 Tahiti :5.18 TFlops
nVIDIA Geforce GTX 580(GF110-375 GPU):2.37 TFLOPS
AMD Radeon HD 6990(R900 GPU):4.98 TFLOPS
Earth Simulator: 35.61 TFLOPS
Blue Gene/L: 135.5 TFLOPS
中国曙光Dawning 5000A: 230 TFLOPS PFLOPS
说明:
flops是单位,g,t,p是数量级
1000000G=1000T=1P
楼主只要对比i7和HD7990就可以了,
HD7990与I7运算能力相比;
5180/107.6=48倍
接近50倍
HD7990运算能力是i7的50倍!!
i7内存带宽(单通道DDR3 1600高端内存):13GB/S
HD7990带宽:576GB/S
带宽倍数:
576/13=44倍
由此可见,带宽设计是合理的,并且还得继续提高~~
热心网友
时间:2024-01-30 16:01
核心频率是指GPU的运算频率,目前最新一代的N卡用的是流处理器与核心速度等品运行,在开普勒之前,上代8系之后用的都是流处理器主频与核心主频异步运行。异步主要是当时流处理器单元以高于核心一倍或是以上速度运行,以满足核心的总计算能力。NV的每个流处理器单元都是以1D+1D+1D+1D+1D的模式运行,运算效率很高。(而同代竞争对手的AMD-ATI用的是1D+4D,与2D+3D,的模式进行图形运算,这种情况下,显卡有比较极端的运算量。但在执行CPU分配给显卡GPU的任务中,并不是所有任务都要用到4D,2D运算,而是综合的,假如这次执行一次3D任务,那么AMD的显卡要用到1D+2D的方法进行运算,这时候省下的一个2D就没有用了。而NV的全部是1D,那么无论用到几D的模式都能任意组合,效率肯定要高。)。但是呢,核心速度上去了,而GPU的内部缓存是很小的,那么这些东西要放到哪儿去呢,这时候需要用到显存来进行存储。现在的显卡用到了GDDR5的显存了,那么相对于上一代的等效频率是高了一倍的(同样,4高于3代一倍,以此类推)在显存位宽不变的情况下速度就上去了。目前主流的显卡从64位-512位都有,如果说显存频率是高速公路的一条车道,那么显存位宽就相当于是多条车道,速度会成倍增长的。
计算公式很简单,现在显存给的都是等效频率,你只要用
等效主频X位宽/8/1024=每秒显存带宽(除以8是将bit转换成Bit,除以1024是将MB转化成GB)
热心网友
时间:2024-01-30 16:01
目前的显卡带宽和频率显存基本都是合理搭配的。带宽和显存只体现一方面,处理单元的数量也是很关键的。能做出成品显卡,自然不会搭配不合理,浪费了显卡的功能。如GT610,位宽就是64bit,让他用128bit就浪费了,因为它的处理单元和频率性能达不到这么大带宽。总体来讲以上参数(频率,处理单元数,带宽(位宽),显存,显存频率)都是越高越好,越多越好,但是高了成本也高。
综合起来,先看核心构架,处理单元数,然后是显存和显存频率,为满足以上最大性能,位宽会按照以上最大决定,最大带宽也就限定好了。比如泰坦,位宽384bit,690位宽512bit,这是为了让性能更好地发挥。