Name | Architecture | GPU Chip | PCIE | Memory | cores | FP32 performance
(TFLOPS) |
FP16 performance
(TFLOPS) |
Bandwidth(GB/s) | tensor cores | power(W) |
Tesla T4 | Turing | TU104 | 3.0-X16 | 16GB, GDDR6, 256 bit | 2560 | 8.141 | 65.13 | 320 | 320 | 70 |
Name | Architecture | GPU Chip | PCIE | PCIE(GB/s) | nvlink(GB/s) | Memory(GB) | Bandwidth (GB/s) |
core cores | (TFLOPS) | tensor cores | tensor core TOPS | power(W) | |||||
FP32 | FP16 | TF32 | BFLOAT16 | FP16 | INT8 | INT4 | |||||||||||
GTX 1080Ti | Pascal | GP102 | 3.0-X16 | 32 | – | 11 | 484.4 | 3584 | 11.34 | 0.177 | – | – | – | – | – | – | 250 |
RTX 2080Ti | Turing | TU102 | 3.0-X16 | 32 | – | 11 | 616 | 4352 | 13.448 | 26.9 | 544 | – | – | 107 | 215 | 430 | 250 |
RTX3070 | Ampere | GA104 | 4.0-X16 | 64 | – | 8 | 512 | 5888 | 20.31 | 40.63 | 184 | 81.5 | 163 | 163 | 326 | 652 | 220 |
RTX3080 | Ampere | GA102 | 4.0-X16 | 64 | – | 10 | 760 | 8704 | 29.77 | 59.54 | 272 | 119 | 238 | 238 | 476 | 952 | 320 |
RTX3090 | Ampere | GA102 | 4.0-X16 | 64 | – | 24 | 935.8 | 10496 | 35.58 | 71.16 | 328 | 143 | 285 | 285 | 570 | 1140 | 350 |
A100 | Ampere | GA100 | 4.0-X16 | 64 | 600 | 40 | 1555 | 6912 | 19.49 | 77.97 | 432 | 156 | 312 | 312 | 624 | 1248 | 250 |
A100有PCIE和nvlink两种卡,nvlink卡支持8卡nvlink通信带宽600GB/s,PCIE卡支持多卡P2P通信带宽64GB/s
PCIE卡两卡之间可以用nvlink桥连
1、PCI-E x16插槽全长89mm,有164根针脚,靠主板外侧端有一卡口,将16x分为前后两组,较短的插槽有22根针脚,主要用于供电,较长的插槽142根,主要用于数据传输,具有16通道所带来的高带宽。
PCI-E x16插槽,主要用于显卡以及RAID阵列卡等,这个插槽拥有优良的兼容性,可以向下兼容x1/x4/x8级别的设备。可以说是PCI-E x16插槽是PCI-E的万能插槽。
由于PCI-E x16插槽常用于显卡,与cpu处理器直接相通,在物理位置上直接靠近cpu,这样显卡与处理器之间的数据交换就可以减少延迟,让系统的性能可以得到充分的发挥。
2、PCI-E x8插槽全长56mm,有98根针脚,与PCI-E x16比较,主要是数据针脚减少至76根,短的供电针脚仍然是22针脚。
为了兼容性,PCI-E x8插槽通常加工成PCI-E x16插槽的形式,但数据针脚只有一半是有效的,也就是说实际带宽只有真正的PCI-E x16插槽的一半。可以观察主板布线,x8的后半段没有线路连接,甚至针脚也没有焊接。
实际上除了旗舰级的主板,能提供多条真正的PCI-E x16插槽外,主流级主板,只会提供一条真正的PCI-E x16插槽,就是最靠近cpu的那条。而第二条和第三条PCI-E x16插槽,则多数是PCI-E x8甚至是x4级别的。
3、PCI-E x4插槽的长度为39mm,同样是在PCI-E x16插槽的基础上,以减少数据针脚的方式实现,主要用于PCI-E SSD固态硬盘,或者是通过PCI-E转接卡安装的M.2 SSD固态硬盘。
PCI-E x4插槽通常由主板芯片扩展而来,不过随着cpu内部PCI-E通道数的增多,现在有部分高端主板可以开始提供直连cpu的PCI-E x4插槽,用于安装PCI-E SSD固态硬盘。
主板上为什么找不到PCI-E x4插槽?其实它是以M.2接口的形式出现的。
不过与PCI-E x8插槽一样,PCI-E x4插槽为了兼容性,现在多数也是做成PCI-E x16插槽的形式,或是扩展为M.2接口,用于安装M.2 SSD、M.2无线网卡或者其它M.2接口设备,其余扩展卡则留给PCI-E x1插槽负责。
4、PCI-E x1插槽的长度是最短的,仅有25mm,相比PCI-E x16插槽,其数据针脚是大幅度减少至14个。PCI-E x1插槽的带宽通常由主板芯片提供,主要用途是独立网卡、独立声卡、USB 3.0/3.1扩展卡等都会用到PCI-E x1插槽,甚至可以通过转接线给PCI-E x1插槽装上显卡,用来挖矿或者实现多屏输出。
Version | Intro- duced |
Line code | Transfer rate[i][ii] |
Throughput[i][iii] | ||||
---|---|---|---|---|---|---|---|---|
x1 | x2 | x4 | x8 | x16 | ||||
1.0 | 2003 | 8b/10b | 2.5 GT/s | 0.250 GB/s | 0.500 GB/s | 1.000 GB/s | 2.000 GB/s | 4.000 GB/s |
2.0 | 2007 | 8b/10b | 5.0 GT/s | 0.500 GB/s | 1.000 GB/s | 2.000 GB/s | 4.000 GB/s | 8.000 GB/s |
3.0 | 2010 | 128b/130b | 8.0 GT/s | 0.985 GB/s | 1.969 GB/s | 3.938 GB/s | 7.877 GB/s | 15.754 GB/s |
4.0 | 2017 | 128b/130b | 16.0 GT/s | 1.969 GB/s | 3.938 GB/s | 7.877 GB/s | 15.754 GB/s | 31.508 GB/s |
5.0 | 2019 | 128b/130b | 32.0 GT/s | 3.938 GB/s | 7.877 GB/s | 15.754 GB/s | 31.508 GB/s | 63.015 GB/s |
6.0 (planned) | 2021 | 128b/130b + PAM-4 + ECC | 64.0 GT/s | 7.877 GB/s | 15.754 GB/s | 31.508 GB/s | 63.015 GB/s | 126.031 GB/s |
- https://en.wikipedia.org/wiki/PCI_Express
评论前必须登录!
注册