詳細說明
js_op>js_op>js_op>
NVIDIA要出Tesla K80的傳聞之前就有了,8月份就有人從NVIDIA的驅動程序中發現了Tesla K80的蛛絲馬跡,當時認為K80是基于雙芯的GTX Titan Z,擁有5760個CUDA核心,顯存容量甚至高達24GB,不過NVIDIA現在推出的Tesla K80有些奇怪,顯存容量24GB倒是準了,但是核心并不是完整的GK110,而是全新的GK210,CUDA核心數量為2496個,不同于之前Titan顯卡的2668個,也不同于GTX 780 Ti的2880個,也不是GTX 780的2304個。
Anandtech網站列出的Tesla K80規格表
從規格上來看,GK210核心的Tesla K80核心頻率降低到了562MHz,加速頻率875MHz,但性能要比之前的Tesla K40強,單精度浮點性能8.74TFLOPS,雙精度浮點性能2.91FLOPS,即便是砍掉一半,GK210核心的性能看起來也要比GK110核心更強。
其他規格上,Tesla K80確實擁有2x12GB顯存,位寬384bit,頻率5GHz,帶寬240GB/s,也有所降低,TDP功耗300W,被動散熱,發布售價為5000美元,約合人民幣30620元,比Tesla K40的5499美元還要便宜。
Tesla K80規格及亮點
黃總又在PPT上欺負Intel處理器了
GK210核心之謎
算上現在的這個GK210核心,NVIDIA在GK110家族中一共出了3個不同的GK110核心了,他們的完整版都是15組SMX單元,2880個CUDA核心,不過細節上有所不同,NVIDIA做了不同程度的調整。
Anandtech網站的GK110家族核心規格表
總的來說,NVIDIA并沒有改變CUDA核心數或者CUDA的架構,他們改進的只是SMX單元之間的內存子系統,GK110(B)的SMX單元擁有256KB寄存器文件,64KB共享緩存,GK210的規模翻倍,擁有512KB寄存器文件,128KB共享緩存,因此它改進了SMX單元的數據吞吐量,提高了效率,確保CUDA核心的更容易頻繁使用。
NVIDIA以前沒有這么做過,這也是第一次看到GPU往這個方向改進。這也就是說,這反應了GPU市場的變化,而這也意味著Kepler在未來一段時間還會繼續陪伴著我們。(Maxwell架構雖然高效,不過雙精度設計上GK110還是更強,估計得到GM210之后再說更強的Tesla加速卡了。)
Anandtech網站自制的GK210核心示意圖,非官方表格
NVIDIA這么做是希望針對HPC市場改進他們的GPU,修正勘誤表,降低功耗(同時也是提升性能),這也是他們為何能在300W TDP下作出雙芯的Tesla K80(作為對比,GTX Titan Z使用的是完整版GK110核心,TDP為375W)。
還有一個問題就是GPU Boost技術,之前的Tesla K40加速卡上的GPU加速技術相比消費級GPU效果有限,嚴重受限于TDP,通常只有特定的3個加速頻率,而Tesla K80上NVIDIA使用了與消費級GPU相同的GPU加速技術,只要TDP允許,K80會盡可能地加速。
Tesla K80是雙芯設計,它的性能指標看起來比K40高得多,不過實際上不一定總是超過K40,因為單個GPU的規格比K40低,而且它的基礎頻率更低,不過K80主要的應用環境顯然都是對多路GPU優化較好的,所以Tesla K80還是要快得多。
此外,高密度應用也會很有趣,300W的TDP是個挑戰,不過在1U機架內還是可以放下8個GK210顯卡的,這樣一來其FP64雙精度浮點性能將超過10TFLOPS。
?