推廣 熱搜： 視頻會議服務器 IBM 交換機思科軟件磁盤陣列 MCU 投影機 CAB

英偉達特斯拉 K20c 超算GPU另有K40

點擊圖片查看原圖

品牌：	英偉達
型號：	K20C
單價：	18000.00元/片
起訂：	1 片
供貨總量：	20 片
發貨期限：	自買家付款之日起 3 天內發貨
所在地：	北京
有效期至：	長期有效
最后更新：	2014-05-09 14:19
瀏覽次數：	3180

公司基本資料信息

北京思騰創新科技發展有限公司
已繳納 0.00 元保證金
聯系人張瑜(先生)
會員 [當前離線] [加為商友] [發送信件]
電話010-51627561
手機18210075131
地區北京
地址海淀區北三環西路48號科技會展中心A座18a

詳細說明

北京思騰創新科技特斯拉運算卡北方區總代

聯系人：張瑜 18210075131
Tesla K20與GK110架構

NVIDIA對K20的描述是“3倍雙精度浮點性能”，并有Hyper-Q、Dynamic Parallelism等多種并行計算技術加持，這些是現有的GK104架構不具備的。

NVIDIA的PDF資料中介紹了GK110的SMX架構，也是192個CUDA核心

點擊查看原圖

必須要承認，以前泄露的有關GK110架構的消息是錯誤的，GK110的SMX架構其實跟GK104還是一樣的，都是192個CUDA核心，32組SFU單元以及32個LD/ST單元。

GK110架構圖
點擊查看原圖

除去其他的功能單元之外，GK110核心總共有15組SMX單元，2880個CUDA核心，
但是Heise聲稱并非所有單元都是啟用的，實際上可能只有13-14組SMX單元，實際CUDA核心是2496或者2688個。
顯存位寬是384bit，已為黃仁勛和NVIDIA CTO確認
。
由于CUDA核心數已經低于之前的報導，顯存位寬降到384bit也是很自然的事，如果保持GK104的6Gbps顯存速率，那么GK110的帶寬將達到288GB/s，終于超過AMD GCN架構的260GB /s了。

NVIDIA給出的3倍雙精度浮點性能不知是跟GF110顯卡還是跟GF110核心的Tesla加速卡做的比較，GF110的單精度浮點能力為1.58TFLOPS，顯卡中的雙精度為單精度的1/ 4，也就是0.4TFLOPS，但是GF110核心的Tesla卡雙精度能力可達單精度1/2，大約是0.8TFLOPS。
如此一來，如果以顯卡為基礎，GK110的雙精度浮點性能大約是1.2TFLOPS以上，如果是Tesla卡的3倍，那就是2.4TFLOPS以上，鑒于后者已經超出之前傳聞的2TFLOPS的能力， GK110的雙精度浮點能力應該是1.2TFLOPS或更高
。

Tesla K20配置了6pin+8pin供電接口
點擊查看原圖

核心面積和TDP未知，不過K20配備的是6pin和8pin供電接口，最大TDP不會超過300W。
晶體管數量也是一個70億，準確點說是71億。
◆ GK110并行計算技術介紹
顯卡規格方面的信息基本就是這么多了，再來看一下NVIDIA為GK110所增加的新技術吧。

Dynamic Parallelism（動態并行）
點擊查看原圖

GK110架構的首要目標之一就是使程序員更方便地調用GPU強大的并行計算能力
。
傳統的模式下，GPU每次操作都需要CPU的參與，而Dynamic Paralleliom的存在使得GPU接收數據時會動態刷新線程而無需CPU參與。
由于內核有了獨立加載工作負載的能力，動態并行技術允許程序直接在GPU上運行。
這項技術的好處就是可以降低編程的復雜性，原本需要200-300行代碼才能完成的工作在GK110顯卡上只需要30行就可以了。

Hyper-Q
點擊查看原圖

上一項技術強調的是簡化操作，是給CPU減負，而Hyper-Q則是增加了CPU同時加載工作的核心數，是在提升=高CPU的利用率，避免CPU過多的閑置。

Fermi架構中CPU只能同時運行一個MPI（Message Passing Interface消息傳遞接口）任務，但是在GK110架構中CPU同時運行的MPI任務數多達32個。
傳統的MPI任務主要基于多核CPU應用，與GPU強大的并行計算能力相比，CPU處理的MPI任務量實在是太小了，往往會帶來虛假的GPU依賴性，導致GPU的性能無法有效利用， Hyper-Q大幅提高了CPU可以分配給GPU的MPI任務量，如果同時傳遞32個任務給GPU，那么理論性能會達到Fermi架構的32倍，實際應用中雖然不會這么夸張，但是優化調度之后GPU的并行計算能力還是會有改善。

GPU Direct
點擊查看原圖

    GPU Direct直連是NVIDIA官方PDF中沒有提到的，不過依然值得解釋一下。 NVIDIA已經推出了基于Kepler架構的GeForce GRID云游戲技術，那么使用Kepler顯卡的服務器就免不了要互相交換數據。 GPU Direct技術可以讓服務器的中不同顯卡直接讀取顯存的數據，甚至不同服務器之間的顯卡也可以通過網卡讀取另一塊顯卡顯存中的數據，簡單來說就是提高了顯卡的數據交換能力，所需的步驟更少，延遲更低。

CUDA 5

    要想使用上面介紹的技術就必須使用新的CUDA 5，GTC大會上NVIDIA已經發布了一個預覽版的CUDA 5 SDK，正式版將在今年三季度發布。

    Kepler顯卡發布之后，Tesla家族也終于迎來架構更新，而且很快就會有更新架構的Tesla加速卡，得益于GK104良好的效能比，NVIDIA的Tesla加速卡也具備了這樣的能力，性能更強的同時功耗更低。
新一代GK110架構重點針對GPU計算性能做了加強，雙精度浮點能力提升到之前架構的三倍，并有動態并行、Hyper-Q、GPU Direct等技術輔助，無論是易用性還是性能都有明顯改善，擔當起GPU計算的光榮使命了。

更多>本企業其它產品