|
公司基本資料信息
|
全新Tesla® K20 系列產(chǎn)品基于革命性的 NVIDIA® Kepler™ 計(jì)算架構(gòu),其中包括 NVIDIA® Tesla® 加速計(jì)算產(chǎn)品系列中的旗艦產(chǎn)品 Tesla® K20X 加速器。
K20X 的計(jì)算性能開創(chuàng)了單顆處理器史上最高紀(jì)錄,在與領(lǐng)先的CPU 搭配使用時(shí)可令應(yīng)用程序速度提升十倍。(2) 在兩大常見計(jì)算性能衡量指標(biāo)上,K20X 超過了所有其它處理器 – 單精度與雙精度的峰值浮點(diǎn)性能分別為 3.95 Teraflops 和 1.31 Teraflops。
這一全新系列還包括 Tesla® K20 加速器,其單精度和雙精度的峰值性能分別為 3.52 Teraflops 和 1.17 Teraflops。Tesla® K20X 與 K20 GPU 加速器標(biāo)志著,在過去的三十天里已經(jīng)實(shí)現(xiàn)了 30 Petaflops 以上的性能。這相當(dāng)于去年十強(qiáng)超級(jí)計(jì)算機(jī)的計(jì)算性能總和。
蘇黎世理工學(xué)院計(jì)算物理學(xué)教授兼瑞士國(guó)家超級(jí)計(jì)算中心總監(jiān) Thomas Schulthess 博士表示: “我們正在利用 NVIDIA® (英偉達(dá)™) GPU 架構(gòu)來(lái)大幅加速諸多領(lǐng)域中的模擬,這些領(lǐng)域包括氣候與氣象學(xué)、地震學(xué)、天體物理學(xué)、流體力學(xué)、材料科學(xué)以及分子生物物理學(xué)。K20 系列加速器標(biāo)志著計(jì)算方面在 NVIDIA® (英偉達(dá)™)上一代 Fermi 架構(gòu)上實(shí)現(xiàn)了重大飛躍,該系列加速器不但提升了生產(chǎn)率,而且讓我們有可能得出全新的深刻見解,這在之前是不可能實(shí)現(xiàn)的。”
基于開普勒大核心GK110、擁有71億個(gè)晶體管的Tesla K20終于正式發(fā)布了,而且還有更高端的Tesla K20X。
Tesla K20X擁有十四組SMX、2688個(gè)流處理器,屏蔽了一組192個(gè),但同時(shí)啟用完整的384-bit顯存位寬和1.5MB二級(jí)緩存,搭配6GB GDDR5。頻率方面核心定在732MHz,浮點(diǎn)性能為單精度FP32 3.95TFlops、雙精度FP64 1.31TFlops(這代3:1上代費(fèi)米2:1),顯存頻率則是5.2GHz,帶寬達(dá)249.6GB/s。
事實(shí)上,美國(guó)橡樹嶺國(guó)家實(shí)驗(yàn)室的新一代超級(jí)計(jì)算機(jī)“泰坦”里配備的就是Tesla K20X,而不是Tesla K20,只不過之前雙方都口風(fēng)甚緊,誰(shuí)也沒有明說(shuō)。泰坦此番不僅成功登頂超算王者,拿下世界性能第一,還在能效上超越了半年前的綠色超算第一名。
Tesla K20又放棄了一組SMX和一個(gè)顯存控制器,因此有2496個(gè)流處理器、320-bit位寬,顯存容量5GB GDDR5,二級(jí)緩存也對(duì)應(yīng)地減少到1.25MB。核心頻率也略降至706MHz,因此浮點(diǎn)性能減少為單精度3.52TFlops、雙精度1.17TFlops,而顯存頻率仍然是5.2GHz,帶寬為208GB/s。
Tesla K20X的熱設(shè)計(jì)功耗為235W,Tesla K20則降低到225W——別小看了這區(qū)區(qū)10W,225W正是絕大多數(shù)服務(wù)器和機(jī)柜所允許的擴(kuò)展卡最大TDP,再高就需要定制了,AMD 375W的雙芯型FirePro S10000就比較麻煩。二者都提供主動(dòng)和被動(dòng)散熱,供客戶選擇。
相比之下,上一代費(fèi)米架構(gòu)的Tesla M2090/M2070Q只有30億個(gè)晶體管、最多512個(gè)流處理器、384-bit 3.7GHz 6GB GDDR5顯存,浮點(diǎn)性能最高單精度1.33TFlops、雙精度655GFlops,熱設(shè)計(jì)功耗最高250W。AMD FirePro S10000單精度高達(dá)5.91TFlops,雙精度也有1.48TFlops,比之Tesla K20X分別高出50%、13%,但到了實(shí)際生態(tài)里顯然還是Tesla更有優(yōu)勢(shì)。