|
公司基本資料信息
|
按照NVIDIA的芯片編號(hào)習(xí)慣,目前GTX 680所使用的GK104其實(shí)只是一顆次頂級(jí)核心,將跟Fermi時(shí)代GF110與GF114的定位一樣。真正的Kepler旗艦應(yīng)該是GK110,而GK104的出現(xiàn)只能說(shuō)明NVIDIA已經(jīng)將游戲顯卡與計(jì)算顯卡徹底分開(kāi),GK104主要用于桌面市場(chǎng),GK110才是計(jì)算加速卡的殺手锏。
此前的幾次會(huì)議上,NVIDIA已經(jīng)公布了GK110架構(gòu)及Tesla K20的相關(guān)信息,現(xiàn)在借著SC 12會(huì)議的東風(fēng),NVIDIA正式發(fā)布了Tesla K20家族加速卡。Anandtech網(wǎng)站也對(duì)K20做了深入分析,我們來(lái)看一下這個(gè)71億晶體管打造的巨獸會(huì)有怎樣的實(shí)力。
NVIDIA新一代Tesla K20加速卡詳細(xì)規(guī)格
AMD新一代S系列加速卡詳細(xì)規(guī)格
先溫習(xí)一下之前傳言的規(guī)格,GK110有15組SMX單元,每組有192個(gè)針對(duì)雙精度運(yùn)算而設(shè)計(jì)的CUDA核心,總計(jì)2880個(gè)CUDA核心,6組GDDR5顯存控制器,位寬384bit,1.5MB L2緩存,雙精度浮點(diǎn)性能達(dá)到了單精度浮點(diǎn)的1/3。
目前Tesla K20有兩款型號(hào),最高端的是K20X,擁有14組SMX單元,2688個(gè)CUDA核心,位寬384bit,搭配6GB GDDR5顯存,等效頻率5.2GHz。核心頻率為732MHz,單精度浮點(diǎn)性能為3.95TFLOPS,雙精度則為1.31TFLOPS,TDP功耗235W,使用TSMC 28nm工藝制造,售價(jià)不會(huì)低于3199美元。
K20X之下還有K20,規(guī)格有所降低,只有13組SMX單元,2496個(gè)CUDA核心,單/雙精度性能分別為3.52/1.17TFLOPS。顯存頻率也是5.2GHz但是精簡(jiǎn)掉一組顯存控制器,位寬320bit,搭配5GB GDDR5顯存,頻率也只有706MHz,TDP則為225W,看來(lái)K20的規(guī)格與之前泄漏的消息是一致的。
K20X與K20的關(guān)系與之前Fermi時(shí)代的M2090與M2075相似,前者主要用于高性能場(chǎng)合,同時(shí)功耗也會(huì)更高,后者性能略低,不過(guò)TDP也降低了。
它們都可以使用被動(dòng)散熱,因?yàn)榇笮陀?jì)算機(jī)的散熱手段靠的主要是機(jī)房/機(jī)柜的主動(dòng)散熱,而K20還有可能作為面向工作站設(shè)計(jì)的下一代Maximus平臺(tái)的Quadro顯卡,因此也會(huì)有主動(dòng)散熱的產(chǎn)品面世。
K20X及K20最大的變化當(dāng)屬性能方面,M2090的雙精度浮點(diǎn)性能只有655GFLOPS,而K20X達(dá)到了1.31TFLOPS,M2075的雙精度性能只有515GFLOPS,而準(zhǔn)備取代它的K20也有1.17TFLOPS,新出的兩款產(chǎn)品相比前代都有了成倍的性能提升。
不過(guò)在單精度和雙精度的比值卻有所下降,GK110的雙精度性能只有單精度的1/3,而Fermi架構(gòu)的雙精度性能是單精度的1/2,K20X的單精度浮點(diǎn)性能為3.95TFLOPS。
說(shuō)到峰值FP32單精度性能,K20X依然不能取代4.5TFLOPS的Tesla K10,不過(guò)后者是基于兩個(gè)GK104核心的,缺少GK110架構(gòu)的部分關(guān)鍵性能,比如片內(nèi)ECC、HyperQ、Dynamic Parallelism動(dòng)態(tài)并行等技術(shù)。因此目前已經(jīng)使用K10的用戶沒(méi)必要升級(jí)到K20,只有那些對(duì)雙精度FP64性能有較高要求的用戶才有必要升級(jí)。
Tesla K20發(fā)布之后將會(huì)面對(duì)許多競(jìng)爭(zhēng)者,有新也有舊。宏觀層面來(lái)看,使用K20建設(shè)的HPC比如美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室的Titan超級(jí)計(jì)算機(jī)會(huì)面臨著IBM“藍(lán)色基因”等計(jì)算機(jī)的競(jìng)爭(zhēng),雖然Titan的性能早已大大超過(guò)后者。
Titan超級(jí)計(jì)算機(jī)的一個(gè)節(jié)點(diǎn)由4個(gè)AMD Opteron處理器和4個(gè)Tesla K20加速卡組成
K20也將會(huì)面臨AMD FirePro S1000、Intel Xeon Phi(正好也在SC 12會(huì)議上發(fā)布了)等產(chǎn)品的競(jìng)爭(zhēng),后兩者的雙精度浮點(diǎn)性能也達(dá)到了1TFLOPS以上,不過(guò)他們的不足在于理論性能跟實(shí)際性能并不對(duì)等,所以NVIDIA的Telsa K20還是會(huì)有很強(qiáng)的競(jìng)爭(zhēng)力,至少有30%以上的性能優(yōu)勢(shì)。
另外,在支持環(huán)境上NVIDIA也有優(yōu)勢(shì),Tesla K20依賴的環(huán)境是已經(jīng)成熟的CUDA,而AMD FirePro依賴的是OpenCL,Xeon Phi則是X86,都還很需要時(shí)間考驗(yàn)。
價(jià)格方面,NVIDIA早前公布的K20報(bào)價(jià)是3199美元,但是這次出來(lái)兩個(gè)型號(hào),最有可能的情況將是K20報(bào)價(jià)3199美元,而K20X報(bào)價(jià)在4000-5000美元之間。
NVIDIA方面對(duì)出貨數(shù)量保持沉默,只表示初期可能有些供不應(yīng)求,服務(wù)器合作伙伴可以向NVIDIA先行預(yù)定。有趣的是NVIDIA在之前的財(cái)報(bào)中表示K20的產(chǎn)能非常好,因此NVIDIA的問(wèn)題是如何滿足客戶需求而不在生產(chǎn)制造過(guò)程中。