“堅持你相信的,相信你堅持的。”10月24日傍晚,阿里巴巴集團CTO王堅在杭州華通云數據中心為“飛天5K”的雕塑揭幕時再次重復了這句刻在上面的話。該雕塑還刻下了以下字句:2013年8月15日,阿里巴巴集團正式運營服務器規模達到5000(5K)的“飛天”集群,成為中國第一個獨立研發擁有大規模通用計算平臺的公司,也是世界上第一個對外提供5K云計算服務能力的公司。
作為2013年阿里云開發者大會開幕的日子,10月24日這一天還有兩層含義,一是1024等于2的10次方,被很多開發者當成“程序員節”,二是5年前的這一天阿里巴巴開始研發“飛天5K”集群。
按照阿里云公布的數據,飛天5K單點集群擁有超過10萬核計算的能力、100PB存儲空間,可處理15萬并發任務數,承載億級別文件數目。飛天5K單點集群的100TB排序能在30分鐘完成,遠超今年7月1日Yahoo在Sort Benchmark排序測試Daytona Gray Sort所創造的世界紀錄——100TB排序完成時間約71分鐘。
10月24日,王堅拿著大話筒在杭州華通云數據中心旁為“飛天5K”的雕塑揭幕時強調,“堅持你相信的,相信你堅持的。”他表示,“這5000臺機器就在雕塑背后的華數數據中心大樓的機房中,阿里金融的大數據的處理就在這個機房做出來的。”(蔣湘輝 攝)
圖注:“飛天5K”雕塑的四個面,分別是飛”“天”、“5”、“K”四個大字,其中在“天”字和“K”字的下方刻上了200多位阿里云參與研發的所有人員的姓名,王堅表示,名單里還包括已經從阿里云離職的貢獻者。(蔣湘輝 攝)
談及飛天5K項目的感受,王堅特別提到“阿里云的一位參與項目的同學,女朋友周末從合肥趕到杭州來陪他加班,默默無聞任勞任怨。只為了5K夢想順利達成, 而我們一定要把他倆的名字能一起留在飛天5K的標志上。”
圖注:阿里云開發者大會圍墻上王堅的漫畫以及“云的蝴蝶效應”主題涂鴉(蔣湘輝攝)
圖注:阿里云開發者大會圍墻上“飛天5K”的涂鴉(蔣湘輝 攝)
對大規模分布式離線存儲和計算集群來說,擴展性一直是其生命線。如果原有集群不能通過加機器來增加存儲空間和計算能力時,那么就將無法繼續支撐離線計算業務。因此,為了突破集群存儲的瓶頸,包括阿里云飛天團隊在內的多個團隊緊密協作,主攻集群跨機房計算,終于在2013年8月正式運營。按照阿里云提供的資料,目前只有Google、Facebook的集群規模有能力按照5000量級來劃分,而此前國內還沒有這樣的技術。
圖注:王堅在10月25日的主題演講中還表示,“云計算可以讓一家傳統公司變成一家互聯網公司。天弘基金從倒數第2做到前5,后臺的技術支撐就用到了阿里云平臺。”據悉,深圳華大基因和澳門科技大學也已經使用飛天5K進行基因的測序工作。(蔣湘輝 攝)