推廣 熱搜： 集成系統(tǒng)集成弱電軟件 kvm 思科服務(wù)器視頻會議拼接 SFP

百萬用戶規(guī)模的系統(tǒng)如何擴(kuò)展

日期：2014-04-17 來源：High Scalability 作者：翻譯/毛夢琪瀏覽：146 評論：0

核心提示：系統(tǒng)擴(kuò)展一直是個讓人頭疼的事情，MatinKleppmann通過本文分享了他自己的6條經(jīng)驗(yàn)，外加網(wǎng)友的一條建議，這些經(jīng)驗(yàn)對于擴(kuò)展Twitter這樣規(guī)模的系統(tǒng)或許幫助不大，但是對于百萬用戶級別的系統(tǒng)擴(kuò)展就另當(dāng)別論了。

系統(tǒng)擴(kuò)展一直是個讓人頭疼的事情，MatinKleppmann通過本文分享了他自己的6條經(jīng)驗(yàn)，外加網(wǎng)友的一條建議，這些經(jīng)驗(yàn)對于擴(kuò)展Twitter這樣規(guī)模的系統(tǒng)或許幫助不大，但是對于百萬用戶級別的系統(tǒng)擴(kuò)展就另當(dāng)別論了。

【編者按】面對系統(tǒng)擴(kuò)展的難題，我們做過不少的經(jīng)驗(yàn)分享，學(xué)習(xí)別人的系統(tǒng)擴(kuò)展經(jīng)驗(yàn)可以讓我們少走很多彎路，今天給大家介紹的這篇文章來自High Scalability網(wǎng)站，MatinKleppmann針對百萬用戶級別的系統(tǒng)擴(kuò)展，總結(jié)了幾條有用的經(jīng)驗(yàn)，當(dāng)然這些經(jīng)驗(yàn)對于像Twitter這樣規(guī)模的系統(tǒng)就不一定有用了。

以下為原文：

系統(tǒng)擴(kuò)展一直是個讓人頭疼的事情，但系統(tǒng)擴(kuò)展過程中你是不是也經(jīng)常會產(chǎn)生一些新的想法？同樣，別人擴(kuò)展系統(tǒng)的經(jīng)驗(yàn)也一定會給你帶來很多幫助，MatinKleppmann通過本文分享了他自己的一些經(jīng)驗(yàn)。

這些經(jīng)驗(yàn)對于擴(kuò)展Twitter這樣規(guī)模的系統(tǒng)或許沒有什么幫助，但是針對百萬用戶級別系統(tǒng)的擴(kuò)展（很多項(xiàng)目面臨這樣的難題），MatinKleppmann的經(jīng)驗(yàn)無疑會帶來很多幫助：

構(gòu)建可擴(kuò)展系統(tǒng)沒有什么樂趣可言，這是一個枯燥而又繁瑣的任務(wù)。雖然大量的工具已經(jīng)預(yù)先準(zhǔn)備好了，可現(xiàn)有的那些開源解決方案有著各種各樣缺點(diǎn)（當(dāng)然你自己的方案也不一定有多好，但至少能夠幫你解決特定的問題）。

在這里，MatinKleppmann分享了他的6個重要的系統(tǒng)擴(kuò)展經(jīng)驗(yàn)（外加網(wǎng)友的一條有用評論）：

1. 實(shí)際工作中的負(fù)載測試非常困難

負(fù)載測試需要讓系統(tǒng)承擔(dān)不同的工作量，有些工作量甚至超出了你現(xiàn)有的數(shù)據(jù)量水平，通過負(fù)載測試，評估系統(tǒng)在不同工作量條件下的性能，以及持續(xù)常態(tài)運(yùn)行的能力。具體還需要測試出系統(tǒng)的響應(yīng)速率、事務(wù)處理速率等參數(shù)。然而測試一個大型分布式系統(tǒng)和做科學(xué)實(shí)驗(yàn)不同，科學(xué)實(shí)驗(yàn)可以在理想條件下進(jìn)行，而負(fù)載測試則要難得多了，這對于搞計(jì)算機(jī)科學(xué)的人來說可能很難接受。你很難知道你實(shí)際訪問的是怎樣的模式，很難測試比你實(shí)際擁有數(shù)據(jù)更大的綜合數(shù)據(jù)集，很難將舊系統(tǒng)與新系統(tǒng)進(jìn)行比較，所以為防新代碼出現(xiàn)錯誤，你要隨時(shí)準(zhǔn)備好回滾。

2. 數(shù)據(jù)演變（data evolution）很困難

想象一下，你的機(jī)房被數(shù)據(jù)“淹沒”的情形，到處都是數(shù)據(jù)——數(shù)據(jù)庫中、日志中，以及一系列二進(jìn)制數(shù)據(jù)塊中。這時(shí)候如果要更新數(shù)據(jù)格式，你就需要改變一個巨大的時(shí)槽，而大公司在這些處理的自動化和優(yōu)化上有著豐富的經(jīng)驗(yàn)，可以適當(dāng)借鑒大公司的數(shù)據(jù)演變經(jīng)驗(yàn)，節(jié)約數(shù)據(jù)演變的時(shí)間成本。

3. 數(shù)據(jù)庫連接是一個瓶頸

當(dāng)系統(tǒng)在服務(wù)和節(jié)點(diǎn)數(shù)增加時(shí)，數(shù)據(jù)庫連接數(shù)以難以置信的速度增加。每個連接都會消耗資源，不僅僅是機(jī)器資源，還有人力資源，因?yàn)槟愕拈_發(fā)人員需要去弄明白怎樣解決這些問題。通過使用連接池或者編寫數(shù)據(jù)訪問層，你可以通過API進(jìn)行數(shù)據(jù)庫訪問。

4. 讀取副本是一步痛苦的操作

但讀取副本從主服務(wù)器中解除數(shù)據(jù)庫訪問也是一種常用的擴(kuò)展策略。同樣，這也需要花費(fèi)大量的精力來建立和維護(hù)這些系統(tǒng)，畢竟故障處理是一個始終存在的問題。

5. 考慮內(nèi)存效率

峰值延遲通常是由內(nèi)存問題引起的，想要更有效地利用RAM可能很困難，因?yàn)槟愫茈y判斷出RAM的實(shí)際使用情況。通過購買更多的RAM可以解決很多性能問題，如果可能的話，可以在RAM中加入索引，注意是對字符串的哈希表建立索引，而不是針對字符串本身。

6. 更改捕獲（change capture）是一個有效的方法

比如更改系統(tǒng)中的數(shù)據(jù)，這樣的更改必須通過許多服務(wù)，比如數(shù)據(jù)庫、搜索索引、圖、索引、副本讀取、緩存無效化。你可能認(rèn)為可以每次在應(yīng)用更新時(shí)將其寫到多個位置，但實(shí)際上很少這樣做。你也許認(rèn)為可以通過應(yīng)用程序讀取數(shù)據(jù)庫日志，但這對于有些系統(tǒng)是不可行的。更改捕獲系統(tǒng)是一個不錯的解決方案，該系統(tǒng)捕獲所有寫操作并將它們存儲到數(shù)據(jù)庫中。應(yīng)用程序可以實(shí)時(shí)接收這些更新，它們會形成更改的歷史記錄。該方法的好處是將數(shù)據(jù)生產(chǎn)者和消費(fèi)者分開，這為你進(jìn)行實(shí)驗(yàn)提供了很大的方便，而不用去擔(dān)心對主要站點(diǎn)造成影響。

7. 針對高速緩存和緩存無效化（cache invalidation）

Mysteriousllama的一篇文章評論為我們提供了額外的經(jīng)驗(yàn)：如果沒有正確地緩存，又沒有有效的緩存失效策略，那數(shù)據(jù)庫就危險(xiǎn)了。使用Redis和Memcache來緩存可能出現(xiàn)的一切，而且要切記：不到萬不得已，不要連接數(shù)據(jù)庫。確保你可以輕松使任何緩存無效化，保持事務(wù)原子性，避免系統(tǒng)在紊亂狀態(tài)下運(yùn)行。通過鎖定，以確保當(dāng)緩存無效時(shí)，數(shù)據(jù)庫不會堆滿同一查詢的多個副本。你或許會認(rèn)為選擇數(shù)據(jù)庫中的查詢緩存可能同樣有效，但相信我，這不太可能。當(dāng)然，除了緩存簡單的查詢，你還可以緩存更高級別的對象。

根據(jù)你對可靠性的要求，你還可能會考慮將緩存用作回寫和數(shù)據(jù)庫后臺的批處理寫入。由于多種因素的影響，這一般都要比單個寫入效率更高，許多大型網(wǎng)站都將這作為它們進(jìn)行系統(tǒng)擴(kuò)展的常用策略。

標(biāo)簽： 百萬用戶規(guī)模系統(tǒng)擴(kuò)展

打賞

更多>同類資訊

0 條相關(guān)評論

推薦資訊

點(diǎn)擊排行

XTJC.COM

欧美日韩日日夜夜,成人做爰视频www网站小优视频,精品成人自拍视频,国产成人aaaa

百萬用戶規(guī)模的系統(tǒng)如何擴(kuò)展