|
公司基本資料信息
|
運維監控必備的特性 多重冗余機制
很多的監控系統會利用一套軟件來實際數據的收集與檢測。在某些情況下,這項數據收集服務可能與系統使用同一套警報機制以及用戶界面。但另一些系統所采用的收集機制則屬于獨立軟件,基本不止一種。很明顯,允許大家部署多種收集方案并集中對其進行管理的系統要遠優于不支持這些功能的系統。
監管必備特性第二位:出色的圖形功能
任何一套稱職的運維監控工具都必需擁有出色的圖形引擎。這并不僅僅意味著能為使用者提供流暢的線條與漂亮的色彩搭配,當然這些也確實值得關注。如果大家曾經使用過監控系統來解決性能問題,就會在實踐中意識到這種對多個圖形進行排列、縮放、擴展乃至平移的能力是多么重要。pigoss bsm 強大的portal 功能正好印證了這一點。
設想一下,大家正嘗試找出導致某個多層Web應用程序速度降低的根源。如果能夠將大量看似互不相關的圖形(例如存儲延遲、網絡吞吐量、每秒數據庫處理量等等)堆疊起來,并通過直觀比較從它們的相關性中找到需要的答案。
監控必備特性第三位:便捷的事件抑制
對于任何一套運維監控系統來說,最糟糕的狀況就是由于已知或者意料之中的問題而引發了誤報以及后續應對措施。如果每一次手機接到的短信都在用80個字來描述同 一件事,那么我們很可能失去耐性而錯過監控系統所通知的真正重點–甚至有可能在毫不知情的狀態下令事態步步惡化。有鑒于此,快速抑制我們已經了解且重要度 不高的事件就成了一種非常重要的能力。
同樣重要的是,我們還需要有能力抑制來自特定來源的事件–例如大家非常清楚當下的某些維護或者升級工作必然要引發某些錯誤。我就遇到過這樣的狀況,有好幾 次已知升級流程都在其它系統中引發了意料之外的次生影響,但大家過了很長時間才發現這些影響–因為監控系統將其自動忽略了。如果能在監控系統中創建一個始 終位于前端的計劃停機時間窗口,那么一切都會變得大不相同。
監控必備特性第四位:多川數據收集方法
大家可以通過多川方法從基礎設施當中獲取信息。幾乎每一套監控軟件包都支持基礎型選項,例如檢測正常運行時間的ICMP ping、收集網絡統計信息的SNMP以及從Windows設備中提取事件日志數據的WMI等。這些基礎方法 曾經廣泛覆蓋絕大多數主流系統。然而時至今日,SNMP已經被其它更具現代特性的監控及管理接口所取代,最典型的就是WBEM以及CIM。事實上,很多供 應商已經開始徹底放棄對SNMP支持并轉向CIM,而且這一趨勢將隨著時間的推移而不斷加速。
除了新協議對SNMP的取代,還有其它一旬查詢類型前來援助。例如能夠直接執行SQL查詢并計算執行時間或審視其輸出結果,監控某項Web服務對特定 HTTP的響應或者響應代碼,甚至可以根據特定條目掌控日志文件中的對應文本內容。總而言之,我們工具箱里的工具種類越多,我們就越可能擁有掌握重要細節 信息的能力。
監控必備特性第五位:簡化集成與擴展
無論大家打算利用監控系統執行或者忽略哪些任務,將其擴展或者與其它系統相集成的能力都是非常重要的–這意味著我們最終能夠保住自己部署并花在這套系統上 的所有時間與精力。盡管很多監控系統都能夠很好地完成本職工作,但它們并不是在每項任務上都能出色發揮。有時候獲取必要信息的惟一辦法就是編寫一套特定解 決方案或者使用另一種工具。在這類情況下,監控系統通過擴展或集成與其它軟件協同合作的能力就成了重中之重。這可能表現為可以在其中運行外部腳本并實現內 部解析,或者與另一套票據管理平臺相集成。
總而言之,具體選擇使用哪一款運維監控工具取決于我們希望依靠它來完成哪些監控任務。某些方案在監控Linux環境方面表現出色、另一些則更適應在Windows 環境下發揮作用。還有一些針對網絡及基礎設施所打造,而不太擅長打理應用程序。不過,無論大家最終作出怎樣的選擇,都應該與前面所提到的五點內容加以印證 –這些通用特性與實際運行環境并無關聯。
如果大家目前正在使用或者將來打算使用的方案不符合上述要求,也許另尋答案才是最好的辦法。運維監控工具非常重要、將其融入工作流的過程也需要耗費大量時間,因此請朋友們慎重考量、認真評估。運維監控工具選擇適合自己的才是最重要的!
了解更多關于運維監控工具的信息,可關注pigoss 官網www.netistate.com