欧美日韩日日夜夜,成人做爰视频www网站小优视频,精品成人自拍视频,国产成人aaaa

推廣 熱搜: 弱電系統(tǒng)  系統(tǒng)  無(wú)線覆蓋  WMS  信息  弱電  網(wǎng)絡(luò)  解決方案  行業(yè)  息系統(tǒng) 

HACMP的概念和原理

   日期:2015-03-31     瀏覽:389    評(píng)論:0    
核心提示:容災(zāi)冗余,災(zāi)備

 HACMP的概念和原理

關(guān)鍵業(yè)務(wù)的連續(xù)性可以通過(guò)以下三個(gè)層次的方法實(shí)現(xiàn):

磁帶備份

磁帶備份是實(shí)現(xiàn)基本的業(yè)務(wù)連續(xù)的通用方法。信息先備份到磁帶上,然后送到另外的地點(diǎn)保存。這種方法的問(wèn)題在于磁帶備份往往需要較長(zhǎng)的時(shí)間來(lái)記錄數(shù)據(jù)。另外,在數(shù)據(jù)備份過(guò)程中或者做數(shù)據(jù)備份前的系統(tǒng)或環(huán)境故障很可能造成數(shù)據(jù)丟失。而且,從備份磁帶上恢復(fù)數(shù)據(jù)也需要很長(zhǎng)的時(shí)間,數(shù)據(jù)存儲(chǔ)得越多,恢復(fù)的時(shí)間越長(zhǎng)。

高可用系統(tǒng)

高可用系統(tǒng)一般是在一個(gè)地點(diǎn),通過(guò)高可用軟件將一組服務(wù)器連接在一起,組成一個(gè)群集。IBM的HACMP for AIX和HP的MC/ServiceGuard就是這樣的群集產(chǎn)品,通過(guò)快速地將用戶、應(yīng)用和數(shù)據(jù)從發(fā)生硬件或軟件故障的機(jī)器切換至其它機(jī)器來(lái)提供高可用計(jì)算環(huán)境。

容錯(cuò)系統(tǒng)

容錯(cuò)系統(tǒng)依賴于冗余的硬件設(shè)備和軟件來(lái)實(shí)現(xiàn)關(guān)鍵業(yè)務(wù)的連續(xù)性。雖然容錯(cuò)系統(tǒng)是避免宕機(jī)和數(shù)據(jù)丟失的有效方法,但是購(gòu)買(mǎi)、操作和維護(hù)容錯(cuò)系統(tǒng)都是非常昂貴的。另外,系統(tǒng)的升級(jí)也需要很大的代價(jià)。
用戶可以根據(jù)自己的應(yīng)用情況選擇適合自己的方法實(shí)現(xiàn)關(guān)鍵業(yè)務(wù)的連續(xù)性。

HACMP簡(jiǎn)介

IBM公司的HACMP for AIX軟件是基于AIX平臺(tái)的,在高可用系統(tǒng)層次實(shí)現(xiàn)關(guān)鍵性任務(wù)計(jì)算環(huán)境的工具軟件。HACMP應(yīng)用于RS/6000系列的單處理器機(jī)型、對(duì)稱多處理器機(jī)型或SP的節(jié)點(diǎn),可以檢測(cè)系統(tǒng)故障并快速恢復(fù)服務(wù),使最終用戶只感受到很小的中斷時(shí)間。HACMP(High Availability Cluster Multi-Processing)有兩個(gè)主要的組成部分:高可用技術(shù)(HA)和群集多處理技術(shù)(CMP)。

高可用技術(shù)(HA)
在HA產(chǎn)品出現(xiàn)之前,在UNIX領(lǐng)域?qū)崿F(xiàn)高可用性的最有效途徑是通過(guò)容錯(cuò)技術(shù)。容錯(cuò)技術(shù)依靠專門(mén)的硬件設(shè)備檢測(cè)到硬件的故障,然后立即切換至冗余的硬件設(shè)備上,不管故障設(shè)備是處理器、內(nèi)存板、電源、I/O子系統(tǒng)還是存儲(chǔ)子系統(tǒng)。盡管這種切換能夠無(wú)縫地提供不間斷的服務(wù),但卻在硬件費(fèi)用和性能上付出了很高的代價(jià),因?yàn)槿哂嗟脑O(shè)備不能處理事務(wù)。更重要的是,容錯(cuò)系統(tǒng)不能處理軟件故障,而這卻是宕機(jī)的最常見(jiàn)的原因。
高可用技術(shù)并不是通過(guò)將可用性當(dāng)作一系列重復(fù)的物理設(shè)備來(lái)實(shí)現(xiàn)高可用性,它將高可用性看作是一個(gè)全系統(tǒng)范圍的、共享的資源的集合,這些資源相互協(xié)作來(lái)保證關(guān)鍵的服務(wù)。高可用技術(shù)將軟件和工業(yè)標(biāo)準(zhǔn)的硬件結(jié)合起來(lái),在系統(tǒng)、設(shè)備或應(yīng)用發(fā)生故障時(shí)通過(guò)快速恢復(fù)關(guān)鍵服務(wù)來(lái)使宕機(jī)時(shí)間減至最小。盡管不能立即切換,恢復(fù)服務(wù)也是很快的,通常在1分鐘之內(nèi)。
容錯(cuò)技術(shù)和高可用技術(shù)的區(qū)別在于服務(wù)中斷的時(shí)間。當(dāng)硬件發(fā)生故障時(shí),容錯(cuò)環(huán)境沒(méi)有宕機(jī)時(shí)間,而高可用環(huán)境有很小的宕機(jī)時(shí)間。但是,在容錯(cuò)環(huán)境中,由于軟件故障無(wú)法被檢測(cè),有可能造成系統(tǒng)的嚴(yán)重破壞。而在高可用環(huán)境中,軟件故障只會(huì)造成很小的宕機(jī)時(shí)間。
現(xiàn)在,大多數(shù)的公司都愿意忍受一小段的宕機(jī)時(shí)間,采用高可用技術(shù),而不愿意花費(fèi)高得多的代價(jià)采用只能檢測(cè)硬件故障的容錯(cuò)技術(shù)。另外,在高可用配置中,備份機(jī)還可承擔(dān)其他應(yīng)用。

群集多處理技術(shù)(CMP)
群集多處理技術(shù)是指一組松散耦合的機(jī)器,通過(guò)網(wǎng)絡(luò)連接在一起,共享磁盤(pán)資源。在群集中,多個(gè)服務(wù)器協(xié)同工作,為用戶提供一組服務(wù)或資源。
將兩個(gè)或多個(gè)服務(wù)器組成群集來(lái)備份關(guān)鍵應(yīng)用是一個(gè)劃算的高可用性解決方案。用戶可以使用更多的技術(shù)能力,同時(shí)確保關(guān)鍵應(yīng)用在硬件或軟件故障后能夠快速恢復(fù)正常工作。
群集多處理技術(shù)還為客戶提供了靈活的擴(kuò)展途徑。客戶可以很容易地在群集中增加處理器以分擔(dān)不斷增加的工作量,還可以對(duì)群集中的處理器進(jìn)行升級(jí)。而在容錯(cuò)環(huán)境中,則必須同時(shí)增加兩個(gè)處理器,其中一個(gè)作為冗余備份,在正常工作時(shí)不進(jìn)行任何處理。

1.1 HACMP中術(shù)語(yǔ)的定義

群集(Cluster):
多個(gè)服務(wù)器節(jié)點(diǎn)一起工作,使用TCP/IP進(jìn)行通訊,每個(gè)節(jié)點(diǎn)上運(yùn)行Cluster Manager進(jìn)程。

節(jié)點(diǎn)(Node):
群集中的每個(gè)運(yùn)行Cluster Manager進(jìn)程的獨(dú)立的機(jī)器。節(jié)點(diǎn)是HACMP的核心部分,節(jié)點(diǎn)上運(yùn)行AIX操作系統(tǒng)和HACMP for AIX軟件。在HACMP群集中,每個(gè)節(jié)點(diǎn)有一個(gè)唯一的節(jié)點(diǎn)名。一個(gè)節(jié)點(diǎn)可能擁有一組資源??――磁盤(pán)、卷組、文件系統(tǒng)、網(wǎng)絡(luò)、網(wǎng)絡(luò)地址和應(yīng)用。節(jié)點(diǎn)上一般運(yùn)行著訪問(wèn)共享磁盤(pán)上數(shù)據(jù)的“后臺(tái)”應(yīng)用。

資源(Resources):
由一個(gè)節(jié)點(diǎn)控制的實(shí)體,當(dāng)節(jié)點(diǎn)發(fā)生故障時(shí)能夠被其它節(jié)點(diǎn)接管。可以被當(dāng)作資源的實(shí)體有:
1、磁盤(pán)、卷組、文件系統(tǒng)
2、NFS輸出的文件系統(tǒng)
3、IP地址
4、應(yīng)用程序

關(guān)鍵應(yīng)用(Critical Application):
由HACMP控制其啟動(dòng)和停止的應(yīng)用程序,例如數(shù)據(jù)庫(kù)的后臺(tái)進(jìn)程。

事件(Event):
群集中發(fā)生的一些事情,即群集狀態(tài)的改變,包括節(jié)點(diǎn)up/down,網(wǎng)絡(luò)up/down,網(wǎng)卡故障等等。

行為(Behavior):
事件發(fā)生時(shí)群集的響應(yīng)動(dòng)作。事件是由shell腳本控制的。

重聚(Reintegration):
將故障節(jié)點(diǎn)、網(wǎng)絡(luò)、網(wǎng)卡重新帶回群集的過(guò)程。

1.3  HACMP群集的硬件組成

節(jié)點(diǎn)、共享磁盤(pán)設(shè)備、網(wǎng)絡(luò)和網(wǎng)卡、客戶機(jī)

節(jié)點(diǎn)機(jī)型:

HACMP for AIX軟件支持RS/6000單處理器和SMP機(jī)型作為群集的節(jié)點(diǎn)。在HACMP中,SMP系統(tǒng)和單處理器機(jī)型一樣,都被當(dāng)作單一節(jié)點(diǎn)。采用SMP系統(tǒng)是提高整個(gè)群集吞吐量的有效途徑。群集中的每個(gè)節(jié)點(diǎn)都可以是一個(gè)大的SMP系統(tǒng),使得群集系統(tǒng)遠(yuǎn)遠(yuǎn)超過(guò)單個(gè)系統(tǒng)的處理能力,可以支持成千上萬(wàn)個(gè)客戶機(jī)連接到單一的數(shù)據(jù)庫(kù)系統(tǒng)。

共享磁盤(pán)設(shè)備

群集中的每個(gè)節(jié)點(diǎn)都需要配置內(nèi)置硬盤(pán)來(lái)存儲(chǔ)AIX操作系統(tǒng)、HACMP軟件和應(yīng)用程序。另外,每個(gè)節(jié)點(diǎn)都應(yīng)連接到一個(gè)或多個(gè)外置的共享磁盤(pán)上。
共享磁盤(pán)是指物理上連接到多個(gè)節(jié)點(diǎn)的磁盤(pán)設(shè)備,共享磁盤(pán)上存放著關(guān)鍵任務(wù)的數(shù)據(jù),通常采用鏡像或RAID技術(shù)來(lái)提供數(shù)據(jù)的冗余保護(hù)。
HACMP的共享磁盤(pán)設(shè)備支持SCSI-2 Differential磁盤(pán)、SCSI-2 Differential磁盤(pán)陣列和串行磁盤(pán)。
HACMP支持兩種對(duì)共享磁盤(pán)的訪問(wèn)方式:非并發(fā)訪問(wèn)和并發(fā)訪問(wèn)。
在非并發(fā)訪問(wèn)環(huán)境中,每個(gè)時(shí)間點(diǎn)上只能有一條活動(dòng)的連接,保持活動(dòng)連接的節(jié)點(diǎn)擁有磁盤(pán),當(dāng)此節(jié)點(diǎn)離開(kāi)群集時(shí),它擁有的磁盤(pán)被其他節(jié)點(diǎn)接管。
在并發(fā)訪問(wèn)環(huán)境中,共享磁盤(pán)同時(shí)與多個(gè)節(jié)點(diǎn)保持活動(dòng)連接,因此當(dāng)節(jié)點(diǎn)故障時(shí),不需要接管磁盤(pán)。并發(fā)訪問(wèn)要求SSA或RAID作為外置共享磁盤(pán)。
共享硬盤(pán)應(yīng)該單獨(dú)放在一個(gè)機(jī)柜中,不應(yīng)和機(jī)器混放。

網(wǎng)卡
一個(gè)節(jié)點(diǎn)至少應(yīng)有兩塊網(wǎng)卡連接每個(gè)網(wǎng)絡(luò):一塊服務(wù)網(wǎng)卡(service adapter)和一塊備份網(wǎng)卡(standby adapter)。如果配置IP地址接管,還應(yīng)配置啟動(dòng)網(wǎng)卡(boot adapter)。啟動(dòng)網(wǎng)卡并不需要單獨(dú)的物理網(wǎng)卡,而是配置在服務(wù)網(wǎng)卡上的不同的IP地址。
HACMP for AIX采用網(wǎng)卡標(biāo)識(shí)(adapter label)來(lái)識(shí)別網(wǎng)卡。對(duì)于TCP/IP網(wǎng)絡(luò),網(wǎng)卡標(biāo)識(shí)是在文件/etc/hosts中關(guān)聯(lián)某一IP地址的名字。一個(gè)節(jié)點(diǎn)可以定義多個(gè)網(wǎng)卡標(biāo)識(shí)和IP地址。

網(wǎng)絡(luò)

HACMP使用LAN來(lái)監(jiān)視網(wǎng)絡(luò),網(wǎng)卡和其它節(jié)點(diǎn)的狀態(tài),HACMP支持AIX支持的大多數(shù)基于TCP/IP 的網(wǎng)絡(luò),如 Ethernet、Token-Ring、FDDI、ATM等等。HACMP中定義了三種類型的網(wǎng)絡(luò):公用網(wǎng)絡(luò)(public network)、私用網(wǎng)絡(luò)(private network)和串行網(wǎng)絡(luò)(serial network)。

公用網(wǎng)絡(luò)
在HACMP環(huán)境中,公用網(wǎng)絡(luò)連接多個(gè)節(jié)點(diǎn)并允許客戶機(jī)服務(wù)群集節(jié)點(diǎn)。Ethernet、Token-Ring、FDDI、ATM等網(wǎng)絡(luò)可以被定義為公用網(wǎng)絡(luò)。

私用網(wǎng)絡(luò)
HACMP群集中的節(jié)點(diǎn)必須相互通訊以實(shí)現(xiàn)對(duì)數(shù)據(jù)的連續(xù)訪問(wèn)。私用網(wǎng)絡(luò)提供兩個(gè)節(jié)點(diǎn)之間的點(diǎn)到點(diǎn)通訊,但不允許客戶機(jī)訪問(wèn)。HACMP使用私用網(wǎng)絡(luò)來(lái)傳輸鎖的信息,只有在沒(méi)有定義私用網(wǎng)絡(luò)時(shí)才使用公用網(wǎng)絡(luò)來(lái)傳輸鎖的信息。
私用網(wǎng)絡(luò)一般用于并發(fā)訪問(wèn)磁盤(pán)的情況。Ethernet、Token-Ring、FDDI、ATM等網(wǎng)絡(luò)可以被定義為私用網(wǎng)絡(luò)。

串行網(wǎng)絡(luò)
串行網(wǎng)絡(luò)是兩個(gè)節(jié)點(diǎn)之間的點(diǎn)到點(diǎn)連接。HACMP在TCP/IP子系統(tǒng)發(fā)生故障時(shí),使用串行網(wǎng)絡(luò)來(lái)傳輸控制信息和心跳信息。串行網(wǎng)絡(luò)可以是一條SCSI-2 Differential總線或一條RS232串行線。

網(wǎng)絡(luò)名稱
網(wǎng)絡(luò)名稱用于標(biāo)識(shí)HACMP群集中的網(wǎng)絡(luò),群集進(jìn)程使用網(wǎng)絡(luò)名稱信息來(lái)確定哪些網(wǎng)卡連接在同一物理網(wǎng)絡(luò)上。網(wǎng)絡(luò)的命名是任意的,但必須保持一致。如果多個(gè)網(wǎng)卡連接在同一物理網(wǎng)絡(luò)上,定義這些網(wǎng)卡時(shí)必須使用相同的網(wǎng)絡(luò)名稱。

客戶機(jī)

客戶機(jī)是指能夠訪問(wèn)群集中節(jié)點(diǎn)的機(jī)器。客戶機(jī)通過(guò)公用局域網(wǎng)絡(luò)與節(jié)點(diǎn)通訊,其上運(yùn)行“前端”程序或客戶機(jī)應(yīng)用來(lái)訪問(wèn)群集節(jié)點(diǎn)上的服務(wù)器應(yīng)用。HACMP for AIX為群集節(jié)點(diǎn)上的關(guān)鍵性的數(shù)據(jù)和應(yīng)用提供高可用性環(huán)境,但不負(fù)責(zé)客戶機(jī)的高可用性。


1.3  AIX與HACMP

AIX是第一個(gè),也是最為成熟的第二代UNIX操作系統(tǒng),具有很多先進(jìn)的特征,保證UNIX系統(tǒng)的可靠性和高性能,IBM公司引入到UNIX中的LVM邏輯卷管理和JFS日志文件系統(tǒng),使AIX更容易使用和管理。AIX滿足幾乎所有的工業(yè)標(biāo)準(zhǔn)和事實(shí)標(biāo)準(zhǔn),是真正的開(kāi)放系統(tǒng)。
AIX包含許多承襲IBM大主機(jī)等級(jí)的優(yōu)異特性,諸如系統(tǒng)集成性、系統(tǒng)管理及系統(tǒng)可用性。除了具有當(dāng)系統(tǒng)損毀時(shí)可以快速修復(fù)的文件系統(tǒng)外,IBM運(yùn)用自身在計(jì)算機(jī)領(lǐng)域45年的經(jīng)驗(yàn),增加了邏輯卷管理和日志文件系統(tǒng)等功能,支持三份能夠同步寫(xiě)入及錯(cuò)誤區(qū)塊重新配置的系統(tǒng)鏡像功能,用以確保您高價(jià)值的數(shù)據(jù)。
IBM在設(shè)計(jì)RISC/6000的AIX操作系統(tǒng)時(shí),針對(duì)UNIX系統(tǒng)的弱點(diǎn),重新改寫(xiě)了UNIX的內(nèi)核,清除200個(gè)編程缺陷。在系統(tǒng)功能穩(wěn)定性、可靠性和可管理性方面做了極大的改進(jìn),使UNIX從一個(gè)主要面向科技市場(chǎng)的操作系統(tǒng),發(fā)展成為能夠承擔(dān)關(guān)鍵任務(wù)的成熟的操作系統(tǒng)。
AIX具有動(dòng)態(tài)可擴(kuò)展內(nèi)核,用戶裝卸設(shè)備時(shí)可聯(lián)機(jī)動(dòng)態(tài)配置,無(wú)須關(guān)機(jī)和重新啟動(dòng),具有實(shí)時(shí)的擴(kuò)展功能。所有硬件設(shè)備均可隨時(shí)動(dòng)態(tài)增加、更換而不影響文件系統(tǒng)及其數(shù)據(jù)。
AIX中的許多功能和HACMP緊密配合,為用戶提供更高的可用性。以下介紹AIX中與HACMP相關(guān)的幾項(xiàng)功能:LVM、JFS、ODM、SMIT和SRC。

邏輯卷管理器LVM(Logical Volume Manager)
LVM邏輯上將多個(gè)硬盤(pán)當(dāng)作單一實(shí)體進(jìn)行管理。使用LVM可將存儲(chǔ)空間分區(qū)為“邏輯卷”,可以指定其存放位置,以獲得優(yōu)化的性能和可用性。邏輯卷(文件系統(tǒng))可以動(dòng)態(tài)擴(kuò)展而不需重新配置整個(gè)邏輯硬盤(pán)子系統(tǒng)。邏輯卷可以鏡像,避免磁盤(pán)的單點(diǎn)故障。
LVM使磁盤(pán)資源很容易被其他節(jié)點(diǎn)接管。

日志文件系統(tǒng)JFS(Journaled File System)
在傳統(tǒng)Unix中,文件系統(tǒng)恢復(fù)需要很長(zhǎng)時(shí)間且文件系統(tǒng)的完整性不能得到保證。AIX使用日志文件系統(tǒng),所有對(duì)文件系統(tǒng)的更新在寫(xiě)到文件系統(tǒng)之前先記入一個(gè)日志之中,當(dāng)系統(tǒng)故障后JFS日志可以被重新執(zhí)行,文件系統(tǒng)的更新可以根據(jù)日志前滾或回滾(roll forward/back)。AIX很少用到fsck命令進(jìn)行整個(gè)文件系統(tǒng)的恢復(fù),所以故障后恢復(fù)文件系統(tǒng)的時(shí)間大大減少,也就大大減少了文件系統(tǒng)接管的時(shí)間。

ODM(Object Data Manager)
ODM是一個(gè)面向?qū)ο蟮臄?shù)據(jù)庫(kù),其中存放著系統(tǒng)的配置信息。采用ODM管理使配置信息更加安全,可以免受偶然的或故意的損壞。ODM庫(kù)一般通過(guò)SMIT、高級(jí)命令或應(yīng)用程序進(jìn)行訪問(wèn)。
所有的HACMP配置信息都存放于ODM庫(kù)中。
HACMP for AIX使用“Global ODM”,可以在一個(gè)節(jié)點(diǎn)上做配置,然后傳到群集內(nèi)的所有節(jié)點(diǎn)。這樣可以減少配置的工作量,并保證各個(gè)節(jié)點(diǎn)上配置信息的一致性。

SMIT(System Management Interface Tool)
AIX中絕大部分系統(tǒng)管理功能都可以通過(guò)SMIT完成(95%以上)。使用SMIT減少了偶然使用錯(cuò)誤命令或錯(cuò)誤選項(xiàng)的可能性,增加了系統(tǒng)的可用性。
HACMP全部用SMIT管理,快捷路徑是smit hacmp

SRC(System Resource Controller)
SRC是一個(gè)AIX進(jìn)程,用來(lái)管理其它的進(jìn)程。使用startsrc和stopsrc命令來(lái)啟動(dòng)、停止由SRC控制的一組進(jìn)程。如果SRC控制的一個(gè)進(jìn)程非正常終止,SRC會(huì)自動(dòng)執(zhí)行一個(gè)特定的程序來(lái)響應(yīng)。
HACMP的進(jìn)程都是由SRC控制和監(jiān)視的。

1.5 HACMP群集的軟件結(jié)構(gòu)

HACMP for AIX軟件由以下部分組成:

Cluster Manager、Event Scripts、Cluster Lock Manager、Clinfo、Clsmuxpd

Cluster Manager
Cluster Manager運(yùn)行在群集中的所有節(jié)點(diǎn)上。它的主要任務(wù)是監(jiān)視和響應(yīng)群集狀態(tài)的變化,包括:節(jié)點(diǎn)故障和恢復(fù)、網(wǎng)絡(luò)故障和恢復(fù)、網(wǎng)卡故障和恢復(fù)。它負(fù)責(zé)同步和協(xié)調(diào)群集內(nèi)部的動(dòng)作,發(fā)現(xiàn)錯(cuò)誤征兆,診斷問(wèn)題,并做出適當(dāng)?shù)姆磻?yīng)。它還負(fù)責(zé)執(zhí)行Event Scripts(事件腳本)來(lái)影響群集狀態(tài)的變化 。

Event Scripts
Event Scripts 定義了為響應(yīng)群集事件所需執(zhí)行的動(dòng)作。HACMP包括了大多數(shù)情況下的Event Scripts,這些Event Scripts是用標(biāo)準(zhǔn)shell編寫(xiě)的,使用標(biāo)準(zhǔn)AIX命令和HACMP功能,且可以客戶化。

Cluster Lock Manager
用于并發(fā)訪問(wèn)環(huán)境,使多個(gè)節(jié)點(diǎn)可以同時(shí)訪問(wèn)相同的數(shù)據(jù)。應(yīng)用程序必須用Cluster Lock Manager API來(lái)登記、申請(qǐng)、釋放鎖。Lock Manager協(xié)調(diào)和排序?qū)蚕頂?shù)據(jù)的訪問(wèn),防止數(shù)據(jù)的不一致和錯(cuò)誤。

Clinfo & Clsmuxpd
Clinfo是Cluster Information進(jìn)程。Clinfo API允許應(yīng)用程序來(lái)確定群集現(xiàn)在的狀態(tài)和釋放動(dòng)作響應(yīng)變化,每當(dāng)群集內(nèi)有事件發(fā)生時(shí)Clinfo發(fā)布信息。
Clinfo的通訊基于SNMP依靠SNMP的代理(clsmuxpd)接收群集狀態(tài)的改變。
Clinfo是可選的。

1.6  HACMP群集資源

HACMP for AIX軟件通過(guò)以下途徑提供高可用性環(huán)境:
定義一組必須的群集資源,資源可以是硬件,也可以是軟件。
定義群集節(jié)點(diǎn)訪問(wèn)這些資源的關(guān)系。這些關(guān)系確定哪個(gè)節(jié)點(diǎn)控制資源以及當(dāng)該節(jié)點(diǎn)放棄資源的控制權(quán)后哪個(gè)節(jié)點(diǎn)接管資源。當(dāng)一個(gè)節(jié)點(diǎn)離開(kāi)群集時(shí),Cluster Manager能夠?qū)⑦@個(gè)節(jié)點(diǎn)的資源轉(zhuǎn)移到群集中的其它節(jié)點(diǎn)上。

資源的類型
應(yīng)用、磁盤(pán)、卷組、文件系統(tǒng)、NFS文件系統(tǒng)、IP地址

資源怎樣做到高可用
應(yīng)用:
由HACMP啟動(dòng),如果節(jié)點(diǎn)發(fā)生故障,則在另一節(jié)點(diǎn)重新啟動(dòng)。

磁盤(pán)、卷組、文件系統(tǒng):
磁盤(pán)物理上與多個(gè)節(jié)點(diǎn)相連。在非并發(fā)環(huán)境中,一個(gè)節(jié)點(diǎn)控制磁盤(pán)資源,如果該節(jié)點(diǎn)發(fā)生故障,它控制的磁盤(pán)資源由其它節(jié)點(diǎn)接管。在并發(fā)環(huán)境中,多個(gè)節(jié)點(diǎn)同時(shí)控制磁盤(pán)資源,一個(gè)節(jié)點(diǎn)發(fā)生故障并不影響其它節(jié)點(diǎn)。

IP地址:
如果服務(wù)網(wǎng)卡發(fā)生故障,由本機(jī)的備份網(wǎng)卡接管其地址,稱為“網(wǎng)卡切換”。如果整個(gè)節(jié)點(diǎn)故障,由另一個(gè)群集節(jié)點(diǎn)的備份網(wǎng)卡接管其地址,稱為“IP地址接管”。

 資源組
每個(gè)HACMP的高可用資源都必須被分配在某個(gè)資源組中。資源組允許您將相關(guān)的資源結(jié)合成一個(gè)單一的實(shí)體,便于配置和管理。
HACMP共有三種類型的資源組,分別是Cascading資源組、Rotating資源組和Concurrent資源組。在一個(gè)群集中可以有多個(gè)不同類型的資源組。定義資源組的類型實(shí)際上就是定義了群集的故障恢復(fù)策略。

Cascading資源組可以被一個(gè)或多個(gè)節(jié)點(diǎn)接管:
所有被指定參與接管一個(gè)資源組的節(jié)點(diǎn)都是該資源組的資源鏈的一部分,每個(gè)參與的節(jié)點(diǎn)都被指定了接管優(yōu)先級(jí),優(yōu)先級(jí)代表了接管可用資源的順序。
當(dāng)接管發(fā)生時(shí),具有最高優(yōu)先級(jí)的活動(dòng)節(jié)點(diǎn)將獲得資源組。如果該節(jié)點(diǎn)不可用,則由具有次高優(yōu)先級(jí)的節(jié)點(diǎn)獲得資源組,依此類推。
當(dāng)對(duì)該資源組具有更高優(yōu)先級(jí)的節(jié)點(diǎn)重新回到群集后,它將取回它的資源組。

一個(gè)Rotating 資源組和一組節(jié)點(diǎn)相關(guān)聯(lián)。資源組在所有被定義的節(jié)點(diǎn)之間輪轉(zhuǎn)。每個(gè)節(jié)點(diǎn)可以擁有一個(gè)資源組。
開(kāi)始時(shí),第一個(gè)加入群集的節(jié)點(diǎn)獲得第一個(gè)資源組,第二個(gè)加入群集的節(jié)點(diǎn)獲得第二個(gè)資源組,依此類推,直到所有的資源組都被節(jié)點(diǎn)獲得。剩余的節(jié)點(diǎn)作為備份節(jié)點(diǎn)。
當(dāng)一個(gè)控制資源的節(jié)點(diǎn)故障時(shí),可用節(jié)點(diǎn)中對(duì)資源組具有最高優(yōu)先級(jí)的節(jié)點(diǎn)將接管資源組。當(dāng)故障節(jié)點(diǎn)重新加入群集后,成為備份節(jié)點(diǎn),不再取回資源組。

Concurrent 資源組由多個(gè)節(jié)點(diǎn)共享。所有并發(fā)訪問(wèn)資源組的節(jié)點(diǎn)在加入群集后都獲得該資源組。節(jié)點(diǎn)之間沒(méi)有優(yōu)先級(jí)的區(qū)別。
由于AIX JFS 不支持并發(fā)訪問(wèn),應(yīng)用就必須用生設(shè)備(邏輯卷)。因此Concurrent 資源組的資源只能有應(yīng)用、磁盤(pán)和卷組。
Concurrent 資源組的共享磁盤(pán)必須是SSA盤(pán)或RAID盤(pán)。

資源鏈
每個(gè)能訪問(wèn)資源組的節(jié)點(diǎn)都必須被列為參與節(jié)點(diǎn),參與節(jié)點(diǎn)的列表就建立了資源組的資源鏈。這樣,這幾個(gè)節(jié)點(diǎn)都可以參與維護(hù)資源組的可用性。
對(duì)于Cascading資源組或Rotating 資源組來(lái)說(shuō),這也就建立了資源鏈中各節(jié)點(diǎn)的優(yōu)先級(jí)。
對(duì)于Cascading資源組,當(dāng)前在資源鏈中具有最高優(yōu)先級(jí)的活動(dòng)節(jié)點(diǎn)將從故障節(jié)點(diǎn)處獲得資源組。
對(duì)于Rotating資源組,當(dāng)前在資源鏈中具有最高優(yōu)先級(jí)且具有可用連接(網(wǎng)絡(luò)、網(wǎng)卡、IP地址)的節(jié)點(diǎn)將從故障節(jié)點(diǎn)處獲得資源組。接管節(jié)點(diǎn)可能是已經(jīng)擁有資源的節(jié)點(diǎn),也可能是備份節(jié)點(diǎn)。

HACMP對(duì)資源組的位置有如下假定:
Cascading:具有最高優(yōu)先級(jí)的活動(dòng)節(jié)點(diǎn)控制資源組。
Rotating :具有與Rotating資源組相關(guān)的服務(wù)地址的節(jié)點(diǎn)控制資源組。
Concurrent:所有活動(dòng)節(jié)點(diǎn)都擁有資源組。

1.6 建立高可用系統(tǒng)——避免單點(diǎn)故障

高可用系統(tǒng)的主要特點(diǎn)是具有檢測(cè)和響應(yīng)可能影響到關(guān)鍵服務(wù)的事件的能力。HACMP for AIX軟件使群集在遇到系統(tǒng)的關(guān)鍵組件(例如網(wǎng)卡)發(fā)生故障的情況下仍能繼續(xù)對(duì)外提供服務(wù)。
HACMP for AIX軟件通過(guò)避免單點(diǎn)故障的方式建立高可用的和可擴(kuò)展的群集。單點(diǎn)故障點(diǎn)是指一個(gè)關(guān)鍵的群集功能只由單一的組件提供,當(dāng)這個(gè)組件故障時(shí),群集沒(méi)有其它的途徑提供關(guān)鍵的服務(wù)。
在群集中,有可能出現(xiàn)單點(diǎn)故障的群集組件是:
節(jié)點(diǎn)、網(wǎng)絡(luò)和網(wǎng)卡、磁盤(pán)和磁盤(pán)控制卡、應(yīng)用
HACMP可以檢測(cè)和響應(yīng)三種類型的故障:節(jié)點(diǎn)故障、網(wǎng)卡故障和網(wǎng)絡(luò)故障。

 節(jié)點(diǎn)故障
指處理器硬件或操作系統(tǒng)故障。當(dāng)發(fā)生節(jié)點(diǎn)故障上,其它節(jié)點(diǎn)可以配置為:
接管共享磁盤(pán)、Vary-on卷組、Mount文件系統(tǒng)、Export NFS文件系統(tǒng)、接管IP地址、重啟應(yīng)用。
磁盤(pán)物理上與多個(gè)節(jié)點(diǎn)相連。在非并發(fā)環(huán)境中,一個(gè)節(jié)點(diǎn)控制磁盤(pán)資源,如果該節(jié)點(diǎn)發(fā)生故障,它控制的磁盤(pán)資源(包括卷組、文件系統(tǒng)等)由其它節(jié)點(diǎn)接管。在并發(fā)環(huán)境中,多個(gè)節(jié)點(diǎn)同時(shí)控制磁盤(pán)資源,因此不需要磁盤(pán)接管。
IP地址接管使另一節(jié)點(diǎn)可以獲得故障節(jié)點(diǎn)的網(wǎng)絡(luò)地址。當(dāng)提供給客戶機(jī)的服務(wù)綁定到一個(gè)特定的IP地址時(shí),必須配置IP地址接管。如果只接管磁盤(pán),客戶機(jī)將無(wú)法訪問(wèn)服務(wù)器的IP地址。
當(dāng)關(guān)鍵應(yīng)用的節(jié)點(diǎn)離開(kāi)群集時(shí),接管節(jié)點(diǎn)重新啟動(dòng)這個(gè)關(guān)鍵應(yīng)用,使服務(wù)得以繼續(xù)。

 網(wǎng)卡故障
HACMP軟件能夠處理服務(wù)網(wǎng)卡和備份網(wǎng)卡的故障。當(dāng)服務(wù)網(wǎng)卡故障時(shí),Cluster Manager將同一節(jié)點(diǎn)的服務(wù)網(wǎng)卡和備份網(wǎng)卡進(jìn)行切換,服務(wù)網(wǎng)卡的故障是透明的。Cluster Manager檢測(cè)到備份網(wǎng)卡故障時(shí)只是記入日志,并不進(jìn)行其它操作。

 網(wǎng)絡(luò)故障
當(dāng)群集中連接所有節(jié)點(diǎn)的網(wǎng)絡(luò)故障時(shí),由于網(wǎng)絡(luò)配置各不相同,所以HACMP無(wú)法定義響應(yīng)動(dòng)作。此時(shí)系統(tǒng)在主控臺(tái)上顯示信息,事件被記入日志。用戶可以根據(jù)實(shí)際情況自己編寫(xiě)腳本程序來(lái)響應(yīng)網(wǎng)絡(luò)故障。
在大多數(shù)配置中,網(wǎng)絡(luò)都是單點(diǎn)故障點(diǎn)。為避免發(fā)生網(wǎng)絡(luò)單點(diǎn)故障,建議在配置HACMP時(shí)配置雙網(wǎng)絡(luò)。

 其它類型的故障

 磁盤(pán)和磁盤(pán)控制卡故障
HACMP自己不能直接處理磁盤(pán)和磁盤(pán)控制卡故障。但是數(shù)據(jù)可通過(guò)AIX的LVM 鏡像或磁盤(pán)陣列的RAID功能處理。
如果共享磁盤(pán)使用SCSI-2 Differential磁盤(pán)或SSA磁盤(pán),磁盤(pán)故障可通過(guò)AIX的LVM 鏡像處理。此時(shí)需要跨磁盤(pán)進(jìn)行LVM鏡像。單一磁盤(pán)故障就不會(huì)影響數(shù)據(jù)的可用性。如果磁盤(pán)配置卡發(fā)生故障,數(shù)據(jù)可通過(guò)跨總線的LVM鏡像來(lái)復(fù)制。
如果共享磁盤(pán)使用磁盤(pán)陣列,磁盤(pán)陣列自己負(fù)責(zé)數(shù)據(jù)的冗余保護(hù)。在連接RAID磁盤(pán)陣列時(shí)應(yīng)采用多總線,避免磁盤(pán)配置卡的單點(diǎn)故障。

 其他硬件故障
在HACMP中沒(méi)有直接支持,但可通過(guò)AIX Error Notification功能來(lái)捕獲特定錯(cuò)誤并執(zhí)行響應(yīng)命令,例如:當(dāng)發(fā)生關(guān)鍵硬件故障時(shí)可以shutdown,由另一個(gè)節(jié)點(diǎn)接管。

 應(yīng)用程序錯(cuò)誤
可以自己編寫(xiě)應(yīng)用監(jiān)視程序監(jiān)視應(yīng)用程序的錯(cuò)誤信息或進(jìn)程狀態(tài),也可以通過(guò)AIX的SRC功能進(jìn)行管理。

HACMP錯(cuò)誤
HACMP的主進(jìn)程發(fā)生錯(cuò)誤時(shí),可升級(jí)為節(jié)點(diǎn)故障進(jìn)行處理。

 電源故障
不要將同一設(shè)備的電源連接到一個(gè)電源上,最好使用UPS。

1.7 哪些情況下不適合使用HACMP

HACMP并不是萬(wàn)能的,以下應(yīng)用環(huán)境不適于采用HACMP來(lái)實(shí)現(xiàn)高可用性:
應(yīng)用程序不在檢查點(diǎn)(Check-Point)時(shí)將數(shù)據(jù)寫(xiě)入磁盤(pán)。這樣會(huì)造成節(jié)點(diǎn)故障時(shí),無(wú)法保證數(shù)據(jù)的完整性。
系統(tǒng)崩潰后,應(yīng)用程序不能自動(dòng)恢復(fù)其數(shù)據(jù)。
哪怕幾秒鐘的巖機(jī)時(shí)間都是不可接受的。
內(nèi)存里的內(nèi)容不能丟失
對(duì)于最后兩種情況,建議采用容錯(cuò)系統(tǒng)。

 
打賞
 
更多>同類方案
0相關(guān)評(píng)論

 
最新方案
點(diǎn)擊排行
?
網(wǎng)站首頁(yè)  |  付款方式  |  版權(quán)隱私  |  使用協(xié)議  |  聯(lián)系方式  |  關(guān)于我們  |  網(wǎng)站地圖  |  排名推廣  |  廣告服務(wù)  |  RSS訂閱  |  違規(guī)舉報(bào)  |  京ICP備11008917號(hào)-2  | 
 
主站蜘蛛池模板: 西乌珠穆沁旗| 霍林郭勒市| 扬中市| 青川县| 方山县| 安义县| 屏东县| 赣榆县| 衡阳市| 乌拉特前旗| 太保市| 广宁县| 田阳县| 湾仔区| 肇东市| 宁波市| 寿光市| 新蔡县| 漯河市| 长丰县| 阿坝县| 开封县| 双牌县| 龙海市| 西和县| 古丈县| 奎屯市| 莱西市| 胶南市| 广西| 滁州市| 监利县| 边坝县| 吕梁市| 红河县| 通渭县| 名山县| 梁山县| 汪清县| 自贡市| 普格县|