国产激情久久久久影院小草_国产91高跟丝袜_99精品视频99_三级真人片在线观看

集群組管理原理與系統(tǒng)的實現(xiàn)

  • 相關(guān)推薦

集群組管理原理與系統(tǒng)的實現(xiàn)

歡迎瀏覽,以下是YJBYS求職網(wǎng)給您推薦一篇關(guān)于集群組管理原理與系統(tǒng)的實現(xiàn)的計算機(jī)應(yīng)用畢業(yè)論文


摘要:集群系統(tǒng)的出現(xiàn)允許用戶把普通商用硬件系統(tǒng)組成集群,并根據(jù)需要隨時在集群中增加新的硬件,提高了系統(tǒng)的伸縮性和可用性,從而能夠在價格相對低廉的中低端平臺上享用過去只有高端系統(tǒng)才具備的高可伸縮性和高可用性,既提高了系統(tǒng)的性能,同時也降低了成本。因此,集群成為了高性能計算領(lǐng)域矚目的焦點。

引言

隨著Internet商業(yè)服務(wù)的飛速發(fā)展,服務(wù)系統(tǒng)的可用性程度對服務(wù)提供者的商業(yè)利益具有重大的影響。同時,由于通過計算機(jī)服務(wù)系統(tǒng)提供的服務(wù)內(nèi)容和服務(wù)范圍都在不斷擴(kuò)大,計算機(jī)服務(wù)系統(tǒng)的規(guī)模也需不斷擴(kuò)大,現(xiàn)有的小規(guī)模的高可用系統(tǒng)己經(jīng)難以滿足這樣大規(guī)模計算機(jī)系統(tǒng)對高可用性支持的需求。因此研究可擴(kuò)展的高可用集群系統(tǒng)十分重要。

1、心跳技術(shù)

失效監(jiān)測是所有高可用性的基礎(chǔ),如何才能做到盡快、盡可能準(zhǔn)確地對節(jié)點的失效進(jìn)行監(jiān)測,這需要有一個好的模型。

心跳模型被廣泛應(yīng)用于2~8個節(jié)點的小規(guī)模集群中。相對于上百個節(jié)點的大規(guī)模集群來說,小規(guī)模的集群使用心跳模型監(jiān)測,對系統(tǒng)造成的負(fù)荷較小,并且小規(guī)模集群的網(wǎng)絡(luò)帶寬大、速度較快、延遲較小,這樣心跳模型可以作出較為精確的判斷。當(dāng)心跳模型應(yīng)用于兩個服務(wù)器的集群時,兩個服務(wù)器采用活動/備份,或者活動/活動集群模型工作,它們之間使用心跳模型進(jìn)程相互監(jiān)測,這個框架應(yīng)用得相當(dāng)普遍。但是當(dāng)集群的節(jié)點數(shù)大于2的時候,心跳模型同樣也能較好的保證準(zhǔn)確、迅速地對失效節(jié)點作出判斷。

2、集群組管理原理

(1)節(jié)點加入:每一個節(jié)點在啟動的時候,會讀取自身的配置文件,配置文件中包括節(jié)點ID號,自身IP地址,多播IP地址和端口號,初始化消息和自身節(jié)點。接著會周期性地發(fā)送

加入請求消息,直到收到其他節(jié)點的加入確認(rèn)消息。

(2)節(jié)點的離開/故障:首先需要監(jiān)控節(jié)點的狀態(tài),是通過對方發(fā)送的心跳消息來監(jiān)測的,即如果在三個周期內(nèi)沒有收到某節(jié)點的心跳消息,則認(rèn)為它離開了或出現(xiàn)故障了。這里有兩種情況:一是備份節(jié)點的離開/故障,直接將該節(jié)點從節(jié)點列表中刪除即可。二是主節(jié)點的離開/故障,那么需要重新從剩余的節(jié)點中選擇一個新的主節(jié)點,選擇策略很簡單,即從剩余節(jié)點中選擇一個ID號最小的為新主節(jié)點,并刪除離開或出現(xiàn)故障的主節(jié)點。

(3)正常運(yùn)行:由于節(jié)點正常運(yùn)行,它會周期性的發(fā)送心跳消息,標(biāo)識自己的存在,那么其他節(jié)點會周期性的收到該節(jié)點的心跳消息,從而維護(hù)著一個集群節(jié)點列表。

3、集群組管理系統(tǒng)的實現(xiàn)

3.1 節(jié)點加入前的準(zhǔn)備工作

每一個節(jié)點都有一個配置文件configure.file,存放在./config目錄下。前面定義了節(jié)點類型,消息類型,在節(jié)點啟動的時候,首先讀取配置文件(主要由函數(shù)read_profile( )實現(xiàn)),將配置信息:節(jié)點ID號,自身IP地址,多播IP地址和端口號等初始化自身節(jié)點和待發(fā)送的消息,并將自身節(jié)點首先加入到節(jié)點列表中。

3.2線程同步的實現(xiàn)

一個進(jìn)程中的所有線程共享相同的全局內(nèi)存,這使得線程很容易共享信息,但是這種簡易性也帶來了同步(synchronization)問題。一個進(jìn)程中的所有線程不僅共享全局變量,而且共享:進(jìn)程指令、大多數(shù)數(shù)據(jù)、打開的文件(如描述字)、信號處理程序和信號設(shè)置、當(dāng)前工作目錄、用戶ID和組ID,F(xiàn)實中,涉及到多個線程同時運(yùn)行,比如gm_listener線程,它負(fù)責(zé)監(jiān)控接收到的多播消息,并作相應(yīng)的處理,比如收到加入消息判斷是否在節(jié)點列表中,不在則將之加入,并發(fā)送加入確認(rèn)消息,收到加入確認(rèn)消息,判斷是否在節(jié)點列表中,不在則將之加入,收到心跳信息,則將對應(yīng)節(jié)點標(biāo)志變量加一。heartbeater線程,通過對狀態(tài)的查詢每隔一個心跳周期發(fā)送加入請求消息或心跳消息,add_flag線程對標(biāo)識每個節(jié)點的狀態(tài)的標(biāo)志變量flag作周期性的減一操作,而test線程周期性的對每個列表中的節(jié)點檢測標(biāo)志變量是否小于0,也即是列表中的節(jié)點是否失效或離開。

4、結(jié)果測試與分析

為了跟蹤消息來源,每次都將收到的消息、類型、發(fā)送節(jié)點的IP地址、角色、狀態(tài)都在控制臺顯示出來,以便分析程序中的問題。而且也在每次test線程執(zhí)行一次檢測后輸出整個節(jié)點列表,這樣有助于了解哪些節(jié)點加入進(jìn)來了,哪些節(jié)點離開或失效了。

實驗的過程主要通過結(jié)束集群管理進(jìn)程來模擬節(jié)點的失效或離開,通過啟動某節(jié)點的集群管理進(jìn)程來模擬節(jié)點的加入,正常運(yùn)行的進(jìn)程來模擬節(jié)點正常運(yùn)行。為此設(shè)計了以下幾個測試用例:

(1)第一個啟動的節(jié)點的確立。在集群組中還沒有成員的情況下,第一個啟動的節(jié)點自動成為主節(jié)點,后來啟動的節(jié)點為備份節(jié)點。實驗過程為:啟動其中任何一個節(jié)點集群管理程序,接著啟動其他節(jié)點集群管理程序。實驗結(jié)果與預(yù)期一致。

第一個啟動4號節(jié)點,實驗截圖如圖1:

圖 1 第一個啟動的節(jié)點默認(rèn)為主節(jié)點

(2)節(jié)點的加入。其實這個過程已經(jīng)在上述測試用例中達(dá)到了目的。新加入的節(jié)點按預(yù)期的要求加入到集群組中,并維護(hù)著統(tǒng)一的成員列表。

6、總結(jié)

在商業(yè)和科學(xué)領(lǐng)域,集群管理還涉及到許多其他的內(nèi)容,因此針對一些具體的應(yīng)用,還有很多的不足。我覺得可以從以下方面來考慮:

(1)   建立一個對集群節(jié)點信息的詳細(xì)監(jiān)控。比如針對機(jī)柜系統(tǒng)環(huán)境、每節(jié)點硬件配置情況、每節(jié)點電壓、各部件溫度、風(fēng)扇轉(zhuǎn)速等硬件狀態(tài)、系統(tǒng)CPU、內(nèi)存、網(wǎng)絡(luò)使用情況等,可指定節(jié)點,也可以圖形方式對各節(jié)點的單項數(shù)據(jù)進(jìn)行對比。以便針對具體故障進(jìn)行處理。

(2) 事件服務(wù)。系統(tǒng)管理員應(yīng)該能夠通過事件服務(wù)設(shè)置系統(tǒng)對事件的自動響應(yīng)。

(3)基于網(wǎng)絡(luò)的管理:重起,關(guān)機(jī);基于串口的管理:開電源、關(guān)電源、硬件重監(jiān)測、控制臺重定向。

(4)實現(xiàn)任務(wù)分發(fā),負(fù)載均衡,高可用性。

(5)開發(fā)友好的管理界面,提高管理的安全性和方便性。

參考文獻(xiàn):

[1] 胡慶平.新型心跳監(jiān)測技術(shù)的研究與實現(xiàn).華中科技大學(xué).2004:31~44

[2  萬春.基于linux數(shù)據(jù)庫集群系統(tǒng)的研究.華中科技大學(xué).2004

[3] 李英壯,李先毅等.基于linux的集群管理系統(tǒng)設(shè)計與實現(xiàn)[J].大連理工大學(xué)學(xué)報.2003,12:168~170

【集群組管理原理與系統(tǒng)的實現(xiàn)】相關(guān)文章:

工資管理系統(tǒng)設(shè)計與實現(xiàn)論文11-30

學(xué)生成績管理系統(tǒng)的設(shè)計與實現(xiàn)03-18

科研項目管理系統(tǒng)的設(shè)計與實現(xiàn)03-06

論科研項目管理系統(tǒng)的設(shè)計與實現(xiàn)03-02

淺析物流倉儲管理系統(tǒng)的設(shè)計與實現(xiàn)論文11-28

物流企業(yè)管理系統(tǒng)的設(shè)計與實現(xiàn)11-17

關(guān)于設(shè)計管理系統(tǒng)信息需求的分析與實現(xiàn)03-03

學(xué)習(xí)管理系統(tǒng)及其標(biāo)準(zhǔn)化實現(xiàn)03-18

供應(yīng)鏈系統(tǒng)管理原理研究12-07

ASP.NET的網(wǎng)站新聞管理系統(tǒng)設(shè)計與實現(xiàn)03-19