- 相關(guān)推薦
淺論當(dāng)前軟件抗衰技術(shù)中存在的幾點問題
[摘要]計算系統(tǒng)軟件抗衰技術(shù)是隨著計算機技術(shù)的發(fā)展衍生出的一個新的研究方向,屬于計算機應(yīng)用研究領(lǐng)域。它涉及系統(tǒng)性能檢測、故障診斷、軟件工程及可靠性分析等方面,主要針對當(dāng)前計算機運行過程中普遍出現(xiàn)的性能衰退現(xiàn)象,研究其原因、檢測和評價方法、軟件抗衰策略及實現(xiàn)技術(shù)。本論文主要探討了當(dāng)前軟件抗衰技術(shù)中存在的幾點問題。
[關(guān)鍵詞]軟件抗衰 軟件工程 計算機軟件
一、引言
軟件的體系結(jié)構(gòu)為軟件系統(tǒng)的構(gòu)造、行為和關(guān)鍵性質(zhì)提供了一個高層的抽象,這種抽象包括對構(gòu)成系統(tǒng)的元素的描述,對元素間交互的描述,對元素間組成模式的描述,以及對模式上的約束的描述。實現(xiàn)抗衰或自愈的軟件系統(tǒng)展示了能在運行時自適應(yīng)以應(yīng)對資源變動,系統(tǒng)故障等情況的能力,這種能力恰好是建立在這種對于軟件系統(tǒng)的高層抽象上的。
二、系統(tǒng)性能的監(jiān)控和采集
系統(tǒng)性能的監(jiān)控和性能數(shù)據(jù)的采集是實現(xiàn)系統(tǒng)抗衰的數(shù)據(jù)來源,是一個必不可少的環(huán)節(jié),因此需要設(shè)計一個能適應(yīng)于分布式計算環(huán)境,并且盡可能少的干擾所監(jiān)控計算節(jié)點,可擴縮的性能監(jiān)控工具。
目前軟件系統(tǒng)正變的越來越復(fù)雜,龐大,能夠反映出系統(tǒng)性能的參數(shù)有成千上百,為了能夠?qū)崟r的獲悉軟件系統(tǒng)所處的狀態(tài),需要高頻率的采集性能參數(shù)數(shù)據(jù),這對監(jiān)控工具的性能數(shù)據(jù)采集、編碼、傳輸、存儲提出了更高的要求。此外,隨著軟件抗衰粒度的細(xì)化,僅有系統(tǒng)級的監(jiān)控已經(jīng)不能滿足要求,因此需要監(jiān)控工具能夠?qū)崿F(xiàn)進(jìn)程級,甚至于線程級的性能監(jiān)控,從而為細(xì)粒度的抗衰策略的研究提供數(shù)據(jù)支持。
度量系統(tǒng)性能狀況的資源耗費參數(shù)有很多,各種資源耗費參數(shù)對于整體性能的影響是各不相同的,因此還需要對所確定的資源參數(shù)的權(quán)重進(jìn)行分析。要確定可以衡量一個計算系統(tǒng)的性能的系統(tǒng)資源參數(shù)已不是很容易的問題,要分析其權(quán)重給出一個計算系統(tǒng)的合理的評價標(biāo)準(zhǔn)便更加困難,目前尚未檢索到有關(guān)這方面的研究報告,但是這方面的工作是非常必要的,它會影響到后期的策略制定。
三、系統(tǒng)性能衰退的檢測和量化
軟件系統(tǒng)運行時的狀態(tài)像人的狀態(tài)一樣可粗略的劃分為“健康”,“亞健康”和“不健康”等三大狀態(tài),狀態(tài)劃分的標(biāo)準(zhǔn)以及如何來量化是需要解決的問題。因為它是抗衰策略的制定和實施的重要依據(jù);同時“不健康”狀態(tài)有著一個比較龐大的范圍,也需要進(jìn)一步細(xì)化,需要細(xì)粒度的刻畫衰退狀態(tài),劃分衰退的范圍,為細(xì)粒度的抗衰提供支持。目前這方面的研究主要是通過檢測軟件系統(tǒng)資源的占用和釋放情況、服務(wù)的響應(yīng)時間和響應(yīng)率來驗證軟件衰退出現(xiàn),但不能給出進(jìn)一步更為細(xì)致的量化。
四、系統(tǒng)性能的預(yù)測
軟件系統(tǒng)的實時性能狀態(tài)能通過選擇性能參數(shù)來刻畫,通過性能衰退的檢測和量化確定,但光有系統(tǒng)狀態(tài)的歷史數(shù)據(jù)和實時數(shù)據(jù)對于軟件抗衰是不夠的,這是因為軟件系統(tǒng)未來的負(fù)載信息和性能狀態(tài)對于抗衰決策的制定同樣有著重要的影響,需要根據(jù)它們做出合理的抗衰決策,從而降低抗衰成本,同時提高可用性。目前這方面的研究工作主要集中是采用線性預(yù)測方式預(yù)測各種系統(tǒng)資源耗盡的時間估計,這種方式往往難于刻畫真正的衰退趨勢,誤差較大,因此有必要開展這方面的研究工作,提出符合精確性更高的預(yù)測方式。
五、軟件抗衰策略決策
軟件抗衰的目的是提高系統(tǒng)的可靠性,提供持續(xù)高質(zhì)量的服務(wù),同時降低服務(wù)的維護(hù)成本,因此軟件抗衰的時間決策和抗衰粒度決策是值得研究的重要內(nèi)容?顾r間的選擇會極大地影響抗衰系統(tǒng),如果在系統(tǒng)負(fù)載高峰期實施,可能帶來較低的服務(wù)率,如果過早的實施,可能增加抗衰成本,過晚的實施,可能需要采用更高粒度的抗衰,也增加抗衰成本。由于在抗衰期間實施抗衰的部分不能正常提供服務(wù),抗衰粒度的選擇又影響了抗衰成本和可用性?顾チ6冗^小,可能抗衰帶來的性能改善不明顯,需要頻的實施抗衰;粒度過大,抗衰實施期間造成的服務(wù)不可用時間較長。目前抗衰策略的決策研究工作基本上基于預(yù)先假設(shè)的狀態(tài)轉(zhuǎn)移概率和單位時間下各種粒度的抗衰成本,通過公式推導(dǎo)出能獲得最大的可用性、最低的抗衰成本的抗衰時間間隔。這種通過分析模型來基于很多假設(shè)得出的抗衰決策,在理論上講得通,而很難應(yīng)用于實際系統(tǒng)抗衰的決策過程中。鑒于上述分析,有必要開展抗衰決策方面的研究工作,使得能夠做出適時適度的抗衰決策。
六、抗衰實施技術(shù)
直觀上解決衰退問題最有效的途徑是重啟整個系統(tǒng),恢復(fù)到初始狀態(tài),不能輕易選擇這種方式的理由是高的抗衰成本和低的系統(tǒng)可用性。因此,目前抗衰實施技術(shù)的研究主要集中在微重啟技術(shù)和遞歸重啟技術(shù)等方面,研究的目的就是以最小的抗衰粒度來到達(dá)抗衰目的、提高系統(tǒng)可用性,無論是微重啟,還是遞歸重啟技術(shù),研究的難點都在于獲取模塊之間的關(guān)聯(lián)關(guān)系,而關(guān)聯(lián)關(guān)系的獲取可能來自靜態(tài)的系統(tǒng)體系結(jié)構(gòu)視圖,也可能來自系統(tǒng)運行時的反射。對于有完整的設(shè)計文檔的系統(tǒng),問題變得很簡單,只需把文檔作為輸入就能解決問題,然而對于缺乏設(shè)計文檔的系統(tǒng),需要在運行時建立模塊之間的關(guān)聯(lián)關(guān)系,這也是研究的難點。
七、結(jié)語
計算系統(tǒng)自身總體結(jié)構(gòu)的復(fù)雜化傾向己使人難以直接進(jìn)行系統(tǒng)性能的衰退檢測和防護(hù),因此需要研究一種新的技術(shù)—軟件抗衰技術(shù)。它能夠擺脫人的干預(yù),自動地檢測和分析計算系統(tǒng)性能,并在性能出現(xiàn)衰退時及時采取必要的措施。該技術(shù)實施的關(guān)鍵是性能檢測與分析和抗衰策略的制定。應(yīng)用了軟件抗衰技術(shù)的計算系統(tǒng)在運行時能自主地維持其高性能,為系統(tǒng)的高可信賴、高性能和高可靠性提供有力的保證。
【淺論當(dāng)前軟件抗衰技術(shù)中存在的幾點問題】相關(guān)文章:
當(dāng)前我國部門預(yù)算改革中存在的問題及建議03-25
淺論經(jīng)濟(jì)責(zé)任審計中存在的問題及對策03-02
探析當(dāng)前英語口語教學(xué)中存在的問題及策略03-18
當(dāng)前信息技術(shù)課堂教學(xué)中普遍存在的問題及對策12-25
論當(dāng)前稅務(wù)執(zhí)法中抽樣取證存在的問題及其完善03-21
當(dāng)前企業(yè)成本管理存在的問題及對策01-06