- 相關(guān)推薦
網(wǎng)絡(luò)故障處理案例分析
對網(wǎng)絡(luò)整體結(jié)構(gòu)的掌握,是處理網(wǎng)絡(luò)故障的前提,下面是YJBYS收集的網(wǎng)絡(luò)故障的案例分析,希望對你有幫助!
案例二:
[網(wǎng)絡(luò)故障]
某大型化工股份有限公司信息中心報告網(wǎng)絡(luò)故障,新近進行網(wǎng)絡(luò)的更新升級和擴容,由10M網(wǎng)全部提升為100M以太網(wǎng),核心交換機為千兆以太網(wǎng)。完工后系統(tǒng)試機時發(fā)現(xiàn),大部分的網(wǎng)絡(luò)成員感覺速度慢,有時數(shù)據(jù)出錯,但子網(wǎng)段內(nèi)拷貝數(shù)據(jù)速度基本不受影響。Ping測試檢查所有工作站和服務(wù)器均正常。
遵照網(wǎng)絡(luò)醫(yī)院上周的建議他們對網(wǎng)絡(luò)布線系統(tǒng)進行嚴格認證測試,布線施工質(zhì)量優(yōu)良,全部電纜光纜鏈路按超五類標準測試參數(shù)均合格,沒有發(fā)現(xiàn)任何問題。由于信息中心除了電纜和光纜的認證測試儀外,沒有其它測試維護工具,無法對網(wǎng)絡(luò)進行評測。雖然仔細進行了網(wǎng)絡(luò)系統(tǒng)及平臺的重新安裝,仍無濟于事。
由于總公司希望全面提高ERP系統(tǒng)的覆蓋范圍,新增的網(wǎng)絡(luò)設(shè)備比較多,網(wǎng)上成員也增加了二倍多,工作站從原來的220臺猛增至680臺,辦公區(qū)和生產(chǎn)區(qū)之間、生產(chǎn)區(qū)和生產(chǎn)區(qū)之間均用光纜和路由器連接起來,因此洪主任抱怨現(xiàn)在網(wǎng)絡(luò)的管理成了問題,查找故障不象從前那樣容易了,一來網(wǎng)絡(luò)規(guī)模比以前大多了,故障數(shù)量和種類增多,二來網(wǎng)絡(luò)結(jié)構(gòu)變得比以前復雜多了,故障的定位分析和隔離變得比較困難。
該網(wǎng)絡(luò)各子網(wǎng)段基本上采用核心交換機和工作組交換機作網(wǎng)絡(luò)骨架,用桌面交換機和集線器混用的方式構(gòu)成基層用戶接入平臺,核心交換機之間為千兆以太網(wǎng)連接,用戶全部為100M到桌面。為了便于維護和管理,同時也從安全角度考慮,設(shè)計方案中將大多數(shù)數(shù)據(jù)服務(wù)器均安裝在了網(wǎng)管中心。
[診斷過程]
網(wǎng)絡(luò)為新擴容的網(wǎng)絡(luò),從拓撲圖上看不出網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計有何不合理之處。由于在各子網(wǎng)段內(nèi)拷貝數(shù)據(jù)時速度基本不受影響,所以分析數(shù)據(jù)多在跨網(wǎng)段時受阻。將網(wǎng)絡(luò)測試儀接入辦公區(qū)網(wǎng)絡(luò)的網(wǎng)管中心,打開網(wǎng)段內(nèi)的全部4個路由器的端口觀察,網(wǎng)段間的流量為27%~42%之間,由于網(wǎng)絡(luò)沒有多媒體應用啟用,因此如此高的流量記錄是不正常的。我們需要觀察這些流量的走向,于是在辦公區(qū)將網(wǎng)絡(luò)測試儀串入路由器與交換機之間(100M端口)監(jiān)測,啟動IP矩陣監(jiān)測和以太網(wǎng)MAC矩陣監(jiān)測功能,觀察數(shù)據(jù)流向。結(jié)果如下,大部分的數(shù)據(jù)流向均指向辦公區(qū)的WINS服務(wù)器,而WINS響應流量極少。查看拓撲圖,該WINS服務(wù)器直接與一臺工作組交換機相連,打開工作組交換機的端口記錄檢查,流量記錄為13%,伴隨少許碰撞指示記錄。
為了不影響用戶的使用,下班后我們從測試儀所在端口向WINS服務(wù)器所在交換機端口P32的鄰近端口P31發(fā)送高額流量,選值為90Mbps流量沖擊,并在此鄰近端口P31觀察接收到的流量記錄,記錄顯示為89.7Mbps,這說明端口P31的通道測試是合格的。然后對準WINS服務(wù)器所在端口P32發(fā)送90Mpbs的高額流量,觀察P32端口流量沖擊記錄,結(jié)果顯示為13.5%,并出現(xiàn)大量延遲幀,表明該端口通道測試不合格。將流量發(fā)送方向指向與該端口連接的上游端口P17,觀察P17流量顯示為90Mbps。
問題很清楚,被丟棄和延遲的流量就在P32口。對WINS本身作WINS查詢,10次測試響應只有2次,響應地址正確,響應率20%。重新測試WINS鏈路電纜,合格。測試WINS服務(wù)器網(wǎng)卡,合格;測試交換機的端口P32,低效。在此臨時將WINS服務(wù)器端口P32改接到端口P33,重新啟動系統(tǒng),5分鐘后進行上述測試,全部合格。為了驗證P32口低效,用網(wǎng)絡(luò)測試儀接入該端口并向P17發(fā)送90M流量,收到流量為12%。由于這臺工作組交換機為新品,尚在保用期之內(nèi),因此建議立即更換之。
[診斷評點]
網(wǎng)絡(luò)中的大多數(shù)數(shù)據(jù)服務(wù)器由于設(shè)置在辦公區(qū)的網(wǎng)管中心,所以公司整個系統(tǒng)的工作依賴集中式系統(tǒng)中的這些專用數(shù)據(jù)服務(wù)器,鏈路連接和數(shù)據(jù)交換時需要WINS服務(wù)器提供服務(wù)。與WINS服務(wù)器連接的鏈路中,交換機一側(cè)的端口P32發(fā)射能力低效,使得發(fā)送的信號幅度不符合要求,由于鏈路長度不長,所以并不是對所有的數(shù)據(jù)包WINS服務(wù)器都無響應。
有些數(shù)據(jù)被作為部分錯誤和碰撞數(shù)據(jù)由端口記錄之,大部分從交換機各端口送往P32端口的的數(shù)據(jù)因鏈路接口問題被延遲和丟棄,造成記錄數(shù)據(jù)中有用流量正常,而網(wǎng)絡(luò)用戶速度普遍偏慢的假象。交換機、網(wǎng)卡、集線器和路由器等網(wǎng)絡(luò)設(shè)備的端口一般從工作2~3年開始出現(xiàn)低效現(xiàn)象,5年比例為3%~18%(這取決于不同的廠商產(chǎn)品質(zhì)量,也取決于同一廠商的不同系列產(chǎn)品的產(chǎn)品質(zhì)量)。由于系統(tǒng)中有大量的端口,所以在網(wǎng)絡(luò)維護周期建議中要求每半年對端口性能進行定期測試。每一~二年對布線系統(tǒng)進行一次輪測,尤其對重要的網(wǎng)絡(luò)設(shè)備如服務(wù)器、交換機、路由器等應該堅持定期測試,這樣做對提高網(wǎng)絡(luò)的可靠性有莫大的幫助。
[診斷建議]
建議“病人”所有網(wǎng)絡(luò)設(shè)備進行一次普查,將全部端口都進行備案測試,并列入定期維護的內(nèi)容之一。
案例二:【多協(xié)議使用,設(shè)置不良,服務(wù)器超流量工作】
[網(wǎng)絡(luò)故障]
今天的故事發(fā)生在某機電進出口公司來電告知他們的網(wǎng)絡(luò)昨天剛剛進行了升級,從10M以太網(wǎng)桌面應用全部升級為100M以太網(wǎng)交換到桌面,結(jié)果出現(xiàn)局域網(wǎng)內(nèi)網(wǎng)絡(luò)訪問速度反而比升級前慢的現(xiàn)象。有的訪問很長時間沒有結(jié)果,有的則出錯。他手里有幾款偵測網(wǎng)絡(luò)流量的軟件,啟動運行后也沒有發(fā)現(xiàn)任何問題。對服務(wù)器的Ping測試平均小于1ms,應該不會慢,但不知何故會如此表現(xiàn)。
[診斷過程]
這個故障看起來比較簡單,實際診斷卻頗費周折。該網(wǎng)絡(luò)由4個路由器經(jīng)幀中繼線路與國內(nèi)總部和國際分部鏈接,占據(jù)4層樓面,由2臺千兆核心交換機和二級5臺工作組交換機(每層一臺)以及20臺桌面交換機(每層4臺)組成,100M交換到桌面,結(jié)構(gòu)比較典型。從故障現(xiàn)象看,網(wǎng)絡(luò)聯(lián)通性尚可,但速度受影響。
一般來說,速度慢的原因有很多,比如網(wǎng)上設(shè)備速度跟不上要求,網(wǎng)絡(luò)設(shè)備出現(xiàn)阻塞或瓶頸效應,電纜光纜系統(tǒng)問題使得網(wǎng)絡(luò)數(shù)據(jù)出錯或產(chǎn)生高額碰撞,網(wǎng)絡(luò)協(xié)議設(shè)置錯誤造成無效的重復訪問,應用軟件或協(xié)議設(shè)置錯誤訪問受阻等等。由于剛更新了網(wǎng)絡(luò),原來的電纜系統(tǒng)又沒有經(jīng)過認證測試,根據(jù)以往的經(jīng)驗,電纜系統(tǒng)存在問題的可能性最大,所以我們決定先檢查電纜系統(tǒng)。鑒于所有網(wǎng)絡(luò)成員都有速度問題,我們先抽取部分電纜尤其是主要服務(wù)器的網(wǎng)絡(luò)電纜進行現(xiàn)場認證測試。
系統(tǒng)電纜采用的是超五類線,用電纜認證測試儀測試20條電纜鏈路,結(jié)果出伏出乎意料地全部合格!改用網(wǎng)絡(luò)測試儀對抽測的電纜人工模擬發(fā)送流量,結(jié)果當發(fā)送至75%流量時,碰撞率仍不超過5%,表明網(wǎng)絡(luò)布線系統(tǒng)雖然在工程完工后沒有進行認證測試,但電纜品質(zhì)和施工品質(zhì)還是不錯的,實屬少見。
轉(zhuǎn)而進行網(wǎng)絡(luò)健康指標評測,除了服務(wù)器流量嚴重超標以外,其它如錯誤、碰撞、廣播等都合格。檢測流量分布,基本上都集中在服務(wù)器鏈路上,平均流量達91%。令任意兩臺工作站之間進行拷貝文件操作,速度很快。說明問題很可能就出在服務(wù)器與工作站的協(xié)議流程障礙上。啟動F683網(wǎng)絡(luò)測試的ICMP Ping、ScanHost、ICMP Monitor等功能測試,檢查其IP協(xié)議的工作質(zhì)量,結(jié)果顯示正常。這說明,網(wǎng)絡(luò)連接通道性能是可以的,問題出在協(xié)議的5層以上。
啟動網(wǎng)絡(luò)測試儀的協(xié)議分布偵測功能Protocol Mix,結(jié)構(gòu)發(fā)現(xiàn)其Apple Talk和BanyanVines協(xié)議流量分別為47%和39%,合計流量為86%。進一步顯示運行該協(xié)議的是兩臺主服務(wù)器。
詢問網(wǎng)絡(luò)部主任網(wǎng)絡(luò)設(shè)計運行的是什么協(xié)議,答曰全部是基于視窗環(huán)境的單一的IP協(xié)議。為何會出現(xiàn)Apple Talk和Banyan Vines?答曰根本未知。
由于這兩種協(xié)議有沒有參與該公司的業(yè)務(wù)流程尚且不明,故暫時不能貿(mào)然將其刪除。必須盡快核實現(xiàn)在的業(yè)務(wù)軟件是否依賴這兩種協(xié)議。網(wǎng)絡(luò)部主任告知他是一年前接手網(wǎng)絡(luò)部主任一職的,對業(yè)務(wù)流程軟件并不熟悉,但知道現(xiàn)在運行各軟件的供應商。我們請他立即與該軟件開發(fā)商聯(lián)系,15分鐘后對方發(fā)來傳真明確說明該公司的軟件只在Windows平臺上運行,不支持Apple Talk和Banyan Vines等應用平臺。為慎重起見,我們請各業(yè)務(wù)部門的代表集中辨認并統(tǒng)計現(xiàn)在各自所用的操作平臺和軟件,結(jié)果都不包括Apple Talk和Banyan Vines。至此,我們決定對該協(xié)議平臺進行卸載。一邊操作一邊請林先生查閱以前網(wǎng)絡(luò)檔案,結(jié)果發(fā)現(xiàn)了這兩種平臺的安裝軟盤和應用軟件安裝軟盤。
完成協(xié)議清理作業(yè)后,重新啟動網(wǎng)絡(luò),網(wǎng)絡(luò)訪問立即恢復正常。
[診斷評點]
非工作協(xié)議是指在網(wǎng)規(guī)劃和絡(luò)設(shè)計中未被選用的協(xié)議和應用,但他們存在于各種網(wǎng)絡(luò)平臺之中。作為網(wǎng)絡(luò)上的“游魂”之一,他們會耗用少量網(wǎng)絡(luò)帶寬。常用的被捆綁于視窗平臺的協(xié)議如IPX、IP、NetBEUI基本上沒有沖突。所以許多用戶雖然沒有同時使用這幾種協(xié)議但也會時常同時捆綁這些協(xié)議。NetBIOS設(shè)置有多種平臺協(xié)議的輸入輸出接口,有助于眾多協(xié)議的交互工作和各種協(xié)議平臺及其應用的并存。但從網(wǎng)絡(luò)性能優(yōu)化的角度看,各種協(xié)議平臺和應用版本是由不同廠商開發(fā)的,兼容性始終是一個動態(tài)適應的過程。沒有一種始終能緊密跟蹤各種協(xié)議平臺和應用協(xié)議變化、相容和協(xié)調(diào)的有效方法。從這個意義上講,多協(xié)議工作的沖突是不可避免的。
翻閱六年前網(wǎng)絡(luò)檔案我們發(fā)現(xiàn),該網(wǎng)絡(luò)多年以前一直使用的是Apple Talk和Banyan Vines平臺協(xié)議,當時是請ALP國際公司提供的應用軟件并負責安裝工程。直到三年前才全部安裝啟用視窗平臺和基于IP協(xié)議的新的應用軟件,但APL公司的人員沒有將老平臺卸載,而是簡單地停止啟動運行。后繼的網(wǎng)管人員在交接時因不熟悉這些協(xié)議及其用途,沒有進行清理。最近的這次的網(wǎng)絡(luò)升級工程安裝調(diào)試時根據(jù)原先的網(wǎng)管記錄和服務(wù)器平臺的提示重新安裝并啟動運行了這些軟件。詢問負責軟件安裝的網(wǎng)管人員是否了解這些軟件的用途,答曰因為在老平臺的窗口中一直看見這些軟件,其間也曾詢問過一直任職的財務(wù)經(jīng)理,證實有用,所以才重新安裝之。實則該平臺的設(shè)置與新的應用軟件之間有嚴重沖突,并同時干擾現(xiàn)行應用軟件的有效工作。兩臺服務(wù)器之間一直在互相詢問并重新發(fā)送無法處理的無效數(shù)據(jù)包,除了干擾其它協(xié)議外,直接的結(jié)果就是占用大量的網(wǎng)絡(luò)帶寬,破壞數(shù)據(jù)的傳輸和處理,致使網(wǎng)絡(luò)速度變慢并時常出錯。
另外,網(wǎng)絡(luò)部手里的診斷軟件都是基于視窗環(huán)境的應用軟件,無法觀察其它應用的流量。
[診斷建議]
協(xié)議的無縫互聯(lián)和互操作是軟件開發(fā)工程中的難點。實際的應用軟件品質(zhì)并不如開發(fā)商所標榜的那樣樂觀。為了使網(wǎng)絡(luò)的工作效率達到最佳,網(wǎng)管人員需要經(jīng)常監(jiān)測網(wǎng)絡(luò)協(xié)議數(shù)量及其工作狀態(tài)。對于無用的協(xié)議要即時清理之。重要網(wǎng)絡(luò)在協(xié)議監(jiān)測對新出現(xiàn)的協(xié)議還要監(jiān)測其操作過程,查找其來源。因為許多網(wǎng)絡(luò)在遭到黑客攻擊時常會伴隨某些新協(xié)議的活動。
【網(wǎng)絡(luò)故障處理案例分析】相關(guān)文章:
有關(guān)網(wǎng)絡(luò)故障的綜合分析匯總03-06
DNS服務(wù)網(wǎng)絡(luò)故障案例解析01-23
溝通案例分析03-09
沃爾瑪經(jīng)典案例分析06-22
小米戰(zhàn)略案例分析03-07
經(jīng)典廣告案例以及分析06-20
管理溝通案例分析02-26