交換機(jī)在網(wǎng)絡(luò)建設(shè)中使用得非常普遍。與此同時在日常工作中,交換機(jī)故障的現(xiàn)象是多樣的,故障的原因也是多樣的,本文將交換機(jī)分為硬件和軟件故障,并針對性地進(jìn)行分析,逐類排除。

一、交換機(jī)故障分類:

交換機(jī)故障一般可以分為硬件故障和軟件故障兩大類。硬件故障主要指交換機(jī)電源、背板、模塊、端口 等部件的故障,可以分為以下幾類。

(1)電源故障:

由于外部供電不穩(wěn)定,或者電源線路老化、靜電或者雷擊等原因?qū)е码娫磽p壞或者風(fēng)扇停止,從而不能正常工作。由于電源緣故而導(dǎo)致機(jī)內(nèi)其他部件損壞的事情也經(jīng)常發(fā)生。

針對這類故障,首先應(yīng)該做好外部電源的供應(yīng)工作,通過引入獨(dú)立的電力線來提供獨(dú)立的電源,并添加穩(wěn)壓器來避免瞬間高壓或低壓現(xiàn)象。一般來說,有兩路電供電,但由于各方面的原因,不可能為每臺交換機(jī)提供雙路供電,可以添加UPS(不間斷電源)來保證交換機(jī)的正常供電,最好使用提供穩(wěn)壓功能的UPS。另外還要在機(jī)房內(nèi)設(shè)置專業(yè)的避雷措施,來避免雷電對交換機(jī)的傷害。

(2)端口故障:

這是最常見的硬件故障,無論是光纖端口還是雙絞線的RJ-45端口,在插拔接頭時一定要小心。如果不小心把光纖插頭弄臟,可能導(dǎo)致光纖端口污染而不能正常通信。我們經(jīng)?吹胶芏嗳讼矚g帶電插拔接頭,理論上講是可以的,但是這樣也無意中增加了端口的故障發(fā)生率。在搬運(yùn)時不小心,也可能導(dǎo)致端口物理損壞。如果購買的水晶頭尺寸偏大,插入交換機(jī)時,也容易破壞端口。此外,如果接在端口上的雙絞線有一段暴露在室外,萬一這根電纜被雷電擊中,就會導(dǎo)致所連交換機(jī)端口被擊壞,或者造成更加不可預(yù)料的損傷。

一般情況下,端口故障是某一個或者幾個端口損壞。所以,在排除了端口所連計算機(jī)的故障后,可以通過更換所連端口,來判斷其是否損壞。遇到此類故障,可以在電源關(guān)閉后,用酒精棉球清洗端口。如果端口確實被損壞,那就只能更換端口了。

(3)模塊故障:

交換機(jī)是由很多模塊組成,比如:堆疊模塊、管理模塊(也叫控制模塊)、擴(kuò)展模塊等。這些模塊發(fā)生故障的機(jī)率很小,不過一旦出現(xiàn)問題,就會遭受巨大的經(jīng)濟(jì)損失。如果插拔模塊時不小心,或者搬運(yùn)交換機(jī)時受到碰撞,或者電源不穩(wěn)定等情況,都可能導(dǎo)致此類故障的發(fā)生。

當(dāng)然上面提到的這3個模塊都有外部接口,比較容易辨認(rèn),有的還可以通過模塊上的指示燈來辨別故障。比如:堆疊模塊上有一個扁平的梯形端口,或者有的交換機(jī)上是一個類似于USB的接口。管理模塊上有一個CONSOLE口,用于和網(wǎng)管計算機(jī)建立連接,方便管理。如果擴(kuò)展模塊是光纖連接的話,會有一對光纖接口。

在排除此類故障時,首先確保交換機(jī)及模塊的電源正常供應(yīng),然后檢查各個模塊是否插在正確的位置上,最后檢查連接模塊的線纜是否正常。在連接管理模塊時,還要考慮它是否采用規(guī)定的連接速率,是否有奇偶校驗,是否有數(shù)據(jù)流控制等因素。連接擴(kuò)展模塊時,需要檢查是否匹配通信模式,比如:使用全雙工模式還是半雙工模式。當(dāng)然如果確認(rèn)模塊有故障,解決的方法只有一個,那就是應(yīng)當(dāng)立即聯(lián)系供應(yīng)商給以更換。

(4)背板故障:

交換機(jī)的各個模塊都是接插在背板上的。如果環(huán)境潮濕,電路板受潮短路,或者元器件因高溫、雷擊等因素而受損都會造成電路板不能正常工作。比如:散熱性能不好或環(huán)境溫度太高導(dǎo)致機(jī)內(nèi)溫度升高,指使元器件燒壞。

在外部電源正常供電的情況下,如果交換機(jī)的各個內(nèi)部模塊都不能正常工作,那就可能是背板壞了,遇到這種情況惟一的辦法就是更換背板了。但硬件更新后,同一名稱的電路板塊可能有多種不同的型號。本文由公眾號云極安整理,在一般情況下,新型號電路板的功能會兼容舊型號電路板的功能。但舊型號的電路板的功能,就不一定能兼容新型號電路板的功能了。

(5)線纜故障:

連接電纜和配線架的跳線是用來連接模塊、機(jī)架和設(shè)備用的。如果這些連接電纜內(nèi)的纜芯或跳線發(fā)生了短路、斷路或虛接,就會形成通信系統(tǒng)的故障。

從上面的幾種硬件故障來看,機(jī)房環(huán)境不佳極易導(dǎo)致各種硬件故障,所以醫(yī)院在建設(shè)機(jī)房時,必須先做好防雷接地及供電電源、室內(nèi)溫度、室內(nèi)濕度、防電磁干擾、防靜電等環(huán)境的建設(shè),為網(wǎng)絡(luò)設(shè)備的正常工作提供良好的環(huán)境。

二、交換機(jī)的軟件故障:

交換機(jī)的軟件故障是指系統(tǒng)及其配置上的故障,它可以分為以下幾類。

(1)系統(tǒng)錯誤:

程序BUG:軟件程序設(shè)計存在著缺陷。交換機(jī)系統(tǒng)是硬件和軟件的結(jié)合體。在交換機(jī)內(nèi)部有一個可刷新的只讀存儲器,它保存的是這臺交換機(jī)所必需的軟件系統(tǒng)。由于當(dāng)時設(shè)計的原因,存在一些漏洞,在條件合適時,會導(dǎo)致交換機(jī)滿載、丟包、錯包等情況的發(fā)生。

對于此類問題,我們需要養(yǎng)成經(jīng)常瀏覽設(shè)備廠商網(wǎng)站的習(xí)慣,如果有新的系統(tǒng)推出或者新的補(bǔ)丁,請及時更新。

(2)配置不當(dāng):

由于各種交換機(jī)配置不一樣,網(wǎng)絡(luò)管理員往往在配置交換機(jī)時會出現(xiàn)配置錯誤。主要錯誤有:

1、系統(tǒng)數(shù)據(jù)錯誤:系統(tǒng)數(shù)據(jù),包括軟件設(shè)置,用于對整個系統(tǒng)進(jìn)行定義。如系統(tǒng)數(shù)據(jù)出現(xiàn)錯誤,也會造成系統(tǒng)全方位的故障,對整個交換局產(chǎn)生影響。

2、局?jǐn)?shù)據(jù)錯誤:局?jǐn)?shù)據(jù)是根據(jù)交換局的具體情況而定義的。當(dāng)局?jǐn)?shù)據(jù)出現(xiàn)錯誤時,也會對整個交換局產(chǎn)生影響。 

3、用戶數(shù)據(jù)錯誤:用戶數(shù)據(jù)對每一個用戶的情況進(jìn)行定義,如果用戶數(shù)據(jù)被錯誤設(shè)置,會對某個用戶產(chǎn)生影響。

4、硬件設(shè)置不合適:硬件設(shè)置是為減少電路板的種類,而在電路板上設(shè)置的一組或幾組開關(guān),用以定義該電路板的工作狀態(tài)或在系統(tǒng)中所處位置,如硬件設(shè)置得不正確,必會導(dǎo)致該電路板工作不正常。

這類故障有時很難發(fā)現(xiàn),需要一定的經(jīng)驗積累。如果不能確定配置是否有問題,請先恢復(fù)出廠默認(rèn)配置,然后再一步一步地配置。最好在配置之前,先閱讀說明書。

(3)外部因素:

由于病毒或者黑客攻擊等情況的存在,有可能某臺主機(jī)向所連接的端口發(fā)送大量不符合封裝規(guī)則的數(shù)據(jù)包,造成交換機(jī)處理器過分繁忙,致使數(shù)據(jù)包來不及轉(zhuǎn)發(fā),進(jìn)而導(dǎo)致緩沖區(qū)溢出產(chǎn)生丟包現(xiàn)象。還有一種情況就是廣播風(fēng)暴,它不僅會占用大量的網(wǎng)絡(luò)帶寬,而且還將占用大量的CPU處理時間。本文由公眾號云極安整理,網(wǎng)絡(luò)如果長時間被大量廣播數(shù)據(jù)包所占用,正常的點(diǎn)對通信就無法正常進(jìn)行,網(wǎng)絡(luò)速度就會變慢或者癱瘓。

總之,軟件故障應(yīng)該比硬件故障較難查找,解決問題時,可能不需要花費(fèi)過多的金錢,而需要較多的時間。要網(wǎng)絡(luò)管理員在平時的工作中養(yǎng)成記錄日志的習(xí)慣。每當(dāng)發(fā)生故障時,及時做好故障現(xiàn)象記錄、故障分析過程、故障解決方案、故障歸類總結(jié)等工作,以積累自己的經(jīng)驗。每解決一個問題后都用心的去回顧問題根源以及解決方法。這樣才能不斷的提高自己,更好的完成網(wǎng)絡(luò)管理的重任。