.FLUKE公司是世界網(wǎng)絡(luò)維護方面的權(quán)威,其生產(chǎn)的網(wǎng)絡(luò)檢測工具相信每個網(wǎng)絡(luò)管理人員都有過接觸,本文通過FLUKE公司的LANMETER網(wǎng)絡(luò)測試儀,介紹了如何查找網(wǎng)絡(luò)故障的方法。
做網(wǎng)管常常會遇到一些棘手的問題,如網(wǎng)絡(luò)緩慢或性能**。這時候如果有一臺網(wǎng)絡(luò)測試儀幫助檢測故障,無疑會極大地提高工作效率。下面從硬件和軟件兩個方面介紹如何使用FLUKE公司的LANMETER網(wǎng)絡(luò)測試儀來檢測網(wǎng)絡(luò)速度慢或性能**。
一、硬件問題的診斷
運行網(wǎng)絡(luò)統(tǒng)計(Network Stats)測試,檢查高的網(wǎng)絡(luò)利用率和異常的高碰撞率。施加少量的后臺流量(每秒100幀LLC流量,每幀100個字節(jié))后再次運行測試。如果你發(fā)現(xiàn)隨傳輸增加時碰撞或FCS錯誤增加,那么就應(yīng)運行電纜掃描(Cable Scan)。
如果碰撞的數(shù)量十分高(超過5%),則要運行碰撞分析(Collision Analysis)測試來確定由于碰撞損失了多少帶寬。將本地和遠(yuǎn)端碰撞所造成的帶寬損失加上后,平均大于0.5%就需進行故障診斷。同時檢查碰撞是否是“突發(fā)”的,而且突發(fā)碰撞的增加不隨網(wǎng)絡(luò)流量增加而增加。也就是說,如果碰撞數(shù)量有較大的變化而沒有對應(yīng)較大的流量增加,那么可能在某個地方有嚴(yán)重的物理層問題。流量水平和碰撞一定有某種關(guān)系。如果在網(wǎng)絡(luò)性能處于可接受的水平而碰撞數(shù)量一直較大,那么在該碰撞域可能有過多的站點進行傳輸,或網(wǎng)絡(luò)的結(jié)構(gòu)需要優(yōu)化以減小網(wǎng)絡(luò)站點之間的距離。過量的碰撞經(jīng)常是物理介質(zhì)所造成的,例如沒有或端接不正確,阻抗不連續(xù)(壞的連接器、連接電纜、被擠壓的電纜等),或有壞的網(wǎng)卡等。
如果利用率很高(持續(xù)峰值超過60%),同時碰撞數(shù)量為可接受的水平(平均值低于5%),那么網(wǎng)絡(luò)可能已經(jīng)飽和。這有些不可能,因為以太網(wǎng)網(wǎng)段如果有很高的利用率時通常會有較高的碰撞率。當(dāng)利用率接近100%,碰撞的數(shù)量會遠(yuǎn)遠(yuǎn)超過好的幀的數(shù)量。這時可能需要安裝交換器、橋或路由器將網(wǎng)絡(luò)分隔成足夠小的子網(wǎng)來支持流量負(fù)載。
運行網(wǎng)絡(luò)統(tǒng)計(Network Stats)測試并檢查錯誤(碰撞以外的)。如果出現(xiàn)錯誤,運行錯誤統(tǒng)計(Error Stats)測試并用放大(Zoom)來了解有問題站點的MAC地址,然后用專家測試(Expert-T)來隔離特定的問題或用電纜掃描(Cable)檢查電纜。如果問題是間歇性的,則要試著更換被懷疑有問題的網(wǎng)卡,因為這些問題在測試時可能不會顯示出來。
檢查一下用戶正在連接的服務(wù)器或服務(wù)是否是在WAN的遠(yuǎn)端,或通過路由連接。如果確實如此,那么用Ping測試(NetWare Ping,ICMP Ping)來檢查通過網(wǎng)段的響應(yīng),并將結(jié)果和你的基準(zhǔn)測試或聽證測試結(jié)果相比較。為了保證幀沒有丟失,要試著連續(xù)進行Ping測試,并且檢查請求的數(shù)量和響應(yīng)的數(shù)量相等(IP主機經(jīng)常會對**個Ping響應(yīng)失敗,那么需要多試幾次)。如果數(shù)量不一致,遠(yuǎn)端媒介或互連設(shè)備(橋、路由器等)可能滿負(fù)荷或有問題。丟幀也是電纜故障的癥狀,例如UTP電纜的串繞,或同軸線的大地環(huán)路。如果懷疑有丟幀,可運行電纜掃描(Cable Cable),測試緩慢站點(以及相應(yīng)的文件服務(wù)器)連接至網(wǎng)絡(luò)的電纜,或連接任何橋或路由器以及它們之間的電纜。
二、軟件問題的診斷
運行網(wǎng)絡(luò)統(tǒng)計(Network Stats)測試。如果有很高的網(wǎng)絡(luò)利用率、較低的碰撞,并且很少有其他錯誤,可運行發(fā)送*多者(Top Sender)測試以獲悉哪一個站點對流量影響*大。應(yīng)前往該站點去檢查并看一下用戶正在網(wǎng)絡(luò)上做什么??赡芤残枰儐栐诜歉叻迤陂g在做什么,或可能需要將該用戶移到另外的網(wǎng)段以改進網(wǎng)絡(luò)對其它用戶的服務(wù)。
如果利用率、碰撞以及錯誤較低,則要詢問用戶正在使用的應(yīng)用和服務(wù)器。檢查相應(yīng)的服務(wù)器看它們是否正處于高利用狀態(tài)下(這和網(wǎng)絡(luò)利用率不同)。對網(wǎng)絡(luò)監(jiān)控儀設(shè)置*多發(fā)送者(Top Sender)濾波地址以查出哪些站點所請求的該服務(wù)*多。*多發(fā)送者(Top Sender)的測試也可對正在感到網(wǎng)絡(luò)性能**的用戶,設(shè)置地址濾波以便查出他們正在和哪個服務(wù)器連接。還應(yīng)詢問用戶對服務(wù)器或服務(wù)的要求。
運行協(xié)議混合(Protocol Mix)來獲悉哪些協(xié)議占用了大多數(shù)的帶寬。像網(wǎng)絡(luò)監(jiān)測儀一樣設(shè)置上層*多發(fā)送者(Top Sender)濾波(例如NetWare、TCP/IP、NetBIOS、Banyan等),這種*多發(fā)送者(Top Sender)的測試可以了解哪個站點對某個特殊的網(wǎng)絡(luò)資源依賴*大。然后檢查看是否可以將該工作移動到較少使用的服務(wù)器或由幾個服務(wù)器共同承擔(dān)。
當(dāng)網(wǎng)絡(luò)故障與利用率的高低有關(guān)時——碰撞很低且沒有錯誤,這可能是和應(yīng)用軟件以及文件服務(wù)器相關(guān)的問題。例如:服務(wù)器可能設(shè)置的高速緩存(Cache)太小;保留的緩存太少;服務(wù)器中的RAM不足;服務(wù)器的硬盤空間太少;使用的是8位網(wǎng)卡等。同時,軟件程序可能正在運行導(dǎo)致異常數(shù)量的磁盤請求。有可能需要將應(yīng)用移動到另一個服務(wù)器,或?qū)F(xiàn)有的服務(wù)器升級或增加新的服務(wù)器。
運行網(wǎng)絡(luò)統(tǒng)計(Network Stats)測試并檢查錯誤(碰撞以外的)。如果出現(xiàn)錯誤,運行錯誤統(tǒng)計(Error Stats)測試并用放大(Zoom)來了解有問題站點的MAC地址,然后用專家測試(Expert-T)來隔離特定的問題或用電纜掃描(Cable)檢查電纜。如果問題是間歇性的,則要試著更換被懷疑有問題的網(wǎng)卡,因為這些問題在測試時可能不會顯示出來。
檢查一下用戶正在連接的服務(wù)器或服務(wù)是否是在WAN的遠(yuǎn)端,或通過路由連接。如果確實如此,那么用Ping測試(NetWare Ping,ICMP Ping)來檢查通過網(wǎng)段的響應(yīng),并將結(jié)果和你的基準(zhǔn)測試或聽證測試結(jié)果相比較。為了保證幀沒有丟失,要試著連續(xù)進行Ping測試,并且檢查請求的數(shù)量和響應(yīng)的數(shù)量相等(IP主機經(jīng)常會對**個Ping響應(yīng)失敗,那么需要多試幾次)。如果數(shù)量不一致,遠(yuǎn)端媒介或互連設(shè)備(橋、路由器等)可能滿負(fù)荷或有問題。丟幀也是電纜故障的癥狀,例如UTP電纜的串繞,或同軸線的大地環(huán)路。如果懷疑有丟幀,可運行電纜掃描(Cable Cable),測試緩慢站點(以及相應(yīng)的文件服務(wù)器)連接至網(wǎng)絡(luò)的電纜,或連接任何橋或路由器以及它們之間的電纜。