关于作者

用户名:btzc
笔名:孤独疯子
地区: 内蒙古-包头
行业:其他

日历  

快速登录

+ 用户名:
+ 密 码:

在线留言



友情连接

呵呵,我平时关注的一些地方:)

视频教学材料

访问统计:
文章个数:198
评论个数:81
留言条数:43




Powered by BlogDriver 2.1

孤独疯子的涂鸦之地

 

哎.....................一个孤独流浪在钢筋混凝土构筑的城市中的疯子,何时我才能找到我的目标........我向往的天堂........

文章

永远置顶的一篇文章...........  (作者置顶)

关于本站的QQ和UC群的说明:

      因为最近不是很忙,所以从今天开始,我每天会抽出点时间来管理这些群,如果大家要加入群,请优先选择UC(因为UC的视频和语音比较方便而且系统资源占用比QQ少很多)。今天我把群清理了,大家见谅,如果确实想交流技术的请继续加入,还有我看到那些群聊天记录了,我不希望在有加进来的朋友有太过分的言语,希望大家能有个好的交流空间,我只希望更多的高手能加入到我的群里,能更多的帮助到更多需要帮助的人,在这里再次谢谢支持我的朋友。

本站的QQ群       183434

本站的UC群       5652989

本站的BBS    http://gd08.5d6d.com

呵呵,最近我和同学一起开了个淘宝的店铺,如果大家感兴趣了就去踩踩啊

恒信博众科技公司淘宝店 

       孤独疯子本人的心里话:“今年工作实在太忙了,这个BOLG呢我也更新少了,回答大家疑问也不是很及时,大家见量啊:)毕竟我也的生活不是。呵呵跑题了。继续说这个BOLG吧,这个BLOG本来是我平时上网的时候收集一些我常用到的一些资料的合集,本人自己的做的东西少(主要我的文笔不行,写的东西估计看的人都的骂我,所以我也就很少写了),基本上都是网上摘来的,如果来访的朋友觉的那篇文章侵害到你的权益了,告诉我,我马上剔除。

      留言问问题的朋友注意下,如果可以,请加到QQ或UC群里发问,毕竟留言哪个模块可发的信息量少,我一般晚上都在线的,有问题你发信息就可以了,我基本都隐身24小时在线了,只要我看到问题了,有空就会回的。

下边的都是留言里的问题,处理方法我都写这里了,希望这些朋友能看到。

• 小杰:DISK BOOT FAILURE,INSERT SYSTEM DISK AND PRESS ENTER 

这个问题是系统引导出现问题了,解决办法是找个系统引导修复工具或重新装下系统,呵呵

• 玉痕:我的电脑开机没声音,为什么啊,大哥帮帮我吧 
答:你进了系统后有声音吗?如果没有就是你的声卡驱动没装或有驱动没声音,那就是声卡坏了,如果进了系统有声音的话,那就是你没设置启动声音:)
• 一夫当关:关机时结束程序没有响应 应用程序初始化失败 
关机时结束程序没有响应,那应该是程序运行中,应用程序初始化失败这个就不好说,有可能是程序坏了,也有可能是程序要求的运行环境不符。
• 哩各窿:开机时出现missing operating system怎么办
你的是引导错误,用个引导恢复工具恢复一下就好了
• 玉痕:我的电脑开机没声音,为什么啊,大哥帮帮我吧
      你BIOS里声卡是否屏蔽?的声卡驱动装了吗?你知道你声卡是什么芯片的吗?你先检查下你的声卡驱动,如果你不清楚自己声卡该装什么驱动的话,我建议你打开你的机箱,在主板声卡接口附近有个小声卡芯片,一般有Realtek瑞昱的ALC系列,Cmedia骅讯的CMI系列,Creative创新的CS系列,SiS矽统的SIS系列,VIA威盛的VIA系列,Analog DevicesSoundMAX系列,呵呵,最常见的是ALC和SoundMAX系列的,SIS系列的一般是SIS芯片主板上才有,VIA的和SIS的一样,呵呵,自己研究一下,过段时间我有空了,在整理一份集成声卡的详细介绍,不过你可以参考下我BOLG里这篇网卡的介绍(七大常见的主板集成网卡)看看。如果装完驱动还不行的话,你就的找主板说明书了,然后看看里边的哪个前置声卡接口的地方是不弄错了。

http://blog.sina:我的移动硬盘要点击自动播放才能够打开,不然就开不了.麻烦请帮忙解答一下,谢谢! 2007-03-23 18:32:48

你好,你的这个问题是中病毒了,这篇就是专门处理你哪个问题的,你去处看看Autorun病毒清理及免疫工具 .

- 作者: 孤独疯子 2007年10月22日, 星期一 17:44  回复(0) |  引用(0) 加入博采

explorer.exe产生错误﹐将被windows关闭解决办法

explorer.exe产生错误﹐将被windows关闭解决办法

方法 1
" P/ ?: G" q9 z! y$ s9 F6 K1.在启动计算机并收到该错误信息之后,按 CTRL+ALT+DELETE 键。& |$ Z, b* H0 S  U
2.单击任务管理器
; n8 o! T. F- E3.在"任务管理器"中,单击新任务。
8 D6 C, q8 [$ p( f: M4.键入 control,然后按 ENTER 键以启动"控制面板"。
' Y, K' o" M+ w7 V  c, K5.双击添加/删除程序。, E( }5 p8 \/ c/ T( s9 o7 j
6.在当前安装的程序列表中,单击 CleanSweep,然后单击更改/删除。& A3 u: N+ l% U* A
7.删除 CleanSweep。( C0 K( D$ N, ^8 M! P8 g
8.重新启动计算机。  t& H9 H8 U( _* L
. G3 a5 C/ u/ K; ?1 K5 E" O
方法 20 F0 s$ V: @2 {
1.重新启动计算机。在出现启动菜单时,按 F8 键选择选项,以便在"安全"模式下启动。; v2 G  w$ L8 d; p+ C% B" p5 O
2.选择安全模式命令提示符选项。
+ e! l# v) r5 o( \7 \- O7 B( m3.登录以后,键入 appwiz.cpl,然后按 ENTER 键以启动"添加或删除程序向导"。4 W; g' x' }8 _; C$ g9 y- W
4.在当前安装的程序列表中,单击 CleanSweep,然后单击更改/删除。
9 q; d) Q: a9 I/ I: P% }5.删除 CleanSweep 程序。! J$ X" d: f6 T9 m. J- @" x7 Q
6.重新启动计算机。
8 f) j3 U& B" r- U9 E
" \/ _8 K, c/ N% [8 \) k( B方法 3
7 R; ~9 r9 F2 C6 j1.重新启动计算机。在出现启动菜单时,按 F8 键选择选项,以便在"安全"模式下启动。/ Z3 `0 y, i% t7 H( V# ~. K: _( b
2.选择安全模式命令提示符选项。% O7 m- K! R- H. u1 y' _
3.更改到 %SystemRoot%System32 文件夹。这通常是 C:WINNTSystem32 文件夹。1 o4 |! C: `6 P9 A
4.将 Apitrap.dll 文件重命名为 Apitrap.old。
7 n6 V2 r* {/ p1 P3 ^5.重新启动计算机。5 o+ P4 g. P: ]4 g' x: W7 P

/ y2 M" R1 T* @4 d; Q% b
" d  {6 m: V: H2 |; k二、建议使用最新版的病毒软件进行查杀,如果问题还没解决,请使用SFC命令进行修复一下,
6 d2 d+ z" i5 g* }$ z+ ?单击“开始→运行”,输入“sfc /scannow”并回车,然后将Windows 安装光盘插入光驱,等
/ Q7 v, Z6 g5 t/ X/ \系统自动修复完毕,问题应该可以解决。
2 l$ x4 C. D+ P3 [, G$ r$ E( W/ }/ @, `7 |
其它原因:
9 ]0 A& p) }* U9 g. N: F7 Q# x: G1. 输入法原因
' i! e$ ]3 u0 L安装清华紫光输入法3.0版本有的时候会出现explorer.exe出错,取消清华紫光输入法,用其他输入法输入如果没有问题,可以判断为输入法问题。卸载清华紫光输入法,即可解决。
8 u4 C7 s% B, J/ p4 z2 _清华紫光输入法4.0版本未发现类似问题。: V, _1 ~' ^' X6 B% H( H, t
, K1 i( }/ |9 `
2. explorer.exe程序本身的原因" t3 z; h, d0 B- q# B6 w  i' A
检查explorer.exe的文件大小,正常情况下应该显示为237k或者238k,如果大小不一致,可以从别的机器上拷贝一个 explorer.exe文件到本机,调用任务管理器,接入explorer.exe进程,然后新建任务拷贝新的文件到系统盘\WINNT目录下。
$ S7 \/ Q( s& q
- Z; S7 M# Q1 ^) `8 b. K1 D8 Q$ L5 R+ a3. 可能为病毒原因(wc98pp.dll)
3 g% u! a# k# V  C6 y网络协议处理器 - 电子书编译工具Web Compiler相关。wc98pp.dll文件本身并没有影响,很多计算机上都有此文件,但是当explorer.exe出错的时候,删除此文件可7 ~  ~- T) }# W6 x7 [+ X
以解决问题,然后从注册表中搜索相关键值删除。3 Z3 b" L- q4 d. y* U
      usign.dll,有人提到这个文件与wc98pp.dll两个文件类似,删除这两个文件可以清除IE中不断跳出小广告。在公司的计算机中未发现此文件。
  ?/ |! U; v' S3 i- o  \" _+ j. O5 g! I" x8 y! r
4. 其他原因
# H" i2 F$ q9 i8 L& P: I. U. S计算机运行某个程序等待时间过长,比如读取数据,尤其是光盘或者外界设备的数据的时候,也会出现explorer.exe出错,提示与上面的情况相同。
% l" _9 v. X0 b5. 系统内核错误
. P( i  F: x: P" P' C( S( ]此类情况暂时无法解决,重新安装系统。

- 作者: 孤独疯子 2008年04月7日, 星期一 14:47  回复(0) |  引用(0) 加入博采

组装电脑的五大低级误区
(1)CPU篇
0 k8 h9 t# b- q6 ~: G' r& e# z# u3 ~
3 [$ u1 s& v" W5 _很多人认为CPU主频越高越强,这条件只存在于同等架构的CPU下对比才能成立。例如3G的奔腾D915能比2.6G的5000+强吗?2.6G的5000+能比2.33G的E6550强吗?不可能,因为架构根本不同,没得比,只能从实测性能去评估。某些人说“Intel的CPU稳定,AMD的玩游戏快,不过就是不稳定,而且兼容性也不够”,真的是那样吗?首先是否稳定是取决于电源供电率是否能保持稳定,还有主板滤波,系统也优化占有很大程度。至于兼容,有人敢说CPU也有兼容性问题的就可以无视了,明显不是小白就是忽悠人,只要没有硬伤,主板芯片和供电也是支持的话兼容是绝对没问题的。而且当时说AMD玩游戏好并不是指AMD的CPU游戏性能就是比Intel高,只是达到同等游戏性能的话用AMD平台花费得更少。而整机性能是否强悍并不是只取决于CPU,还要考虑内存,512M内存+E6550也不见得比PE2180+1G内存流畅,玩游戏的更要把显卡也考虑进去。玩高配置游戏游戏的时候,如果你用QX6600+8600GT,效果比E6550+8800GT差也更加正常,希望大家购机时不要只看CPU,还得根据自己的实际用途和整体性能均衡去考虑。我帮人配机的时候就遇到N个人说什么CPU要强点的,有限预算内把CPU加强就等于要降低其它的性能,根本是破坏整体均衡性能,反而得不偿失。你跑个系统看得出E6550和PE2180这相差700元的CPU的性能差别吗?你玩玩大型游戏的话,差距700元的显卡就足以让你体验什么是游戏性能
4 ?) e  @( l+ O2 _4 Q, K2 b. |3 y: I! ?0 Q. P% g
8 x+ ^) a% Z. y' x$ }
! [  L/ d9 m3 A5 P% Z& N
(2)主板篇
+ k7 x* M! o( k1 z6 ~  o: V& o. w2 s- `% u) a; i8 `* w
大部分JS都说华硕主板好,大品牌的话能差吗?(能说出这话的人就可以证明他没有能耐,只能信品牌。)我可以告诉你们,如果大品牌真的全部都这么好,为什么其他品牌还能有活路?难道消费者全部都是白痴吗?主板的好坏在于主板的布局设计,用料,散热等方面,很大程度上影响主板的寿命。再好的大厂也有垃圾板,再弱的小厂也会有好板,500元在大厂买低端板和在小厂买高端板,这大厂的板能比得上吗?有些人还说“大厂的主板就是稳定”难道二三线厂的主板就不稳定吗?开几个QQ就死机?品牌观啊!难道布局有点不同就非要说这是大厂增加稳定性的设计?简直开玩笑,要是立场对调,不知道那种人还怎么看。现时很多人说什么主板是全固态电容的,全固就一定好吗?那只是一个卖点。日常使用,无论固态还是电解电容都是一样的用,不要被所谓的全固蒙蔽了眼睛,一个固态电容能值几个钱?难道打仗的时候,金铸的大炮就会比铜铸的大炮要好?高性能主板能提升性能?性能取决于CPU,内存,显卡,硬盘这些,主板起作支架作用。平台的主板就像一个人的身体那样,一个身体很壮的人,但手脚不灵活,脑筋也不发达,能多干活吗?主板需求的是稳定,耐用,有些人还强调需要超频。至于高性能,我说:“什么叫高性能的主板?能让CPU和显卡发挥超越设定的性能吗?一派胡言!”最近很多人喜欢做SLI,说双显卡性能高,但必须主板支持。我想问问,是否真的有做SLI的必要?首先SLI就是加大电源和CPU的负荷,退一步说让你8600GT做SLI,还不如买张8800GT或者HD3850,2张8800GT做SLI还不如直接买8800Ultra。假如你做SLI的话,那需要什么用的CPU?这个价位组建的平台还得用那普通的SLI主板吗?早就用那些2000多块的主板了,什么时候才轮得到它?我帮人配机极少用太高端主板,基本是做工用料设计布局都行的就没问题,最紧要的就是稳定耐用。太高端的板也不见得稳定性能高到哪,还不如用多出来的预算在电源,CPU,显卡,内存方面加强,这样才配出同等价位更高性能的配置。 / p+ q" t; [8 ~( P3 o2 l
' }  d1 p. E: B, z/ K
4 _5 y" T9 S& M% j0 j
(3)内存篇 8 U( U- L7 Z4 H; U. u: L* x

( T" r* T$ U, C2 G内存容量当然越多越好,现在1G内存已经普及了。只要你不是超频发烧友,基本都没必要专门挑选特别好的内存,个人习惯是用宇瞻,金士顿(正货),威刚(红色威红),金邦(白金)这些。黑金刚悍将版的内存也很能超,那是采用D9GMH颗粒的内存条,耐压度强比较适合超频用,不过D9颗粒的内存存在一个致命的弱点,就是兼容性比较差,现在的D9超频条也普遍存在较早夭折的问题。所以不建议普通用户使用,大型游戏时DDR667和DDR800的性能差异也只在2%-3%的差距,可以感觉出实际差别吗?我让你超到DDR1000以上,性能明显不?而且这对散热,内存颗粒,主板支持度有很大关系,搞不好的话使硬件过早老化,系统不稳定等问题。我自己的机子也只是小超玩一把,要记住:性能和寿命往往成反比,看看那些超频发烧友的机子用了多久?有连续3年保持极限超频的机子去用?我也并不是说叫大家绝对不要超频,但超频是必须建立在系统稳定和散热良好的情况下进行,往往会增加不少额外的预算,所以说只要内存能兼容就可以了没有必要太追求过高带宽,反而会为自己的金钱和正常使用带来麻烦。- d8 S* ]+ }& K; w+ v$ A
" r  W: e- ^; h0 g. f( p. N
(4)显卡篇
6 `. c( w" K- Q$ T
2 u: Q' I1 D' s+ g, Z+ ^1 |不少商家卖显卡都说什么512M的独立显卡,那显卡算高性能吗?显存再高也是忽悠人的,你究竟买张什么样的显卡你知道吗?8500GT 512M(DDR2显存)在游戏上的性能连7300GT 256M(DDR3显存)也比不上,就连8800GT这级别的显卡512M与256M性能差异也只在数个百分点之间,其它的低端显卡还比得出性能差别?显卡性能取决于芯片性能,芯片频率,显存频率,至于其稳定性和耐用度也得看显卡布局设计,用料,散热装置。有些主板商说xx主板集成显卡相当于独立显卡的性能,那简直是一派胡言。现在的显卡都得上散热片+风冷,难道你比得上独立显卡性能的就可以不上风冷?如果有这样的技术早就在独立显卡上应用了,显卡厂商就早用来降低散热系统的成本了。就算同样的显示芯片,也永远不可能达到同等芯片频率和显存频率,而且共享内存的延迟远远大于独立显存的延迟,所以指望集成显卡能比得上独立显卡的人,你想都别想,除非是比N年前的MX440这些还可以。
! G8 e% X# |. g  x8 m- X8 R
9 S$ G1 Z* M# P. O
/ \$ e/ |' L8 \' S( C! V0 r(5)电源篇 + }0 K3 P& I1 z; o

* l3 H# _- Z/ U8 M% U1 y1 l& \一般人总会忽略电源稳定性问题,只认为电源功率够用就可以了,殊不知电源的供电稳定性直接影响硬件(特别是主板)的寿命。例如曾经有个服务器的电源,测试的时候,供电是只是短时间在12.47-12.52V徘徊,=_=!稳定得令人心寒。功率问题还得多说一句,一般电源的额定功率(就是指保证稳定的功率)是占峰值功率的70-80%之间(简称转换率),JS经常说300W电源一般都是指峰值300W电源,其实际功率一般都是220W,如果有独立显卡的话,令人担忧。如果是有独立显卡的用户,要买就买额定300W的电源,而且电源我一般都不用杂牌的。要想系统稳定就得先要电源功率稳定,个人习惯用TT,航嘉,先马,全汉,康舒,海韵等电源。大陆市场似乎很多人用长城,个人随机抽一个长城电源测试,电压是在11.87-12.47V徘徊,功率真的不那么稳定,被誉为:硬件杀手!其它杂牌的就更不用说了。要想系统稳定就先得挑好电源,为何服务器专用电源会这么贵?这不用多说吧?因为一个供电稳定的电源是保证一台机子稳定的重要开端。

- 作者: 孤独疯子 2008年04月7日, 星期一 14:44  回复(0) |  引用(0) 加入博采

系统出现内存不能为"Read"原因(加解决方法)
系统出现内存不能为"Read"或"written"的原因有:
8 T4 X; b% B6 ?' Y/ {==============================================================
7 o% d) X. X( f7 r% }1、驱动不稳定,与系统不兼容,这最容易出现内存不能为 Read 或者文件保护
, q9 K8 T, R; ]* D- |2、系统安装了一个或者多个流氓软件,这出现 IE 或者系统崩溃的机会也比较大,也有可能出现文件保护8 y9 t' z! R$ R- I
3、系统加载的程序或者系统正在运行的程序之前有冲突,尤其是部分杀毒软件监控程序
+ Z& `# g* _. W4、系统本身存在漏洞,导致容易受到网络攻击
, O7 y% P; R- ^5、病毒问题也是主要导致内存不能为 Read、文件保护、Explorer.exe 错误……
& ^: J$ r( s2 {3 _2 m( n! H6、如果在玩游戏时候出现内存不能为 Read,则很大可能是显卡驱动不适合(这里的不适合有不适合该游戏、不适合电脑的显卡),也有可能是 DX9.0C 版本不够新或者不符合该游戏、显卡驱动& M7 D: a9 |; P: n3 F4 R
7、部分软件本身自身不足的问题/ W: F! u3 }$ I+ \3 M4 w
8、电脑硬件过热,也是导致内存不能为 Read 的原因之一。
$ L- L; J& ?2 {3 J' b, G, m9、电脑内存与主板兼容性不好也是导致内存不能为 Read 的致命原因!/ `  X3 K5 N2 W( m7 A
, p/ {6 v' u7 k% ^7 U: Z- Z
■ 此问题网上流传一种简单的解决方法:" C- z2 y, K5 ]: O8 g

* u6 d, K( L" s0 l; ^- d' g7 \1、在开始-运行里输入CMD确定,在命令行窗口下输入以下内容后按回车
3 v$ }. a  z! {( B+ q. P: {for %1 in (%windir%\system32\*.ocx) do regsvr32 /s %1
$ M" Z% o/ W8 R* C* C! \完了后,再输入以下内容并回车% Y: a1 ^% S' {7 C7 R
for %1 in (%windir%\system32\*.dll) do regsvr32 /s %1
* Q/ B# U) v( K7 g) w+ H- x1 @这个要好久,耐心等候,但也可能需要重启后整个效果才会出来。

- 作者: 孤独疯子 2008年04月7日, 星期一 14:30  回复(1) |  引用(0) 加入博采

网上邻居九招特殊的应用
1、用搜索法查询网上邻居 ) o# S5 T4 |% V
  大家知道用鼠标双击Windows系统桌面上的“网上邻居”图标时,就会将连接在网上的计算机找到;要是大家不能在网上邻居的窗口中找到自己需要寻找的计算机名字,而需要寻找的计算机又的确是连接在局域网中时,大家就不能再通过普通的方法来查询网上邻居的工作站了。大家可以尝试使用“搜索计算机”的方法,来找到需要访问的网上邻居中的计算机,具体操作步骤为:用鼠标依次单击Windows系统桌面上的“开始”/“搜索”/“搜索计算机”命令,在随后现的对话框中,输入要寻找的共享计算机名字,再用鼠标单击一下“立即搜索”按钮,要不了多长时间,网上邻居中指定的计算机就会出现在搜索结果页面中了。
* u5 y) k4 w" h  2、巧妙设置网上邻居协议
7 K! [; k. [- j$ T+ [2 J  有人说为什么他的计算机桌面中没有网上邻居图标呀?其实这是没有正确设置网上邻居协议引起的,要想让网上邻居正常发挥作用,大家必须合理设置一个名叫NetBEUI的网络协议。由于在默认状态下无论是Windows 98操作系统还是Windows 2000操作系统,都不会自动安装这个协议的;要是不安装这个NetBEUI网络协议的话,那么我们日后直接通过网上邻居图标来访问局域网中的其他工作站时,可能会出现各种莫名其妙的错误,例如在打开的网上邻居窗口中可能会发现局域网内的许多工作站都不能被访问到,而且其他人在网上邻居中也看不到你的计算机名字。为了避免各种访问的故障发生,大家一定要正确设置好网上邻居的协议,具体设置的方法为:首先在Windows 2000桌面上找到“网上邻居”图标,然后用鼠标右键单击该图标,从随后打开的右键快捷菜单中执行“属性”命令;接着在“本地连接”上再用鼠标右键单击之,从其后打开的快捷菜单中执行“属性”命令,在属性对话框中单击“安装”按钮;然后选择“协议”,并执行“添加”命令;在出现的协议选择列表框中,大家可以用鼠标选择“NetBEUI”这个协议,再单击“确定”按钮;随后系统可能会弹出一个提示对话框,要求大家在光驱中放入Windows 2000安装盘,最后根据屏幕的安装向导提示来完成协议的安装任务。 0 ^2 a2 Y7 |, z7 \1 M$ d& c
  3、使用IP快速访问网上邻居   W% M4 H+ S7 d9 r- ?2 V5 Z/ w
  倘若自己计算机中的网上邻居图标无效的话,大家可以使用IP地址来快速访问网上邻居的共享计算机,这种访问方法通常适用于不知道网上邻居中的共享计算机名字的情况下。比方说,大家要访问的网上邻居共享计算机的IP地址为192.168.0.1时,那么大家可以按照下面的步骤来访问网上邻居中的共享计算机:首先在Windows系统桌面上,执行“开始”菜单,从弹出的列表中选中“运行”命令,接着再在运行对话框中输入“192.168.0.1”,并单击确定按钮就能看到自己需要访问的共享计算机了。 % u, U! l- j% C" _8 a
  4、提升网上邻居访问速度
2 U* N1 S* h/ r  现在使用网上邻居进行信息交流往往是许多局域网用户们的首选,但许多人常常感觉到自己在通过网上邻居图标访问其他共享信息时,速度非常缓慢;其实大家可以通过下面的方法来提升网上邻居访问速度:首先在Windows系统桌面上单击开始菜单中的运行,在打开的运行对话框中输入regedit命令,这样系统就能打开注册表编辑窗口了;在这个窗口中大家可以依次访问HKEY_LOCAL_MACHINE/Software/Microsoft/Windows/Current ersion/Explorer/RemoteComputer/NameSpace分支,并将对应NameSpace分支下面的子键删除掉,然后关闭注册表、重新启动计算机就可以了。
0 l8 S6 [& `. n4 `  5、在DOS下访问网上邻居
& C. h+ [0 X% g( Q( Y( z  要是哪天不幸运,Windows系统突然不能正常启动了,而此时要非常着急通过网络来访问网上邻居中的共享资源时,大家该如何操作呢?利用网上邻居图标来访问肯定是不现实的了,因为在DOS状态下根据就没有什么图标,那么我们到底该如何在DOS状态下访问共享资源呢?其实DOS状态下的NET命令可以帮助大家实现这一愿望,大家只要在DOS命令提示符下输入“NET VIEW XXX”命令(其中XXX表示网上邻居中的共享计算机名字),再直接回车,就能查看共享计算机XXX上的资源文件了;要是大家输入“NET USE F:XXXYYY”命令的话,就可以将网上邻居中共享计算机XXX上的YYY目录映射为本地计算机中的F盘了,以后大家可以直接在命令提示符下键入“F:”,就能对网上邻居中的共享资源进行相关操作了。 3 K& D1 P- A4 F  b

, V7 s5 z% @5 Y* Y6 @, S1 X
8 g8 `: o, E8 Q. W  u6、快速登录网上邻居指定域 8 D* B7 P) A, j: Z8 R% Q3 s
  在局域网中,有时为了管理上的方便经常首先建立主域控制器和备份域控制器,在该域中为每位用户设立用户名,并将大量的信息资源存放在该域的成员服务器内。而普通工作站要能正常访问存放在成员服务器中的资料,在启动时就必须首先登录到这个域。为此,大家就必须对工作站机器进行以下设置:首先在Windows桌面的“网上邻居”图标上单击鼠标右键,从随后弹出的快捷菜单中执行“属性”命令;在打开的属性对话框中,大家可以选择“Microsoft网络客户”,接着再用鼠标单击“属性”按钮;在弹出的对话框中,将“登录到Windows NT域”选中,同时在该设置栏的文本框中输入计算机要自动登录的域名,单击单击“确定”按钮并重新启动计算机就可以了。
8 y6 C5 g) d$ w  倘若工作站使用的是Windows 2000操作系统的话,大家可以按照下面的设置步骤来保证计算机能自动登录到指定域上,同时又能对本地计算机具有一切操作权:首先向局域网管理员申请登录到服务器主域所需要的用户名和密码,同时以超级管理员身份登录到本地计算机中;接下来依次执行“程序”/“管理工具”/“计算机管理”命令,在随后打开的窗口中展开“用户和组”,选择“组”;然后在用鼠标右键单击“Administrators”图标,在打开的快捷菜单中选择“添加到组”命令;下面按照屏幕提示,把用户向管理员申请的用户添加到Administrators组中;当选择服务器所使用的域名时,计算机将会要求大家输入访问该域权限的用户名和密码,大家必须正确输入事先申请好的用户名和密码,设置完毕后,重新启动计算机就可以了。
$ ~) \$ K- |( N6 Q  7、使用名字访问网上邻居 + F5 E0 O1 Q! G0 A8 U+ h- i
  在Windows操作系统下,大家可以用被访问的网上邻居中的共享计算机名字作为网络连接命令,来访问指定的共享计算机;比方说,大家想要访问网上邻居中的共享计算机XXX时,可以先用鼠标依次单击“开始”/“运行”命令,在随后弹出的运行对话框中,输入“XXX”,接着直接单击该对话框中的确定按钮,随后大家就能访问到网上邻居中指定计算机上的内容了。 5 ~! E7 R8 l/ z- a% _0 b
  8、删除网上邻居 ) F; g3 [! s4 K
  有时为了安全,需要将网上邻居图标从系统桌面上删除掉。删除网上邻居最方便的方法是直接在网络设置中将NetBEUI和IPX/SPX协议删除掉,具体操作为:首先打开“控制面板”窗口,在这个窗口中打开“网络”属性对话框,然后在该对话框里将NetBEUI和IPX/SPX两种协议选中,并执行删除命令;接着用鼠标右键单击“拨号网络”图标,从弹出的右键菜单中执行“属性”命令,在其后出现的对话框中选择“服务器类型”,并在其中将NetBEUI和IPX/SPX两项选取消,最后重新启动计算机就可以了。 9 T- b- p) Y2 L" }" u
  9、删除无效共享文件夹
6 |" G/ d5 f& Y8 K/ s7 |% x5 M  在网上邻居中传输文件时,我们一般都是先将文件存放在某一文件夹中,然后将文件夹设置为共享,这样就可以直接使用移动、复制的方式来实现文件交流传输的目的;可是,在缺省情况下,文件夹的共享方式即使已经被解除了,我们还能够在“网上邻居”看到共享的文件夹名,不过该文件夹已经无效了。为了将这个无效的共享文件夹删除掉,我们可以按如下步骤来操作: 0 K( T! g8 N# u4 s# G
  首先打开运行对话框,在其中输入注册表编辑命令“regedit”,来打开注册表编辑器窗口;执行该界面中的“编辑”菜单项,选中下面的“查找”命令,在随后出现的查找设置窗口中,输入共享文件夹的具体名称,同时选中该窗口中的“主键”复选项,接着执行“查找下一个”命令;过一会儿,注册表编辑器将打开了HKEY_ LOCAL_MACHINESoftwareMicrosoftWindowsCurrentVersionNetworkLanMan分支,在对应LanMan键值的右边区域中,我们可以找到共享的文件夹名称;用鼠标右键单击该文件夹名称,从打开的快捷菜单中,执行“删除”命令,最后退出注册表编辑窗口,重新启动一下系统,再次打开网上邻居时,我们就看不到无效的共享文件夹名称了。 - H; o- A+ b$ j$ ?! @; R1 c
  当然,还有一种更为简单的删除方法,那就是先在本地计算机中,创建一个空文件夹,并将该文件夹的共享名称设置为与“网上邻居”中无效文件夹相同的名称,,这样屏幕上将打开一个文件夹出现共享冲突的提示,此时我们可以执行提示框中的“是”命令,就能删除无效共享文件夹了!

- 作者: 孤独疯子 2008年04月7日, 星期一 14:26  回复(0) |  引用(0) 加入博采

学会看开机信息
学会看开机信息 为使用电脑时间比较长的老用户,难免会到朋友或同事家帮忙维护、维修电脑,有时还要帮人购买PC,这时我们肯定会带上硬件检测软件,不过,谁也不能随身总是带着这些软件,如果手头上没有合适的检测软件该怎么办呢?总不能因此就什么都不知道吧?那样你的高手形象大大会受损的,其实,离开这些软件我们也能明明白白查看电脑硬件的配置情况。下面我们就来一起学习一下吧。     一、开机自检中查看硬件配置     机器组装结束后即使不装操作系统也可以进行加电测试,在开机自检的画面中就隐藏着硬件配置的简单介绍哟(由于开机画面一闪而过,要想看清楚的话,记得及时伸手按住“PAUSE”键)。   1.显卡信息     开机自检时首先检查的硬件就是显卡,因此启动机器以后在屏幕左上角出现的几行文字就是有显卡的“个人资料”介绍。四行文字中,第一行“GeForce4 MX440……”标明了显卡的显示核心为GeForce4 MX440、支持AGP 8X技术;第二行“Version……”标明了显卡BIOS的版本,我们可以通过更新显卡BIOS版本“榨取”显卡性能,当然更新后这一行文字也会随之发生变化;第三行“Copyright (C)……”则为厂商的版权信息,标示了显示芯片制造厂商及厂商版权年限;第四行“64.0MB RAM”则标明了显卡显存容量。     2.CPU及硬盘、内存、光驱信息     显示完显卡的基本信息之后,紧接着出现的第二个自检画面则显示了更多的硬件信息,像CPU型号、频率、内存容量、硬盘及光驱信息等都会出现在此画面中。该画面最上面两行文字标示了主板 BIOS版本及BIOS制造商的版权信息;紧接着的文字一看就明白啦,当然是主板芯片组喽;其下几行文字则标明了CPU的频率及内存容量、速度。呵呵,我这个CPU和内存是超频使用的,所以频率可不太正规哟;下面四行“IDE……”则标明了连接在IDE主从接口上的设备,包括硬盘型号及光驱型号等等。    3.主板信息    在第二个自检画面的最下方还会出现一行关于主板的信息,前面的日期显示的是当前主板的BIOS更新日期,后面的符号则是该主板所采用的代码,根据代码我们可以了解主板的芯片组型号和生产厂商。以往老主板的自检画面中最下方文字的中间标明的是主板芯片组,这一块板子则将其提到了自检画面的上方。     机器启动之后按“DEL”键进入BIOS设置页面,在基本信息中同样也可以看到机器的硬件信息,与开机画面显示的没有区别。   二、利用设备管理器查看硬件配置     进入操作系统之后,在安装硬件驱动程序的情况下还可以利用设备管理器与DirectX诊断工具来查看硬件配置。下面看看如何利用设备管理器查看硬件信息。进入桌面,鼠标右击“我的电脑”图标,在出现的菜单中选择“属性”,打开“系统属性”窗口,点击“硬件--设备管理器”,在“设备管理器”中显示了机器配置的所有硬件设备。从上往下依次排列着光驱、磁盘控制器芯片、CPU、磁盘驱动器、显示器、键盘、声音及视频等信息,最下方则为显示卡。想要了解哪一种硬件的信息,只要点击其前方的“+”将其下方的内容展开即可。    利用设备管理器除了可以看到常规硬件信息之外,还可以进一步了解主板芯片、声卡及硬盘工作模式等情况。例如想要查看硬盘的工作模式,只要双击相应的IDE通道即可弹出属性窗口,在属性窗口中可轻检看到硬盘的设备类型及传送模式。这些都是开机画面所不能提供的。     需要注意的是在Windows Xp之前的操作系统中所提供的设备管理器是无法用来查看CPU工作频率的,好在我们还有DirectX诊断工具。      三、利用DirectX诊断工具查看硬件配置     DirectX诊断工具可以帮助我们对硬件工作情况作出测试、诊断并进行修改,当然我们也可以利用它来查看机器的硬件配置。运行“系统信息”窗口,找到 “工具--DirectX诊断工具”(或者进入安装盘符中Windows目录下的System32目录中运行Dxdiag.exe),在窗口中可以方便地查看硬件信息。   1.查看基本信息     在“DirectX诊断工具”窗口中点击“系统”选项卡,当前日期、计算机名称、操作系统系统制造商及BIOS版本、CPU处理器频率及及内存容量一目了然。注意喽,虽然我将Celeron 2.0MHz超频至2.40MHz使用,但是DirectX却不认这个帐,依然显示的是未超频的原始频率。看来没有AIDA32,我们同样也可以识别奸商是否将超频的CPU卖给我们!!     2.查看显卡信息     在“DirectX诊断工具”窗口中点击“显示”选项卡,在这里我们可以看到显卡的制造商、显示芯片类型、显存容量、显卡驱动版本、监视器等常规信息。     3.查看音频信息     音频设备往往为人所忽视,但缺了它又不行,单击“声音”选项卡,对其做一番了解吧!同样在出现的窗口中能看到设备的名称、制造商及其驱动程序等等极为详细的资料。不同的是我们还可以点击右下角的“测试DirectSound(T)”对声卡进行一下简单的测试。  怎么样,经过这一番了解,是不是感觉很受益?

- 作者: 孤独疯子 2008年04月7日, 星期一 14:23  回复(0) |  引用(0) 加入博采

MkroTik RouterOS 基础应用教程

基本设置向导

登陆RouterOS

MikroTik RouterOS内能通过远程配置各种参数,包括Telnet, SSH, WinBox Webbox。在这里我们将着重介绍怎样使用WinBox

MAC-telnet是在路由器没有IP地址的情况下或者配置防火墙参数后无法连接,通过路由器网卡MAC地址登录的方式远程连接到路由器。MAC-telnet仅能使用在来自同一个广播域中(因此在网络中不能有路由的存在),且路由器的网卡应该被启用。注:Winbox中嵌入了通过MAC地址连接路由器的功能,并内置了探测工具。 这样在管理员忘记或复位了路由器后,同样可以通过MAC登陆到RouterOS上,进行图形界面操作。

Winbox控制台是用于MikroTik RouterOS的管理和配置,使用图形管理接口(GUI)。通过连接到MikroTik路由器的HTTPTCP 80端口)欢迎界面下载Winbox.exe可执行文件 ,下载并保存在你的Windows中,之后直接在你Windows电脑上运行Winbox.exe文件

下面是对相应的功能键做介绍:

搜索和显示MNDP (MikroTik Neighbor Discovery Protocol) CDP (Cisco Discovery Protocol) 设备。可以通过该功能键搜索同一子网内MikroTikCisco设备。并能通过MAC地址登陆到MikroTik RouterOS进行操作。

通过指定的IP地址(默认端口为80,不许特别指定,如果你修改了端口需要对具体访问端口做自定)或MAC地址(如果路由器在同一子网内)登陆路由器。

保存当前连接列表(当需要运行它们时,只需双击)

删除从列表中选择的项目

删除所有列表中的项目,清除在本地的缓存,从wbx文件导入地址或导出为wbx文件

  • Secure Mode(安全模式)

提供保密并在winboxRouterOS之间使用TLSTransport Layer Security)协议

  • Keep Password(保存密码)

保存密码到本地磁盘的文本文件中

路由器的winbox控制台:

Winbox控制台使用TCP8291端口,在登陆到路由器后可以通过Winbox控制台操作MikroTik路由器的配置并执行与本地控制台同样的任务。

命令功能概述

下面是对Winbox控制台的操作建议:

图标

功能

 

图标

功能

添加一条项目

 

定义或编辑一个注释

删除一条存在项目

 

刷新当前窗口

启用一个项目

 

撤销操作

禁用一条项目

 

恢复操作

 

单线应用实例

 

假如你需要通过MikroTik router配置下面的网络:

 

在当前的事例中我们使用到两个网络(公网和本地网络):

  • 本地网络使用地址为:192.168.0.0子网淹码24-bit255.255.255.0)。路由器的地址在这个网络中为192.168.0.254

  • ISP的网络为10.0.0.0 子网淹码24-bit255.255.255.0)。路由器的地址是在网络中为10.0.0.217

  • 公网DNS10.0.0.4

 

1、  首先,在interfaces >> interfaces list列表中修改ether1public,定义为公网接口;修改ether2local 定义为内网接口,如图:

 

 

2、  ip >> address >> address list >> new address 中添加IP地址和选择网卡接口,如图:

 

 

 

 

3、  ip >> routes >> route list >> new route 里添加默认网关,如图:

 

 

 

4、  ip >> firewall >> nat 里点击“+”添加伪装规则:

 

 

5、在new nat rule >> general >> chain 里选择 srcnat 链表:

 

6、在new nat rule >> action  里选择 masquerade 规则:

7、在ip >> dns >> settings >> dns settings 里添加外网DNS

 

 

 

到此,上述的单线上网事例就已经配置完成!

 

- 作者: 孤独疯子 2007年10月17日, 星期三 10:53  回复(0) |  引用(0) 加入博采

MikroTik RouterOS安装图解

一、通过下载光盘镜像文件,并制作成启动安装光盘。

二、将光盘放入光驱中,并将电脑的BIOS启动设置为光驱引导。

三、当光驱引导完成后,在屏幕上会出现如下显示:

上面是进入RouterOS的安装功能选择操作,从图中可以看到RouterOS的各个功能选择,图中前三排英文提示为,移去所有功能选项按“p”或“n”键,选择一个功能选项用“空格”键,选择所有功能则按“a”键,最小安装按“m”,按“i”键则是本地安装,“r”是安装远程的路由器,“q”是取消安装并重启。

四、选择功能,如在安装L4以上级别,推荐安装功能如下:

五、选择好功能组件后,即可按“i”键进行安装,此时会提示“硬盘上的所有数据都会被删除,是否继续”选择“y”继续,如果是“n”键安装会停止,并会重启。选择“y”继续后,会提示是否保持以前的配置,这是升级安装,并想保留以前路由器的设置参数,选择“y”,如果是不想保留则选择“n”。(全新安装则选择“n)

六、选择完后RouterOS开始安装

七、安装完后RouterOS提示按“回车”键,并重启。

八、安装完后,进入系统会提示输入注册码,如下图:

九、在进入系统后,会有24小时的使用时间,“Software ID”表示的是ROSID号,如上图所示为:KRYH-I8N 通过此ID号申请注册码。因为注册码比较长所以需要使用winbox进行操作,更为简便和直观。

十、首先将Winbox下载到可以与RouterOS相连接的Windows电脑上,然后双击打开,如图:

十一、在没有设置IP地址前使用MAC地址登录,点击winbox中扫描按钮,选择需要登录的ROS,默认的帐号为“admin”,密码为空;按回车或者点击“connect”进行登录。

十二、当您获得注册码后,请通过复制注册码的所有信息,进入Winbox中的system >> license项,点击paste key选项粘贴注册码。之后Winbox会弹出注册成功并重启的英文提示,重启完成后即可完成注册。

进入Winbox中的system >> license

点击paste key选项粘贴注册码

十三、OK!完成注册,感谢您使用正版MikroTik RouterOS 软件!

RouterOS升级操作

 RouterOS升级操作分为下面几步:

1、  www.mikrotik.com.cn下载最新的RouterOS升级包,下载后将.zip的文件解压。

2、  根据你使用RouterOS的情况不同,选择上传的升级包(注:system-2.9.x.npk)的升级包是必须要的。如何确定你使用那些升级包,可以通过在system package>的目录中查询对照。注:建议根据自己的需求安装升级功能包,过多的安装功能会下降路由器的性能如下图:

 

根据你在system package中的功能包选择 一一对应的功能包进行升级,systemg功能包是必须安装的。

3、  选择好对应的功能包后,通过“FTP//路由器IP地址”上传导功能包:

 

 

4、  功能包上传完成后,通过命令正常重启路由器:

RouterOS在重启时,同时也在执行功能包的安装,在路由器本机的显示屏上可以看到安装进度条。重启完路由器后回看到路由器已经升级为新的版本。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

- 作者: 孤独疯子 2007年10月17日, 星期三 10:51  回复(0) |  引用(0) 加入博采

NOD32下载+在线升级设置+图文全教程(2007年8月21日更新)
          NOD32是近年在全球迅速冒起的一个防病毒产品。NOD32非常轻巧易用,因其惊人的侦测速度及卓越的性能,它已成为许多用户和IT专家的首择。事实上,经多家检测权威确认,NOD32在速度,精确度和各项表现上已拥有多项的全球记录。

          在速度上,NOD32保持轻巧及极快的侦察速度。根据Virus Bulletin多次的测试,NOD32的扫描速度大约比其它市场竞争者高出2至50倍。大部分曾经使用过其它防病毒产品的用户都能感觉其不同凡响的表现能力。

          在资源占用上,NOD32整个程序的安装大约只占用7至8兆的内存空间,在安装后,大约占用28兆的内存空间,比其它同类产品占用的内存少约三到五倍。

         虽然占用的空间比较小,它的性能却毫不逊色;在侦测率上,NOD32在Virus Bulletin上雄距榜首,已经连续35次获得VB100%奖项。同时,NOD32是连续7年在侦测上全无遗漏任何一种ItW (In-the-Wild)电脑病毒 ━ 成为世界上唯一有此成绩的防病毒软件。

         NOD32已经获得超过60多项奖项,包括35次获得Virus Bulletin VB100% 的奖项,CheckMark Level 1,2, Trojan, Spyware, ICSA Certified, PCMagazine, PCUser, IDG Infoworld, UK Consumer Association Best Buy, mikroDatorn, WINTOTAL, Deloitte&Touche Fast 50, ISO9001等。

         今天我们就介绍以下NOD32的安装方法,首先,去下边的地址下载安装文件

NOD32 Registered User Downloads Page


From this page, licensed users of NOD32 may download their software. If you have not purchased NOD32 you may purchase it, download a free 30-day trial, or contact an ESET representative for assistance. A valid username and password is required in order to download the software.


View an installation video by clicking here.

Download the NOD32 installation guide here.

For all versions, the latest version of the virus signature database will be downloaded immediately after the installation has been completed to ensure the highest detection capabilities of the system.

或直接去http://www.eset.com/download/registered_software.php官方下载页面

         在下来就是安装了,我想,不会都不知道怎么点下一步吧,呵呵,一路下一步,安装的中间需要输入用户名和密码,选以哪个下边哪个打个钩,继续一路下一步。有了这个地址http://nod32.vsite.cn/,大家不用求爷爷告奶奶的到处找NOD32的破解版和序列号什么的了,在先升级也不用惆了,呵呵

接下来就是设置了,双击任务栏NOD32图标,点升级点击“设置”。出来“自动升级设置界面”,点哪个“服务器...”按钮,点“添加(A)...”,然后把这个“http://nod32.vsite.cn/”地址复制粘贴到哪个新服务器地址栏里,然后一路确定到了“自动升级设置界面”把哪个位置里边服务器选成你刚设置的哪个地址点确定就OK了(就我感觉啊,其他的都不用怎么设置,用默认的就好了),呵呵

        接下来说的就是最重要的更新了,呵呵,好多人碰破头的找更新用户名和密码,我在这里就不说什么了,升级地址也给大家提供了,呵呵,大家升级的时候直接点更新,也不会弹出需要用户名密码的对话框了,怎么样,听我介绍到这里了,还不行动么?呵呵,祝大家Internet上一路走好.

- 作者: 孤独疯子 2007年08月29日, 星期三 09:09  回复(0) |  引用(0) 加入博采

网络工程师应掌握的50个路由器知识要点
摘要:网络工程师应掌握的50个路由器知识要点 1、什么时候使用多路由协议?   当两种不同的路由协议要交换路由信息时,就要用到多路由协议。当然,路由再分配也可以交换路由信息。下列情况不必使用多路由协议: 查看全文

- 作者: 孤独疯子 2007年04月15日, 星期日 09:26  回复(0) |  引用(0) 加入博采

网络基础:带你彻底认识路由器
摘要:路由器是什么   是什么把网络相互连接起来?是路由器。路由器是互联网络的枢纽、"交通警察"。目前路由器已经广泛应用于各行各业,各种不同档次的产品已经成为实现各种骨干网内部连接、骨干网间互联和骨干网与互联网互联互通业务的主力军。 查看全文

- 作者: 孤独疯子 2007年04月15日, 星期日 09:25  回复(0) |  引用(0) 加入博采

Autorun病毒清理及免疫工具

      最近在工作中老遇到一些顾客说是他机器里的盘符点不开了....去了后发现原来是中了Autorun病毒了....我估计大家好多人现在也碰到这个问题了,呵呵,Autorun病毒成为了当下趋势。从最早出现的Autorun病毒——"开机跳出空白记事本病毒"开始写批处理专杀工具,后来发展到现在的这个通用清理Autorun病毒的工具,但病毒发展到了熊猫烧香这种感染文件类型,作者oicu(孤独疯子可不是作者啊,呵呵,大家不要搞混了)技术有限,写的工具也只能清理一些简单的非感染exe类型的Autorun老病毒。

     第一次运行zip压缩包里面的 DelAutorun1.0.7.2.0120.exe 是解压,解压后会删除原来的版本,以后使用可以用桌面的快捷方式而不用再次解压。

根据Autorun.inf文件删除根目录下的未知可执行文件,电脑刚接上U盘等移动存储的时候可以查查U盘是否有病毒,非监控。

里面有一个install.inf文件,修复几个重要注册表项。要是开机跳出什么搜索界面、跳出我的文档、不能双击打开硬盘,都可以试试用它修复。第一次解压时自动运行,以后要用就先找到这个文件,右键点击选择“安装”。

主要功能:
1. 查杀磁盘(硬盘/ U盘/MP3/移动硬盘)里的病毒
2. 只查杀移动存储的 Autorun 病毒
3. 所有磁盘分区免疫 Autorun 病毒
4. 关闭光驱以及移动存储的自动运行、自动播放(该部分引用深山红叶的)
5. 删除指定分区的免疫文件夹Autorun.inf
6. 恢复解析磁盘根目录的Autorun.inf文件、光驱和移动存储的自动运行


附带的txt文件可以杀的病毒:
    开机跳出空白记事本、西南民族大学比肩社区BBS、RavMonE.exe、Autorun风暴(开机弹出我的文档)、AdobeR.exe、sxs.exe、rose.exe、Explorer三好学生(不能打开魔兽3等游戏的文件夹)、tel.xls.exe、fun.xls.exe、Setup.pif(winl0gon)、WIn.exe(假任务管理器)、printer.exe、sxs.exe变种(成人小说.exe)等。

    只删除移动存储各个盘上的 SHE.exe、ctfmon.exe、winw0rd.exe、wokaye.exe、wsctf.exe 病毒,未处理硬盘上的。

一般的文件清理可以自己添加文件名到txt文件,txt文件里面都有详细说明。


预防Autorun病毒:
用了免疫就不能用ico图标检测了,免疫这个功能很重要,建议还是用免疫。

软件作者OICU原文地址:http://lsxk.org/bbscon.php?bid=67&id=63043

点这里下载Autorun病毒清理及免疫工具

- 作者: 孤独疯子 2007年03月9日, 星期五 11:29  回复(0) |  引用(0) 加入博采

自家电脑摄像头竟"出卖"隐私 防范入侵也简单

2006年06月24日 12:47:46  来源:新闻晨报

 ■网友发帖警示并非无中生有

    ■防范入侵招数也很简单

    家,一直是人们认为最具安全感的地方。但是,安装在自家电脑上的摄像头却有可能在神不知鬼不觉中“出卖”了你的隐私。

    最近,一网友在天涯社区发文《女孩,请小心你的摄像头》称,曾有一黑客朋友通过远程监控一女孩电脑并启动其摄像头,电脑前的女孩隐私被一览无遗。这篇文章在天涯社区发表之后,旋即引起了网友们的质疑和不安。

    自家电脑上的摄像头到底会不会成为别人的“卧底”工具而出卖自己?记者对此展开了调查。

  网友发帖

    提醒摄像头前女孩要避免隐私曝光

    网友“愿为夏日”在《女孩,请小心你的摄像头》中讲述了作者的一个黑客朋友“接管”女孩摄像头的经历:黑客远程监控一名女孩的电脑,并偷偷启动了女孩电脑上的摄像头。“女孩刚洗过澡出来,认为自己在家里很安全,只穿了内衣坐在电脑前……”“愿为夏日”最后提醒说:“女孩们不用摄像头的时候,注意将它对着墙壁。因为也许有一双眼睛正在看着你。”

    帖子发布之后,旋即引来了网友们的热议。不少网友都怀疑其真实性。还有的网友则询问如何获得这种技术。然而,更多网友确信的确存在摄像头泄密的可能性。有的网友甚至表示,即使关闭了电脑,本领高强的黑客也能远程打开电脑,启动摄像头,对他人实施“监控”。

    这些话引起一些不懂网络安全技术网友的不安。

  专家解答

    黑客入侵前提条件非常“苛刻”

    针对网友跟帖中提出的种种问题,记者昨天采访了上海计算机病毒防范中心网络信息安全专家柏庆宇。

    问:关闭电脑后,黑客还能启动电脑,打开摄像头吗?

    柏庆宇:远程开机是利用了“网络唤醒”技术,电脑硬件软件必须同时配合,只有在电脑处于待机、睡眠状态时才可能被唤醒,前提条件非常“苛刻”。所以网友们不必过于害怕。“只要电脑关机,关闭电源,拔掉网线,再厉害的黑客也没有办法了。”

    问:能远程控制摄影头旋转吗?

    柏庆宇:一般摄影头镜头已经固定了,只能指向一个方向,想让镜头旋转只有依靠手动旋转,想让摄像头“自己”旋转移动,摄像头内必须安装有电机设备,这在市场上还没发现。

  记者实证

    自家电脑被技术人员远程监控

    安装摄像头,一切隐私真的会在不知不觉中暴露无遗吗?

    为了验证其真实性,记者日前在电脑上安装摄像头后,邀请在知名软件公司担任技术人员的Michael做示范演示。没过几分钟,记者看到,自己的鼠标指针无缘无故地移动起来,自己开启、关闭文件夹,而记者怎样晃动自己的鼠标都不管用———这时,电脑已经被“成功接管”了。

    直到记者再次重新控制自己的电脑,Michael通过MSN传送了他通过摄像头拍摄的几张记者头像照片。

  原来,摄像头真的会“自我”泄密!

    Michael说:“远程监控以及操作他人电脑使用的都是‘入门级’电脑技术,甚至不用借助任何黑客工具,电脑操作系统就提供了此类功能。”

    Michael说,这一技术出现的初衷,是让电脑技术人员免于来回奔波,从而大大提高了工作效率。在许多大型集团中,这一技术因为便于维修管理电脑,因此被广泛应用。

    至于防范也很简单。Michael说,只要电脑中“远程桌面”选项不要打开,同时将系统管理员密码设置得尽量繁琐,这样一来,别人就无法通过这一途径远程操作受控电脑。

    防范黑客入侵电脑有高招

    网络专家柏庆宇还向晨报读者指点了几招防范黑客入侵的招数:

    ●个人电脑一定要安装杀毒软件,并时常使用杀毒软件扫描查杀电脑。如果有陌生人希望通过MSN、QQ等即时通讯工具传输文件,不要随便接收。如果接收了,立刻用杀毒软件对文件扫描一遍,确定没有病毒之后再打开。

    ●不要下载来历不明的软件,也不要浏览成人网站等不文明网站。别人发送的网络链接,在没有确认之前,不要随便点击,因为很有可能别人因此获得你的电脑IP地址。

    ●个人电脑用户还可以在防火墙中设置只允许熟悉的程序运行,开放安全的网络端口,一旦有陌生程序要求连接网络,则立即关闭连接程序。

    ●最简单的招数就是在不用摄像头时,拔掉与电脑的连接线,或者对准墙壁、在摄像头上盖块布等。对于一些自带摄像头的笔记本电脑用户来说,不使用摄像头时,用面小镜子对准摄像头是不错的选择。

  记者调查

    黑客工具网上竟可以免费下载

    Michael也坦言,如果对方使用黑客工具,情况就完全不一样了。即使对电脑技术一知半解的普通人,借助黑客工具也可以打开他人电脑的摄像头,而这些黑客工具在网络上就能免费得到。

    昨天,记者在网上搜索时发现,不少网站都提供了下载黑客工具的服务,一家网站一款黑客软件下载数字已达到30万余人次。记者在一款黑客软件中发现,作者还将使用步骤描述得非常详细。

    律师观点

    操控他人摄像头偷拍构成多次违法

    昨天,上海得勤律师事务所商建刚律师表示,如果有人入侵他人计算机系统,同时控制摄像头进行偷拍,这将构成一系列的违法行为。他表示,入侵计算机系统本身已经触犯了法律,我国法律禁止“黑客”行为。控制摄像头偷拍是第二次违法行为,如果偷拍之后,在网上任意散布偷拍照片,则构成了第三次违法行为,直接扩大了违法行为的后果。“这些都是事实非常明确的侵权行为。”对此,行为人情节轻微的将被处以治安处罚,造成严重后果触犯法律的,甚至会被追究刑事责任。

    如果行为人将偷拍照片寄给受害人进行敲诈,这种行为直接触犯刑法,构成刑法中规定的敲诈勒索罪。如果偷拍内容涉及家庭隐私、商业秘密,又会相应构成不同的犯罪。“如果受害者因此遭受侵害,蒙受损失,可以凭借任何一次违法行为的后果,对行为人提出索赔。”

- 作者: btzc 2007年02月1日, 星期四 11:31  回复(0) |  引用(0) 加入博采

关于最近我在工作中老碰到的一种病毒

       最近给客户维护的时候发现隔几天客户的机器就出现死机和机器变慢的问题,去了以后一用我的移动硬盘就发现我移动硬盘上不知道什么时候有了自动播放了,晕啊,在移动硬盘上点右键后发现右键菜单上多了个“AUTO”的选项。把隐藏文件选项打开后,发现里边多了4个文件???删除了马上就又有了,后来在瑞星的网页上才找到了解决方法,原来是中了橙色八月哪个病毒了。下了个专杀工具后,OK,机器就没那些问题了。

        在这里提醒广大电脑使用者,多多注意新病毒的资料,有备无患啊。

这里给大家把瑞星的专杀工具页面提供给大家

http://it.rising.com.cn/Channels/Service/index.shtml

- 作者: btzc 2006年12月19日, 星期二 15:11  回复(0) |  引用(0) 加入博采

中国十大最狠的流氓网站------和-----常见流氓软件的流氓原理和出处
谁推动了流氓软件的发展?谁又从流氓软件中获利,揭开流氓软件背后的始佣者,网易科技独家选出中国十大流氓网站。
以下是网易科技评选的十大流氓网站:
  3721网站的出现注定会写入中国互联网历史。他的意义在于它将十年中国互联网分为了两段,一段是纯洁的互联网,一段就是一直到现在的互联网流氓时代。
当中国互联网进入2006年,丝毫没有看到流氓时代逝去的迹象,反而越演越烈。各式各样的流氓软件满天横飞,争吵与辱骂声也此起彼伏,不仅仅是用户与流氓软件之间,流氓软件与流氓软件之间也开始在前台争吵,呈现出一片欣欣向荣的景象,也带给枯燥的中国互联网江湖无穷的话题。
流氓软件为何这么猖獗,依然能够在网民的漫骂声中迅速发展呢?不用想肯定是利益在作怪。虽然有多种类型的企业为了不同的目的支撑了流氓软件生态链,但是仔细观察它的生态链之后,你会发现处理生态链最下游的广告主是关键,或许才是真正推动流氓软件行业的真正力量。

  通过流氓软件运营网站的这种流氓行为显然也得到了资本市场的认可。 “现在做网站运营,有流氓软件支撑的比那些没有流氓软件,在资本市场会更容易受到认可。”一个创业网站的老总这样告诉笔者。从他的话中多多少少透露出行业对流氓软件的理解,在他们心里,并没有很多网友想象中的那种道德上的压力,对他们来说,这就是一条成功之路。
  网易科技通过这段时间查询大量的信息,对很多用户进行详细的调查,与多位行业人士的沟通了解,与互联网观察人士一起分析探讨之后,得出了通过流氓软件发展前十的网站排名,暂且称之为十大流氓网站。
排名主要参考了网站对流氓软件的推动及流氓软件对网站的效果两方面结合的效果。得预先说明的是,这下面的网站不代表现在的状态,虽然下面有些网站已经开始“转正”或者说“从良”了,数据可能反映他们过去一段时间的经历。中国互联网十大流氓网站
1、3721.com(中文实名)

  
这个是流氓软件的开山鼻祖,就是因它将中国互联网带入到一个流氓时代,这里就不作再多说,相信大多数人都装过这个网站的插件。
要删除3721以及雅虎类的流氓软件已经不是很简单,尽管官方一再申明可以完全卸载,我尝试用好几种流氓专杀都杀不掉,最后用3721创始人小周的360度安全工具才把雅虎的东西请出去了,有希望清理网络实名不妨下载这个试试
360安全卫士(恶意软件查杀360Safe)下载:

360安全卫士
V1.75 0926_强大的恶意软件查杀能力_绿色正式版


2、MOP.com(猫扑)

  猫扑从2004年开始流量一路狂涨,现在 Alexa 68位,这其中与它的“播霸”与前期与其它流氓合作推广是分开不的。
恶意软件清理助手 绿色版下载:


恶意软件清理助手
V2.17 Build 040[0926]_软件数据更新V1.84_官方绿色特别版


3、Zhongsou.com(中搜)

  中搜在网友中的骂名是除了3721最大的,“网络猪”与“划词搜索”让无数的网友愤怒,而中搜在骂声中成长也比较快,流量提高了不少。
这个猪头也是极难卸载的,不知道改了没有,以前也是用N种流氓专杀都杀不掉的,最后我用兔子清理才把他清除的
超级兔子-流氓软件专业卸载 免安装绿色版下载:


超级兔子
优化王之专业卸载流氓软件 7.55 免安装版


下面几款应该用恶意软件清理助手就能清除吧,如果不能清除请用兔子或者360度,恶意软件清除大师试试
恶意软件清理助手绿色版下载:


恶意软件清理助手
V2.17 Build 040[0926]_软件数据更新V1.84_官方绿色特别版


恶意软件清除大师 V1.0.6.992 绿色版下载:


恶意软件清除大师
绿色特别版


4、Sogou.com(搜狗)

  中国的几个搜索引擎,特别是后来者,大多数都在用流氓插件,前面已经
做了,没办法不做,对搜狗来说很值,提升很快。
5、51.com

  基本上是靠流氓软件推起来的一个交友网站,网站的流量上升非常快,差点就挤上了Alexa前100名。
6、265.com(上网导航)

  很多网友投诉,经常无故到达265.com的页面,不知道中了什么厉害的插件。
7、Bokee.com(博客网)

  博客网曾经推出的一款博采的流氓插件,据说安装后会约每隔1
秒点击博客网,够狠吧。
8、Qyule.com(青娱乐)

  青娱乐也是网上被网友骂得最厉害的一个流氓网站,它的Alexa 排名数据不止一次清零,原因很可能是因流氓软件作弊所致。下载青娱乐清除工具:


全能助手流氓软件杀手 V1.0.1.7 绿色特别版


9、9991.com(网址大全)

  与51.com系出同门,很多用户访问过一次之后就将IE首页设置成了9991.com,在网络行业协会的流氓软件举报中心,它被举报次数居第一位,并且网上咨询怎么删除9991插件的问题也是最多的。
10、Yok.com(超级搜索)

  这个没有任何技术含量的搜索网站,也能有一个不错的流量,它的“YOK搜索工具栏”功不可没。
  最后值得一提的是,上面十大流氓网站只是一个典型,实际上还有很多备选的流氓网站也非常的流氓,但是从我们拟定的评判标准上看,他们的效果或推动流氓软件的程度略略低于选出来的十个网站,也许我们感到十分“遗憾”。
  流氓网站先欺负网民,然后网民被动查看网站,部份网民在不知情的情况下转而日久生情,然后网站开始逐渐从良,最后网站获取成功。这是当前流氓网站通常的发展路线图,不知道随着网民素质的提高,行业正义人士越来越来多,这个发展路线图是否有所改变,这也是发布这个十大流氓网站的意义所在。
常见流氓软件的流氓原理和出处!!!!!!








- 作者: 孤独疯子 2006年11月17日, 星期五 10:52  回复(1) |  引用(0) 加入博采

linux简单网络命令

1、用useradd添加用户
        Useradd student1——创建用户st1
        Useradd –e 12/31/2004 student2——创建student2,指定2004-12-31到期
        用户的缺省工作目录是/home/username,可以指定其他目录为其工作目录,例:useradd
student3 –d /student/student3
        用户的缺省UID从500后顺序增加,可以指定UID。例:useradd –u 600 student4
        如果不指定用户所属的工作组,在创建用户的时候会生成一个与用户名同名的工作组,也可以在
创建用户的时候就指定其工作组。例:useradd –g student student 5
2、用passwd为用户设置密码
        例:passwd  student1
        注意:没有设置密码的用户不能使用。
3、usermod修改用户账户
        例:将用户student1的登录名改为st1,
        usermod –l st1 student1
        例:将用户加入到student组中,
        Usermod –g student  student1
        例:用户目录改为/student/student1
        usermod –d  /student/student1  student
4、用userdel删除用户账户
        例:删除用户student2
        userdel student2
        例:删除用户student3,同时删除他的工作目录
        Userdel –r studenet3
5、查看用户信息
        id命令查看一个用户的UID和GID,例:查看student4的id
        Id student4
        finger命令 ——可以查看用户的主目录、启动shell、用户名、地址、电话等信息 。
例:finger student4
6、groupadd新增组
        groupadd –g 888 student
        创建一个组student,其GID为888
7、gpasswd为组添加用户
        只有root和组管理员能够改变组的成员:
        例:把student1加入stdeunt组
Gpasswd –a student1 student
        例:把student1退出student组
Gpasswd –d student1 student
        例:把student的管理员指派给yz
Gpasswd –A yz student
8、groupmod修改组
        groupmod –n student students       修改student组名为students
9、groupdel删除组
        groupdel students    删除组students
10、用ifconfig配置网卡
        ifconfig eth0 192.168.0.1
        ifconfig eth0 down  
        ifconfig eth0 up
        ifconfig eth0 netmask 255.255.255.0
        ifconfig eth0 192.168.0.1 netmask 255.255.255.0
        ifconfig eth0 -broadcast 192.168.0.255
        ifconfig eth0
        ifconfig
11、用 route命令是查看和设置路由
        route add 0.0.0.0 gw 172.16.19.254—— 增加一个默认默认网关
        route del 0.0.0.0 gw 172.16.19.254——删除一个默认网关
         route——显示出当前路由表


使用以下命令配置以太网络
1、        ifconfig
可以使用ifconfig命令来配置并查看网络接口的配置情况。
例如:
(1)        配置eth0的IP地址, 同时激活该设备。
#ifconfig eth0 192.168.1.10 netmask 255.255.255.0 up
(2)        配置eth0别名设备eth0:1的IP地址,并添加路由。
#ifconfig eth0:1 192.168.1.3
#route add –host 192.168.1.3 dev eth0:1
(3)        激活设备。
#ifconfig eth0:1 up
(4)        禁用设备。
#ifconfig eth0:down
(5)        查看指定的网络接口的配置。
#ifconfig eth0
(6)        查看所有的网络接口配置。
   #ifconfig
2、        route
可以使用route命令来配置并查看内核路由表的配置情况。
例如:
(1)        添加到主机的路由。
    #route add –host 192.168.1.2 dev eth0:0
#route add –host 10.20.30.148 gw 10.20.30.40
(2)        添加到网络的路由。
#route add –net 10.20.30.40 netmask 255.255.255.248 eth0
#route add –net 10.20.30.48 netmask 255.255.255.248 gw 10.20.30.41
#route add –net 192.168.1.0/24 eth1
(3)        添加默认网关。
#route add default gw 192.168.1.1
(4)        查看内核路由表的配置。
#route
(5)删除路由。
#route del –host 192.168.1.2 dev eth0:0
#route del –host 10.20.30.148 gw 10.20.30.40
#route del –net 10.20.30.40 netmask 255.255.255.248 eth0
#route del –net 10.20.30.48 netmask 255.255.255.248 gw 10.20.30.41
#route del –net 192.168.1.0/24 eth1
#route del default gw 192.168.1.1
对于1和2两点可使用下面的语句实现:
Ifconfig eth0 172.16.19.71 netmask 255.255.255.0
Route 0.0.0.0 gw 172.16.19.254
Service network restart
3、        traceroute
可以使用traceroute命令显示数据包到达目的主机所经过的路由。
例如:
#traceroute www.sina.com.cn
4、        ping
可以使用ping 命令来测试网络的连通性。
例如:
#ping www.sina.com.cn
#ping –c 4 192.168.1.12
5、        netstat
可以使用netstat命令来显示网络状态信息。
例如:
(1)        显示网络接口状态信息。
#netstat –i
(2)        显示所有监控中的服务器的Socket和正使用Socket的程序信息。
#netstat –lpe
(3)        显示内核路由表信息。
#netstat –r
#netstat –nr
(4)        显示TCP/UDP传输协议的连接状态。
#netstat –t
#netstat –u
6、        hostname
可以使用hostname命令来更改主机名。例如;
#hostname myhost
7、        arp
可以使用arp命令来配置并查看arp缓存。例如:
(1)        查看arp缓存。
#arp
(2)        添加一个IP地址和MAC地址的对应记录。
#arp –s 192.168.33.15 00:60:08:27:CE:B2
(3)        删除一个IP地址和MAC地址的对应缓存记录。
#arp –d192.168.33.15

- 作者: 孤独疯子 2006年11月17日, 星期五 10:46  回复(0) |  引用(0) 加入博采

多网卡绑定一个IP及SuperCache的使用体会

在无盘网络中,系统的瓶颈在网络及硬盘的传输上,采用“骨灰”级的设备,固然可解决问题,但不是每个单位都可办到的(许多单位如网吧、学校采用无盘站的目的,很大成份上是为了节省资金),有没有廉价的解决方案呢?我的作法是:用多网卡绑定来解决网络带宽问题,用SuperCache来解决硬盘的传输问题。
多网卡绑定
网络环境:90台无盘站(3239网卡)、支持TRUNK、VLAN的二层交换机1台(作主干交换机)、普通24口二层交换机5台(1台作主干备用机,其余的级联在主干上)、4块530TX网卡、1块Intel服务器网卡及3块Intel普通网卡;服务器2台:1台域控制器,1台文件服务器,试验全在文件服务器上进行。


多网卡绑定一个IP的方法,目前有三种:
1、NICExpress   
2、D-Link570网卡随卡带的捆绑软件 
3、Intel的专用捆绑软件:PROSet Ⅱ

http://www.ptnsn.com.cn/bbs/dispbbs.asp?boardID=99&RootID=225&ID=225

体会:
1、用NICExpress及D-Link570网卡随卡带的捆绑软件进行捆绑,对网卡没有什么特别的要求,用Intel PROSet Ⅱ进行捆绑,只能全用Intel的网卡,其它的网卡不行。
2、用NICExpress及D-Link570网卡随卡带的捆绑软件将4块530TX进行捆绑,与普通二层交换机联接,感觉不是很稳定,体现在:就是用上传的母机启动(去硬盘),有时能一次启动成功,有时不能(有十之三四),90台工作站同时启动时,不能一次启动成功的较多。如果用570网卡及带TRUNK的交换机,可能会好一点,限于条件(无570网卡,因太贵,要2500大洋),无法试验。如有网友试过,务请告诉我一声。
3、用Intel PROSet Ⅱ进行捆绑,有有4种方式:
A、容错:当主网卡坏时,其它网卡可继续提供服务。增强可用性,带宽不增加。
B、负载平衡:将流量均衡地分配到所捆绑网卡上,4块网卡捆绑,带宽达500M(100M收,400M发)
C、链路汇聚:即:TRUNK,将四个物理端口组合成一个逻辑端口,艽砜纱?00M(400M收发)。注:此方式只支持带TRUNK的交换机
D、IEEE802.3ad:作用同C。
用Intel的专用捆绑软件:PROSet Ⅱ将1块服务器网卡及3块普通网卡进行捆绑(注意:只能全用Intel的网卡,其它的网卡不行),不论是负载平衡方式(与普通二层交换机联接),还是链路汇聚方式(与带TRUNK的二层交换机联接),感觉都很稳定,体现在:用上传的母机启动(去硬盘),全部能一次启动成功。90台工作站同时启动时,不能一次启动成功的较少。
4、价格比较:用NICExpress及DLink570网卡随卡带的捆绑软件进行捆绑,530TX等档次的网卡,甚至是3239档次的网卡都可以,4块网卡只要400多元,而用Intel PROSet Ⅱ方式,只能用Intel的网卡,4块网卡约要1500~1600大洋(现追月网站提供四块只要480元,超值!!!)(一块服务器网卡就要800多),价格偏高。
5、三种方法中,流量的均衡都不是很好,主网卡承担的比例较大,即使是在链路汇聚方式中,也是如此(但要好一些)。因此,网络的实际带宽大打折扣,网络瓶颈依然存在。


看来,要真正解决网络瓶颈,非用1000M网卡及交换机不可。

近期,在《中国计算机报》上,看到一则广告“千兆流----迎风一刀斩”,推销的是Netcore公司的7108NST千兆交换机,价格:2800元,同时还附赠一片千兆网卡;当时以为是哪个杂牌厂家搞促销,到其网http://www.netcoretec.com.cn 上一看,“Netcore公司1988年正式成立于台湾,是新竹工业园早期创业者之一……中国公司于2000年7月正式宣布成立……磊科世纪网络有限公司。7108NST提供1个铜缆千兆端口,8个RJ-45百兆端口,每端口均支持Port VLAN及TAG VLAN, L2 Trunk功能提供高达400Mbps的通道,解决用户骨干网络中交换机与交换机的连接瓶颈”
1000M、VLAN、Trunk、低价,正是我需要的,又是台湾的公司,而且在太平洋网站上排第一位,我马上买了一套试用,效果很好,1000M毕竟是1000M,90台工作站同时启动时,不但全部可以一次启动成功,而且启动速度大大加快。 看来,Netcore的7108NST千兆交换机套装,是解决无盘网络瓶颈的好方案。多网卡绑定技术可以进入历史博物馆了。
声明:我不是商人,是一名教师,绝不是替某公司作广告,只是将这个我认为非常好的解决方案介绍给大家。另:我买的Netcore的7108NST千兆交换机套装只花了2600多元。

网友点抨(jhzzh):32位PCI千兆网卡实际上只能达到280M,要上千兆,一定要用PCI64位,实际应用中可达550M左右。千兆网卡与千兆交换机之间用铜缆UTP连接达不到1000M的带宽,只能用多多模光纤才行。带64位pci插槽的主板要2700元左右,加起来就是上万的配置了,考虑到性价比,多网卡绑定还是一个不错的选择。

如果对NICExpress 、D-Link570网卡随卡带的捆绑软件、Intel的专用捆绑软件PROSet Ⅱ有兴趣的朋友,可联系我。E-mail:gdtsz@sina.com。或者在追月网站下载。
在无盘网络中,系统的瓶颈在网络及硬盘的传输上,解决了网络瓶颈,接下来要解决硬盘的传输瓶颈。有二种方法:虚拟磁盘及硬盘Cache,用虚拟磁盘,要改变许多设置,较复杂,推荐用硬盘Cache。普通的Cache软件,利用内存的SIZE有限,而SuperCache最高可支持到64GB,比普通软件多得多,强烈推荐。
一、软件的性质、作用
SuperCache是一个用内存来保存读过的硬盘数据的软件,也即是硬盘的Cache,它将计算机由硬盘读取过的文件保存在指定的内存中,下次计算机再读这些文件时,不是由硬盘读取,而是由内存中读取,加快了文件的读取速度,减少了硬盘的磨损,它是解决硬盘瓶颈的好东东。
二、软件版本
1、分NT V4 for Workstations、NT V4 for Servers、for win2000 Pro、for win2000 server、for win2000 AD Server等版本。
2、分支持单CPU、双CPU、四CPU等版本。
一般地,支持多CPU的,也支持更少的CPU。
三、硬件支持
1、支持Intel、AMD全系列CPU(Pentium级以上)
2、支持IDE硬盘、IDE Raid、SCSI硬盘、SCSI Raid
3、不支持软件Raid,如win2000自带的软Raid。
4、要求内存>64MB,推荐>512MB,最高支持64GB
四、软件设置
主要有3个地方要设置:
1、选择被Cache的分区。选“enable supercahce caching on this drive”项即可
2、设置Cache的大小(size)。在“tune“菜单中把逻辑盘选择上,并设置cache百分比
3、注册。
关于软件的安装、设置的详细说明,我有6幅截图,需要的请联系。E-mail:gdtsz@sina.com
五、半定量测试
1、硬件环境:服务器2台:1台域控制器(安装SCSI硬盘),1台文件服务器(安装IDE硬盘及IDE Raid0),试验全在文件服务器上进行。
2、软件环境: a、将office目录(共203M,千来个文件)copy 到目标计算机。
b、将win2k0.gho ( 370M ) copy 到目标计算机。
C、计算机上的OS全是win2000 server
3、测试方法:
将安装SCSI硬盘、IDE硬盘、IDE Raid0的计算机分别当做源计算机,在源计算机上安装、设置好supercache后(源计算机内存512M,Cache Size 50%,约250M),将office目录及win2k0.gho copy到被Cache的分区,然后分别copy到目标计算机,观察第二次copy时(第一次肯定常亮)源计算机硬盘(Raid)指示灯的活动情况。
4、测试结果:
源计算机内存512M,Cache Size 50%,约250M)时。
a (copy office目录) b (copy win2k0.gho)
a、源盘为:SCSI硬盘 偶尔亮一下 常亮
b、源盘为:IDE硬盘 没亮过一次 常亮
c、源盘为:IDE Raid0 没亮过一次 常亮

源计算机内存1G,Cache Size 70%,约700M)时。
a (copy office目录) b (copy win2k0.gho)
a、源盘为:SCSI硬盘 偶尔亮一下 偶尔亮一下
b、源盘为:IDE硬盘 没亮过一次 没亮过一次
c、源盘为:IDE Raid0 没亮过一次 没亮过一次
说明:1、由以上结果看,效果还是很明显的。
2、因无SCSI Raid卡,无法验证。
3、用SCSI硬盘,即便什么都不干,也会不时地闪几下。
4、源计算机改用双P3CPU,分别安装SCSI硬盘、IDE硬盘、IDE Raid0进行测试,得到同样的结果

六、在无盘网络中的测试
网络环境:90台无盘站(3239网卡)、Netcore的7108NST千兆交换机 (作主干交换机)、普通24口二层交换机4台,(级联在主干上);服务器2台:1台域控制器(530TX网卡),1台文件服务器(Netcore 1000M网卡、P3 733 CPU 、512M内存,IBM 40G 7200R IDE硬盘 )。
不安装supercache,90台无盘站同时启动,一段时间后,服务器花屏,十几秒后,服务器重启。
我第一次亲眼看到服务器是怎样崩溃的,难怪很多FTP的管理员要限速了。
安装supercache,设置Cache Size 50%,约250M,90台无盘站同时启动,服务器很正常,无盘站能顺利的启动。
由以上结果看,无盘网络中,使用supercache的效果也是很明显的。
七、注意事项
1、supercache是以文件为单位的,当文件size>Cache时,将失去作用。
2、有网友说安装了supercache后,服务器关不了机,我怀疑是由于supercache引起的,因为我用的与从网站下载的supercache,其size相差有几K。我用的supercache从来没有出现关不了机的现象,一切正常。

- 作者: 孤独疯子 2006年11月17日, 星期五 10:25  回复(0) |  引用(0) 加入博采

网络故障汇编(五)

[案例二十八]网卡故障,用户变狂人,网络运行速度变慢
 
   [
症状]今天的病人是某大型寻呼公司,刚更新了高速寻呼设备,增加了信息服务的业务内容,并对计算机网络进行了比较大的扩容和调整。调试工程一直比较顺利,但好景不长,刚正式开通工作一天就出现严重问题。技术中心严经理报告的故障现象如下:最初是在工作台上偶尔观察到在键入寻呼的用户数据时键盘更新出现等待现象,后来愈来愈严重,从刚开始的一秒钟左右到现在的10秒钟以上。网络服务速度很快就变得非常缓慢,寻呼业务员在操作台上键入数据时,屏幕显示有时甚至要等待1分钟以上才会更新。基本上在10秒钟和1分钟之间波动。在业务高峰时处理寻呼的速度赶不上要求,用户排队现象严重。设备管理人员查看过集线器、交换机,发现他们的指示灯一直闪烁不停,好象比以前印象中的快了不少,怀疑网络流量可能很高。用软件查看主服务器的CPU资源利用率,达到93%。查看了5个工作台上的计算机CPU,显示资源利用率85%以上。时逢426,怀疑是不是有病毒在做崇。用了三种杀毒软件先后进行扫毒,之后发现故障现象依旧。由于寻呼中心机房没有配备网络维护的硬件工具,工程承包商对此现象更是手足无措,故向网络医院挂急诊求治。

   [诊断过程]30分钟后我们来到现场。正如严经理所言,从持续闪烁的指示灯上就可以观察到网络流量肯定很高。该网络采用NT作平台,工作协议为IP,用网络测试仪F683接入网络的任意一个接口进行测试,结果如下:网络流量平均为57%~83%,偏高较多。碰撞率4.9%~5.3%,广播42%~74%,错误2%~3%。网络的正常流量波动为8.1%~0.7%。很明显,网络的非法数据帧占据了大量的网络带宽。主要的非法帧为高流量的广播帧,其次是错误帧。为了查明广播帧和错误帧的来源,我们先启动网络测试仪的错误查找统计测试功能,2秒钟后显示错误类型为超长帧、帧不全、FCS错误帧以及少量短帧。按下网络测试仪的错误统计“Error Statistic”软键,查看上述各项错误的来源,均显示错误来自为一台取名为“Cindy”的主服务器;为查找超量广播的来源,按下网络测试仪的“Top Sender”测试软键,显示广播帧超量发送者同样也是“Cindy”这台服务器。另外,“Cindy”还发送约0.8%左右的正常IP帧。将“Cindy”从网上卸下,各单机故障立即消失。为了确认是网卡本身的问题还是网卡驱动程序的问题,将“Cindy”的网卡驱动程序重新安装了一遍,之后启动机器运行,故障现象出现。说明网卡本身故障的可能性最大。更换网卡后网络恢复正常。

   [诊断评点]网络平均流量是决定网络运行速度的一个重要条件。在以太网中,瞬间流量可以超过90%,很适合突发流量的传输。当网络的平均流量在40%以下时,网络运行速度一般不会主管感觉变慢。本故障中,服务器“Cindy”由于网卡故障,除了发送一些正常IP包外(0.8),还发送约2%~3%的错误帧和主要影响网络带宽的超量广播帧(42%~74%,造成用户键盘更新在10秒~1分钟之间波动),这里对网络影响最大的是超量广播帧。广播帧是网络设备定期不定期进行网络联络的一种手段,但过量的广播会占用不必要的带宽。一般来讲,网卡损坏以后,有多种表现类型,常见的一种表现是安静型,此时网卡不向网络发送任何数据,机器无法上网。另一种常见的类型是狂躁型,其表现颇象一个喝醉酒闹事的醉汉,嘴里喋喋不休。该网卡除了发送正常数据以外,还发送大量非法帧、错误帧。本故障发送的是大量的广播帧。广播帧可以穿过网段中的桥和交换机,所以整个网段上的设备通道都会被广播帧占用带宽,即便是不向网络发送或接收数据的站点也会因为接收大量的广播帧而导致站点的网卡向宿主机的CPU频繁地申请中断,CPU资源利用率达到了85%。这样,网络上的站点处理本机应用程序的速度会受较大影响。有趣的是,很多用户也是在把机器从网络上退出时才发现站点的故障与网络有关。而之前却一直以为是工作站的问题,且最容易被误判为病毒发作。许多网管和网络维护人员通常的做法和遭遇都会象下面所描述的故事:首先,启用多种杀毒软件进行查杀毒操作,无效。然后,把所有工作站格式化,重新安装其操作系统和应用软件。但由于问题出在服务器,所以仍然不见效。最后,不得不将所有机器(当然也包括服务器)格式化以后重新安装系统平台及应用软件。如果是服务器网卡驱动程序安装错误(比如安装的驱动程序版本不符合,虽然能工作但不顺畅),则故事可能因重新安装了正确的驱动程序而到此结束。如果是网卡狂躁型故障,则故事还会延续很长时间。因为狂躁型病人不理会网络的游戏规则而向网络发送大量非法帧流量,占用带宽,影响所有网络成员。不幸的是,狂躁型病人在网络故障统计中所占的比例不是很低!

   [诊断建议]“网络健康测试网络基准测试都是为了实时和长时间监测网络流量的变化规律,帮助维护人员掌握网络应用和流量变化的规律,即时发现和处理网络故障。网络维护方案中建议健康测试是每日必须测试的内容,要求实时监测网络的流量/利用率、碰撞、广播、错误等基本健康参数,也可以简化监测程序,选择在每天网络最繁忙的一段时间进行测试。这样网络的异常可以被立即发现(因为许多网络故障在网络流量低、比较清闲时并不表现或明显地表现出来)。当然,比较稳妥的方法是对网络进行认证测试。除了布线系统外还对工作的网络进行认证测试。以便在网络投入正常运行前就发现并根除网络存在的故障和潜在的性能问题,最大程度地优化网络的性能。

   [后记]第二天,我们应邀对该寻呼网作了一次简化程序的网络认证测试,其中流量冲击测试服务器耐受度为100%,如果不是上述故障,该网络性能总评应当是比较优秀的。

[案例二十九]PC机网卡故障,攻击服务器,速度下降
 
   [
症状]今天是五一节假期的最后一天,某大型铁路枢纽站来电,报告其售票系统出现很大问题,最先是枢纽所在局本地的售票系统报告售票速度比平时慢几倍,车站售票厅前已经排起了长队,乘客意见很大。其它市内预售处也受到影响,出票速度也很慢。随后,是各联网局均有报告网络的票务查询速度慢,邻近局报告更频繁一些。维护人员认为是中心票务服务器有问题,随即决定系统暂停业务并将备份服务器很快启动投入系统运行,非但未能见效,反而速度更加缓慢。急招该系统的工程集成商立刻处理系统问题,观察中心票务服务器CPU资源利用率达到了97%,基本上是满负荷运行,其它服务器和工作站等网上设备均为发现问题。短时间断开预售点和其它路局的连接路由,故障现象依旧。系统集成商随即将票务中心机房内的其它网络设备如交换机、集线器、网关等全部更换,启动系统故障依旧。故障累计已经近7小时,路局承受的压力越来越大,已经开始准备紧急启动本地人工售票预案。

   [诊断过程]网络医院接报后立即赶往票务中心计算机网络的机房,网管人员告知在节日期间已经出现过类似的现象,只是持续的时间不很长(有时会持续2小时左右),速度虽有变慢,但基本上不影响出票速度。经过与网关人员和系统集成商的工程技术人员简单交流后,分析故障原因可能有五,一是票务结算软件问题;二是病毒或内部人员尤其是网络管理人员误操作或更改设置,比如删除不应该删除的文件,私自在系统上运行了冲突软件或破坏性软件;三是系统平台故障,比如NT平台受到干扰后出现硬损伤(指不能恢复的改变,必须重新安装系统才能正常运行);四是网络设备问题,五是其它网络问题。由于已经更换过票务服务器和交换机等网络设备,所以先暂不考虑第一、四种可能性;为了节省故障诊断时间,暂不考虑第二、三种可能性(如对系统进行一次详细检查和协议测试或重新安装一次NT平台并做好相应的设置、数据恢复等需要较长时间),而首先就第五种可能性对网络进行测试。查看其它服务器CPU资源利用率,都在25%以下。查看网络拓扑结构图,将网络测试仪F683随即接入网络中的一台工作组交换机,观察整个网络的工作情况。先查看网络设备的工作情况,显示交换机、路由器等本身均正常。核心交换机与票务服务器的连接端口为第二插曹第7端口,设置为100Mbps,流量实测为84%,偏高。查看整个网段的MAC对话矩阵,也显示票务服务器的访问流量很高,进一步查看IP对话矩阵,与MAC矩阵基本一致,比其它对话矩阵中的成员高出500倍以上。追查访问的数据来源,发现一台内部账务处理PC机与票务服务器之间的对话流量很高。从MAC矩阵上观察其流量很高,从IP矩阵上观察流量稍低于MAC流量。为了提高处理速度,票务服务器按设计是直接与核心交换机相连的,而账务处理用的PC机通过桌面交换机工作组交换机核心交换机后与票务服务器相连。询问票务处理PC机的操作人员,答曰节前该机工作就不正常,速度慢。曾向网络维护人员报告过故障,但因邻近节日,维护工作量大,维护人员计划待节日以后再处理账务PC机的问题。将账务PC关机,系统故障立即消失,整个系统恢复正常,一片欢呼。为了确认该PC机具体的故障位置,将其移动到局办公网上接入网络,重新设置后工作正常!!!为了慎重起见,网管人员还是决定启用一台新机器代替账务PC接入网络,同时观察网络的工作状态。发现网络完全恢复正常,故障排除。用网络测试仪测试办公网,流量为2%,很低,无错误数据包。将集线器串入账务PC与交换机的连接通道,用网络测试仪和协议分析仪接入观察。从F683网络测试仪上观察,显示网络流量为79%!!错误37(其中90%为长帧,其余为短帧),网络测试仪指示流量来源于账务PC,数据包中有约36%左右指向了一个未知的IP地址,其它数据包虽然指向该地址但来源地址比较混乱且无规律可循,协议分析仪上解析的地址经网管人员确认后证实36%的指向地址是票务服务器的IP地址,其它来源地址也是原票务网中地址范围内的地址。如果该PC机携带能模仿IP地址的病毒程序,则原系统有可能还会发生类似故障,所以我们先将账务工作站PC的网卡更换,更换后该机表现正常(说明病毒在捣乱的可能性很小),不再发送非法帧。将故障网卡重新安装驱动程序,故障现象依旧,集线器上测试的错误仍是长帧和短帧,再次表明网卡本身故障的可能性最大,病毒感染的可能性很小。

   [诊断评点]现在可以让我们来事后模拟叙述一下整个网络故障的进程。以便读者了解故障的进程和原因。票务网络中的一台不起眼的工作站的网卡发生了故障。最初的故障发生于节日前,故障现象是发送错误帧。由于工作站与桌面交换机相连,而该桌面交换机是存储转发型性交换机,所以发送的错误帧被交换机过滤掉了。所以这些错误帧只能对本工作站造成影响,对网络不构成威胁。随着网卡的进一步物理性损坏,网卡变得不能清除发送过的IP地址,并将目标地址定格在访问联系最多的票务服务器,开始发送不受限制的数据包。这些数据包不断请求票务服务器处理重复查询计算同一张票的出票业务。由于其不受发送速度的限制(即该网卡不管网络流量是否超高,都会不加理会地向网络发送流量),网络中的交换机随即将大量的垃圾包送往票务服务器,占用大量网络带宽资源,同时迫使票务服务器消耗大量资源处理这些垃圾包,使得其它正常的网络访问受阻。还由于这些数据包的可操作性很差,服务器会进一步耗用额外的资源来处理这些数据。上一篇故事中我们曾提到过,网卡故障后有两类基本的表现,一类是安静型,即不再进行正常的网络通信并且不再向网络发送任何数据,这是比较友好的醉汉。对网络基本上没有破坏性。另一类是狂躁型,发生故障后向网络发送不受限制的数据包。这些数据包可能是正常格式的,也可能是非正常格式的(即错误数据包)。两种格式的数据包都可能对网络性能造成严重影响甚至破坏。错误格式的数据包一般不能通过存储转发型的交换机,所以本故障的网络监测看不到错误数据包,只能看到正常格式的故障数据包。当接入集线器后才可以观察到错误数据包。

   [诊断建议]该网络由于系统成员数量少,在建网规划时没有配备网管系统和测试工具。所以故障早期没有任何超流量报警信号提示,这对于网络故障的迅速定位和排除是不利的。现存的许多网络在维护工作中都基本上采取事后维护的方法,即出了问题才去查找和处理,这对于可靠性要求高的网络是非常危险的。因为我们不能侥幸地期盼不管是网络设备,还是网上设备,他们出了问题以后都表现为安静型。只有坚持定期地对网络进行监测才是避免重大网络事故的有力措施。其实在本例中,如果每日坚持用3分钟时间监测一下网络,就完全可以在故障的早期排除之,避免后期重大事故的发生。

   [后记]我们担心的病毒至今没有出现。

[案例三十]服务器、交换机、工作站工作状态不匹配,访问速度慢
 
   [
症状]网络建好了,对于系统集成商来说,设备的安装调试一旦完成,一般都要安排一个小小的庆贺仪式。而对于一家承担过十几项大型工程的系统集成商来说,面对一个400个用户的中型网络,设备调试的工作应该不是难事。但是,直接从庆贺仪式的准备现场赶来网络医院报警的病人今天还是第一此遇到。
   
某著名系统集成商专门负责政府网建设的项目经理罗先生今天十万火急地到网络医院电话急诊,请求紧急支援。原因是下午的“竣工验收”仪式和晚宴已经定好,本工程又是他们公司首次采用六类线电缆系统的样板工程,邀请的十几个重要客人今天下午均会相继“出场”。按原工程计划的进度安排,网络的调试工作用三天时间进行,于前天上午完工。而直到今天上午10:00为止,调试工作因遇到拦路虎,还没有成功通过系统调试。如果今天下午15:00以前不能调试成功,那么请来参观和观摩的客人自不必说,单就企业的声誉来讲,恐怕无可避免地将受到严重影响,且进一步的业务深入也将会受到严重影响。
   
罗先生反应的网络故障表现很简单:基本上所有的网络成员访问网络资源的速度都非常缓慢,Ping测试联通性表现良好,均在2ms以内,从服务器上拷贝一个20Mbytes的文件竟需要5分钟。调试人员曾试着从相邻的工作站上拷贝一个20Mbytes,对比结果显示同样也需要5分多种的时间。怀疑是操作系统和系统软件平台安装上的问题,特别是服务器安装上的问题。调试人员已经将所有用户重新安装过两遍,凭借以往安装系统的丰富经验,他们十分有把握地保证操作系统和软件平台安装设置没有问题。为了了解数据包在网络中传输的对话情况,又从朋友哪里借了一台协议分析仪对收发包进行测试,结果显示包的收发反应时间基本正常,只是包的转发时间间隔很长,无法进一步确定是哪个环节的问题所至。网络的公共部分是一台10/100核心交换机和三台服务器,服务器直接与核心交换机相连,其它工作站则通过下属的工作组交换机和集线器等与之相连。起初怀疑是交换机的问题,试着更换了一台同型号的交换机,故障依旧。从主代理哪里借来一台服务器作替换试验也无效。

   [诊断过程]我们立即随罗先生赶往事故现场10分钟后抵达现场。首先从一台工作站上Ping服务器和任意选定的位子网内其它5台的工作站,响应时间均小于1ms,说明联通性尚可。调试人员怀疑是交换机问题的可能性是存在的,但我们认为证据不足。这是因为从邻近的工作站直接拷贝文件也很慢,这时数据包不经过核心交换机,有的虽通过工作组或桌面交换机,但有的则直接通过集线器。所以故障的公共部位比较可能的是新的布线系统、操作系统和系统软件平台、关键网络设备本身的故障或错误、网卡驱动程序错误等等。用网络测试仪实施流量贯通测试,选择从任意一台工作站到服务器为一条通道,再任意选择该工作站到其它5台工作站直接的通道,共6条测试通道作试验样本。从测试仪上分别发送正常的IP包流量到上述6个对象,流量选定为健康指标的上限值,即40%。用网络一点通在被测试的站点模拟网络设备配合接收流量,结果发现收到的流量都不足1%,且广播包占20%以上。缩短流量贯通路径,直接向邻近的工作站发送流量,结果收到的流量有两种明显的结果。一是流量大量增加,达28%左右,其路径是通过集线器连接的通道,属于正常表现。另一种结果同前面观察到的现象一致,收到约1%左右流量帧。观察收到28%的流量结构,其中92%~98%为碰撞帧,少量FCS帧。由于邻近的工作站是用集线器连接的,发生如此高的碰撞最大的可能性是电缆系统的问题。我们随即测试该六类链路,并任意抽查了其它5条六类线链路,测试全部合格。说明链路的物理联通性是合格的。但因为集线器、交换机等的物理接口是超五类的元件,六类线链路从理论上和厂家的承诺上讲应该与其能兼容。观察用于发送40%流量的网络测试仪自身的流量记录,碰撞率与上面的结果一致,提示该六类线链路可能与10/100M的网络设备阻抗不匹配。如果真是这样的话,那么问题牵涉的范围就比较广泛而且严重了。这是因为这涉及到六类链路与超五类器件的通用性和向下兼容性的问题,而这是六类线电缆厂家承诺和保证的优越性之一:采用五类和超五类设备的网络可以与六类链路任意对接,如果今后需要使用更快速的网络设备,则只要更换支持六类链路的网络设备就可以达到超高速的应用。从网络的表现来看,因为这是首次安装的六类样板链路,并且是在六类链路上挂接超五类端口的网络设备,而网络的表现范围广、现象比较一致:出现大面积内的速度慢故障。协议分析仪解包显示包交换正常,不能证明是网络操作系统和软件平台的问题。所以,安装了影响全局的部分只有六类线布线系统,这也是调试人员重点怀疑的网络部位。我们当然不能由此认定是网络设备端口的问题或是六类线链路与端口不匹配。为了慎重起见,我们用两条超五类线缆连接两台相邻的工作站,再次试验拷贝文件,结果故障依旧。这说明六类线系统不是真正的故障原因。剩下的问题就是需要确认工作站工作协议、配置、驱动程序、物理参数是否与网络匹配了。方法很简单,将在线型网络万用表串入工作站和网络端口(我们分别选择了一个集线器和一台交换机的端口)。结果显示如下:一台工作站的工作速度为100M,端口设置为全双工,而对应的集线器设置为100M半双工;另一台工作站工作速度为100M,端口设置为半双工,对应的交换机设置为半双工。罗先生告知,网络中的网卡使用了三家公司的产品,都是非常知名的厂商。A公司的产品占90%,其余则为B公司的产品,另外,服务器使用的是服务器厂商C公司自己的网卡。我们抽测了A公司的10张网卡,用网络万用表测试,显示设置全部是全双工;而抽测的5B公司的网卡则全部是半双工设置。我们选择相邻的两台安装了B公司网卡的工作站拷贝文件,结果发现拷贝速度非常快,约3秒钟。接下来我们把两台安装有A公司网卡的相邻工作站改为半双工状态,20Mbytes文件拷贝时间也是3秒钟。
选择被试工作站到服务器的通道,它们通过一台集线器,两台交换机后到达服务器。依次测试链路中的速度和工作状态,结果发现服务器网卡也是全双工设置状态。更改以后试验从服务器上拷贝一个100Mbytes的文件,耗时约13秒。说明性能比较优良。

   [诊断评点]故障的原因已经很清楚,该系统集成商选用了三家公司的网卡,而其中的A公司网卡被全部设置为全双工状态,服务器也被偶然地设置为全双工状态。但系统中的交换机、集线器等都工作在半双工状态,所以,凡事安装有A公司网卡的工作站工作速度都很长慢。其它安装了B公司网卡的工作站,虽然自身设置是正确的,但由于数量少,只站不足10%,加之服务器也被设置为全双工状态,所以调试时很可能与A公司或C公司的网卡进行数据对接,这样速度就无法正常。如果偶然地与同类B公司网卡进行数据交换,则调试人员有机会发现虽然所有的工作站与服务器连接速度慢,但并不是所有的工作站之间直接联络时的速度都慢。不过,因为A工商产品数量居多,服务器设置又不正常,所以这样的机会不多。
   
网卡的协议设置和工作设置会直接影响工作站的速度。一般来讲,工作站的协议设置多数时候不容易出错,但是否与网络的工作协议一致则有时会弄混。比如,工作站使用SMTP协议收发邮件,而网络的邮件服务器使用的是POP协议收发邮件,则工作站将无法进行邮件收发操作。比较容易出错的是10/100M设置状态、全双工半双工设置状态、链路数字脉冲极性选择等,这些方面的错误由于网络维护人员和安装调试人员的有意无意地疏忽,加上没有合适的检测方法和工具,往往会给系统集成商造成很大的麻烦,而故障原因却是如此地简单。很多时候调试人员使用默认设置,并不经常验证实际的状态如何。
   
本故障的诊断走了一些弯路。因为是新安装的六类线系统,使得故障诊断时有意地倾向于首先怀疑是否是此新系统与100M超五类系统(实际上,超五类系统是为1000M以太网准备的)不匹配方面的问题。如果首先在相邻工作站与交换机或集线器之间检查链路工作状态的检查,则可以在10分钟内找到问题。本故障实际耗时约100分钟,赶在13:00以前收工。
   
罗先生紧急动员所有调试人员立即检查并调整全部的A公司网卡,只用了不到一个小时就将全部设置改为了半双工状态。

   [诊断建议]网络维护人员和部分安装调试人员往往错误地认为网络的维护和管理就是去管理服务器、工作站、打印机等网上设备。这是片面和有害的。其实网络维护人员真正需要下功夫维护和管理的地方是网络设备而不是网上设备。网络设备通常是指路由器、网关、桥、交换机、集线器、广域传输设备、电缆光缆等等。这些是被许多网络维护人员和部分安装调试人员忽视的地方。有的则是因所学专业的限制有意无意地忽视之,特别是对光电参数的验证和测试更是如此。

   [后记]15:00正式的验收仪式顺利开始,验收工作非常顺利,在此不表。

[案例三十一]交换机设置不良,加之雏菊链效应和接头问题,100M升级失败
 
   [
症状]某化工交易中心华东公司,今日报告网络从10M升级到100M后,约有一半的工作站无法提速,他们都在同一个楼层。另一楼层的5台工作站则无法入网。另外,两个楼层中都有少数工作站工作速度比升级前更慢,而且并不是对所有的服务器或其它工作站访问都慢,对少数服务器的访问速度还凑合。该公司没有配备任何用于网络维护的工具,所以,除了可以观察服务器的CPU利用率以外,只能用软件间接观察网络的流量和碰撞率。观察到的碰撞率偏高的微网段可以达到20%,但不知道该如何处理。据负责网络管理的Lucy小姐介绍,网络升级前所有工作站都是可以接入网络中运行的,只是部分站点速度有些问题,但可以用。公司的网络规模不大,共占有两层半楼面,拥有280台工作站,计算机室配置了三台工作组交换机,分别为三层楼面提供连接。三台交换机通过一台100M集线器共享。路由器一台,也通过工作组交换机连接帧中继网络。交换机下面通过级联100M集线器构成星型结构将链路接口连接到用户桌面。升级工程很简单,将10M交换机更换为100M交换机,10M集线器更换为100M集线器即算大公告成,机架上的设备布局基本按原样安装。用户端则全部更换为100M网卡,施工时间是利用周六、周日两天非业务时间,将全部用户都搞定,全部作业都有公司自己的员工负责。完工后抽查了部分工作站,工作状况良好,由此认定升级工程验收合格。可是周一上班,麻烦随之而来。

   [诊断过程]该网络的结构比较简单随意,集中反映出的病症有三种:一是部分站点不能上网,二是部分站点速度变慢,三是有一半站点不能提速到期望的100M速度。这些其实都是网络升级时经常遇到的问题,也是比较典型的网络升级症
我们将F683网络测试仪首先接入不能上网的站点所在的微网段,观察网络的工作情况。网络搜索的结果显示无法发现这几台工作站,但“Ping”测试却偶尔能有反映。一般来讲,出现此类病症的原因基本上是工作站和网络之间的匹配有问题,比如协议不匹配(一致),驱动程序不匹配,网卡速度不匹配,Link脉冲极性不匹配,链路的接口物理参数不匹配,电缆、光缆规格不匹配(如使用了三类线等),测试的方法比较简单,可以直接用网络测试仪、网络故障一点通、网络万用表自身具备的接口测试功能直接对网卡、集线器、电缆等进行测试。对5台工作站的网卡逐个进行测试,结果如下:网卡为自适应卡,工作速度10M,交换机端口为100M固定速度半双工设置,双方选用的协议完全匹配,物理电参数测试合格。因而进一步对从配线间到用户之间的电缆链路进行测试,结果发现5台工作站使用的电缆接头均为三类线接头。更换水晶头后用五类线标准测试均合格,5台工作站全部上网成功且速度很快。
   
用网络测试仪对不能提速的工作站进行测试,当网络测试仪模拟工作站发送5M流量时,用网络故障一点通接收之,显示收到的流量为5Mbps;而当网络测试仪从集线器近旁模拟50M流量发送数据帧时,收到的流量指示仅为10Mbps。这说明,网络只能以10M的实际工作速度运行,不能提速到升级工程实施前所预期的100Mbps的速度。重复上述类似的对网络和工作站的匹配性测试,结果如下:交换机设置为10/100M自适应状态;协议测试显示完全匹配;物理电参数测试全部合格。因此怀疑仍然是链路接头的问题。抽查了10条链路,用DSP4000电缆分析仪进行现场认证测试,结果显示全部链路都不合格。按下电缆分析仪的故障诊断信息健,指示链路的两个接头均不合格。我们注意到这些故障链路都在同一楼层。改用三类线标准测试链路,合格。这说明,该楼层的链路所使用的水晶头问题普遍比较严重。
   
继续对升级后速度比升级前的部分工作站进行监测,发现他们的流量为1.0%,而碰撞率为87%左右,另有12%左右的FCS帧错误。网络测试仪接入模拟工作站后仪器上的蓝色指示灯亮,说明工作状态是100Mbps。查看Lucy小姐提供网络结构拓扑图,发现速度变慢的用户共有417个工作站,他们的100M集线器级联数均达到了4个,出现所谓的雏菊链效应,影响网络的正常工作。碰撞数据尤其是延迟碰撞和FCS错误帧将大量出现。

   [诊断评点]该网络出现的问题比较典型,许多网络在升级都会碰到类似的问题。首先,不少交换机产品是10/100M自适应的,交换机可以自动监测网络能够提供的工作速度,然后确定实际的工作速度和工作模式。比如,某些只能交换机现监测接口的链路脉冲,确定链路的连接速度,然后检测接口处的错误率,如果错误率低,则交换机工作在快速的切发行交换模式;如果错误率超过门限值,则交换机工作在速度稍慢的存储转发型工作模式。另外,一些交换机还允许用户手动设置端口的速度,以固定的速度模式访问网络。
   
5台工作站不能上网原因是,工作站链路因使用了假冒伪劣的五类接头(实际指标是三类接头),工作站只能自适应为10M链路速度,但因该楼层的工作组交换机被手动设置为100M接口状态,所以接口速度无法适应,工作站不能上网连接。
   
其它不能提速的工作站都在另一台工作组交换机连接的另一楼层,由于交换机没有设置为手动状态,其自适应的结果就是因假冒伪劣插头的限制链路速度被“适应”在了10Mbps的工作速度。部分升级后速度更慢的用户原因在于雏菊链效应的影响。我们知道,10M以太网允许最多4个集线器级联,而100Mbps以太网之允许2个集线器级联。集线器一般不具备自适应能力,所以升级后很容易出现雏菊链效应。此时网络中会时限大量的延迟碰撞以及由此而生成的FCS帧校验序列错误出现,工作站在发送数据帧时常因无法发送完整无错的帧而被迫多次重复发送。除了占用带宽就是增大了有效数据帧的等效延迟时间,表现为用户的速度很可能比升级前更慢。另一些用户则表现为虽然速度有所提高但仍达不道预期的速度。

   [诊断建议]建议用户将布线系统进行全面测试,对交换机进行设置,清理有可能出现的雏菊链效应结构,对实在有困难的集线器组则可以考虑增加交换机数量,以便分割和缩短雏菊链。

   [后记]两周后随访用户,他们已经全部将不合格的水晶头更换。测试结果显示电缆系统都合格,知道庆幸。由于当初在工程施工时为了抢进度,各楼层的布线工程是由三家不同的工程商同时进行的施工。其中一层全部采用的是假冒伪劣的水晶头,另两层除了5台链路误用不合格水晶头外(具体原因已经无从查起),全部使用的是合格产品。对雏菊链拓扑的检查共发现7组集线器有嫌疑,按照我们的建议,增加了4台工作组交换机,用于分割雏菊链。网络现在工作良好。

[案例三十二]交换机端口低效,不能全部识别数据包,访问速度慢
 
   [
症状]某大型化工股份有限公司信息中心主任洪先生向网络医院报告网络故障,新近进行网络的更新升级和扩容,由10M网全部提升为100M以太网,核心交换机为千兆以太网。完工后系统试机时发现,大部分的网络成员感觉速度慢,有时数据出错,但子网段内拷贝数据速度基本不受影响。Ping测试检查所有工作站和服务器均正常。遵照网络医院上周的建议他们对网络布线系统进行严格认证测试,布线施工质量优良,全部电缆光缆链路按超五类标准测试参数均合格,没有发现任何问题。由于信息中心除了电缆和光缆的认证测试仪外,没有其它测试维护工具,无法对网络进行评测。虽然仔细进行了网络系统及平台的重新安装,仍无济于事。由于总公司希望全面提高ERP系统的覆盖范围,新增的网络设备比较多,网上成员也增加了二倍多,工作站从原来的220台猛增至680台,办公区和生产区之间、生产区和生产区之间均用光缆和路由器连接起来,因此洪主任抱怨现在网络的管理成了问题,查找故障不象从前那样容易了,一来网络规模比以前大多了,故障数量和种类增多,二来网络结构变得比以前复杂多了,故障的定位分析和隔离变得比较困难。
   
该网络各子网段基本上采用核心交换机和工作组交换机作网络骨架,用桌面交换机和集线器混用的方式构成基层用户接入平台,核心交换机之间为千兆以太网连接,用户全部为100M到桌面。为了便于维护和管理,同时也从安全角度考虑,设计方案中将大多数数据服务器均安装在了网管中心。

   [诊断过程]网络为新扩容的网络,从拓扑图上看不出网络结构设计有何不合理之处。由于在各子网段内拷贝数据时速度基本不受影响,所以分析数据多在跨网段时受阻。将网络测试仪接入办公区网络的网管中心,打开网段内的全部4个路由器的端口观察,网段间的流量为27%~42%之间,由于网络没有多媒体应用启用,因此如此高的流量记录是不正常的。我们需要观察这些流量的走向,于是在办公区将网络测试仪串入路由器与交换机之间(100M端口)监测,启动IP矩阵监测和以太网MAC矩阵监测功能,观察数据流向。结果如下,大部分的数据流向均指向办公区的WINS服务器,而WINS响应流量极少。查看拓扑图,该WINS服务器直接与一台工作组交换机相连,打开工作组交换机的端口记录检查,流量记录为13%,伴随少许碰撞指示记录。为了不影响用户的使用,下班后我们从测试仪所在端口向WINS服务器所在交换机端口P32的邻近端口P31发送高额流量,选值为90Mbps流量冲击,并在此邻近端口P31观察接收到的流量记录,记录显示为89.7Mbps,这说明端口P31的通道测试是合格的。然后对准WINS服务器所在端口P32发送90Mpbs的高额流量,观察P32端口流量冲击记录,结果显示为13.5%,并出现大量延迟帧,表明该端口通道测试不合格。将流量发送方向指向与该端口连接的上游端口P17,观察P17流量显示为90Mbps。问题很清楚,被丢弃和延迟的流量就在P32口。对WINS本身作WINS查询,10次测试响应只有2次,响应地址正确,响应率20%。重新测试WINS链路电缆,合格。测试WINS服务器网卡,合格;测试交换机的端口P32,低效。在此临时将WINS服务器端口P32改接到端口P33,重新启动系统,5分钟后进行上述测试,全部合格。为了验证P32口低效,用网络测试仪接入该端口并向P17发送90M流量,收到流量为12%。由于这台工作组交换机为新品,尚在保用期之内,因此建议立即更换之。

   [诊断评点]网络中的大多数数据服务器由于设置在办公区的网管中心,所以公司整个系统的工作依赖集中式系统中的这些专用数据服务器,链路连接和数据交换时需要WINS服务器提供服务。与WINS服务器连接的链路中,交换机一侧的端口P32发射能力低效,使得发送的信号幅度不符合要求,由于链路长度不长,所以并不是对所有的数据包WINS服务器都无响应。有些数据被作为部分错误和碰撞数据由端口记录之,大部分从交换机各端口送往P32端口的的数据因链路接口问题被延迟和丢弃,造成记录数据中有用流量正常,而网络用户速度普遍偏慢的假象。交换机、网卡、集线器和路由器等网络设备的端口一般从工作23年开始出现低效现象,5年比例为3%~18(这取决于不同的厂商产品质量,也取决于同一厂商的不同系列产品的产品质量)。由于系统中有大量的端口,所以在网络维护周期建议中要求每半年对端口性能进行定期测试。每一~二年对布线系统进行一次轮测,尤其对重要的网络设备如服务器、交换机、路由器等应该坚持定期测试,这样做对提高网络的可靠性有莫大的帮助。

   [诊断建议]建议病人所有网络设备进行一次普查,将全部端口都进行备案测试,并列入定期维护的内容之一。

   [后记]第二洪先生告之,上班后所有网络用户都惊喜地发现,网络速度比之以前有了惊人的表现,速度真正大幅提高,皆大欢喜。

 

 

 

 

- 作者: 孤独疯子 2006年11月17日, 星期五 10:15  回复(0) |  引用(0) 加入博采

网络故障汇编(四)

[案例二十二]防火墙设置错误,合法用户进入受限
 
   [
症状]今天的病人是某市社会保险局,昨天下午全局工作人员加班,配合网络管理部门于18:30安装好了一套新的防火墙系统,重新启动整个保险网络系统,反应良好,防火墙工作也很正常。但好景不长,今天上班时,许多Intranet内部有权用户就打电话反映在查询和操作保险资料时出现无法进行数据调用和修改的故障现象,此时屏幕提示登录者为非法用户;系统管理员同时还发现只有从防火墙处可以访问网络并修改数据。同时,一个有趣的现象却是,Internet外部普通用户在查询各种用户资料时却没有问题,他们无论从何处都可以顺利地访问Web服务器。他们投诉的对象主要是业务部门为何都一天了,还在借口计算机网络故障不受理业务,到底能不能弄好,什么时候能弄好。由于Intranet主要是供内部系统业务机构的各级有权网络用户使用,所以系统的许多正常功能无法正常启用,致使员工和业务对象反响都很强烈。该社会保险局的网络结构比较复杂,含业务专用网,OA网,Intranet网和Internet网等。其中,Intranet设计为内部业务网,主要进行业务服务。Internet主要是为电话接入访问的用户提供服务, OA网通过LAN内的以太网交换机同Web服务器实现联结。无论是Intranet用户还是Internet用户均可以在网上申报和查询资料。业务数据的安全设计为双Web服务器,Internet用户和Intranet用户各用一个。IntranetWeb服务器兼有备份数据的功能,两个Web服务器互联,之间的业务数据同时更新。Internet用户只能浏览、查询数据并可以进行网上申报等各种服务,不能更改数据。对Intranet内部用户实行有权访问和申报、数据修改特权限制等体制。局内的OA网用户可以象Internet用户那样随时访问和查询InternetWeb数据服务器,其中设置了部分有权用户,他们可以访问Intranet业务网的Web服务器。安装的防火墙对IP包进行过滤,只允许合法IP用户进入。从病人传真过来的网络结构图看,Intranet的用户用PSTN公用电话系统、DDN数据专线将各地、县、区的业务网络节点联结起来, 使用者都是地点固定的内部用户(员工)

   [诊断过程]显然,故障现象与昨天新安装的防火墙系统有很大关系。将网络测试仪F683接入服务器所在网段,启动网段搜索功能,可以发现Internet用户的Web服务器,但不能发现IntranetWeb服务器。去掉防火墙,则可以搜索到该服务器。说明确实是防火墙的问题。但昨天安装防火墙时整个系统是正常的,所以查找故障的焦点要放在安装防火墙以后有无更改过防火墙参数。此即故障排除经验中的所谓动则有过故障查找原则。如果能弄清网管人员都动过哪些参数和设置,查找故障的工作会便捷得多。经常让人感到遗憾且奇怪的是,多数维护管理人员都不会承认更动过网络的任何设置,这次也同以往一样。用网络测试仪连续作ICMP类型PING测试发现,Web服务器是存在的,且反应率为百分之百。说明Web服务器在网络上且可以正常工作。同时用网络一点通One Touch选择Web服务器的IP地址为目标地址发送流量,启动网络测试仪的协议分析功能,发现数据帧指向防火墙以后就没有任何反应了:任何回应数据帧都未出现。将网络助理One TouchIP地址设置成任何一个已经存在的有权用户的IP地址,然后对Web服务器发送流量,这时网络测试仪可以观察到防火墙有回应数据帧出现。这说明防火墙对合法IP地址的有权用户是有反应的,但一般返回的数据帧是非法用户的提示信息。注意到前述现象中提到过只有防火墙能访问Web服务器,我们就将网络测试仪的MAC地址改为与防火墙相同的MAC地址,用网络测试仪假冒防火墙进入网络,启动网段搜索时则可以看到久别了的Web服务器。
   
以上现象说明,该防火墙的功能比较强,除了能过滤IP地址外,还能对各站点的MAC地址进行过滤,以防止拥有合法IP地址的非法用户进入系统,是一个比较好的看门人。但让人疑惑的是昨天安装防火墙时,网络管理人员只启动了IP包过滤功能,并未启动MAC地址鉴别功能,那么,MAC地址滤波功能是谁启动的呢?答案是:不得而知。查看防火墙帮助文件,按提示揿下format下拉式中的MAC地址过滤菜单,关闭MAC地址过滤功能,系统随即恢复正常。

   [诊断评点]不少防火墙是靠对IP地址进行过滤和用户密码识别等方法来鉴别有权用户及其合法性等级的,一般不对网卡的MAC地址进行识别。安全性要求高的用户则需要对用户的MAC地址进行鉴别,以便阻止获悉了密码的非法用户模仿IP地址(用户可以在2分钟内随意更改工作站的IP地址)访问网络,部分防火墙和网管系统具有类似功能。我们知道,一般网卡的MAC地址是按制造商的编码设置的,从原理上讲世界上没有两块具有完全相同MAC地址的网卡,而多数网卡地址在制造时就永久地固定在ROM中,用户是不能更改的。对于具有固定用户的Intranet网络,具有MAC地址过滤功能的防火墙是非常有效的,它可以阻止对网络的各种试探性进攻。
   
对于Internet用户,这一功能不能启用,所以需要采用两台Web服务器,一个用于查询和申报,另一个作备份,并可以按有权体系修改相应数据。可以肯定,系统管理人员昨天在防火墙安装完成以后可能出于好奇或是其它原因擅自将防火墙的MAC识别功能按钮有意无意地按下了,从而启动了MAC识别功能,致使今天整个系统工作不畅。

   [诊断建议]Intranet网络固定有权用户和部分OA网络固定有权用户设置MAC地址鉴别功能对于系统安全和阻止非法用户、恶意用户的进攻是有效的。这类用户多数来自于网络内部的成员,对加权识别设置和安全口令有一定了解,容易钻空子。设置MAC识别功能后,除非是在对应的那台唯一的机器上进行操作,否则是无法进入网络的。我们向该社会保险局建议将防火墙安装分两步走:先将系统内的网络成员的所有网卡的MAC地址备份,在备份工作完成以前,暂时不启动MAC地址鉴别功能;第二步,启动MAC地址识别功能,以提高系统的可靠性。稍微麻烦的是,有权用户在更换网卡时必须向防火墙管理员申请重新设置合法的MAC地址档案才能进网工作。这样,网络固定有权用户的任何成员在需要更改机器的IP地址以及更换网卡或新机器时都必须向系统管理原申报备案后才能进行。

   [后记]一周后,社保局网络防火墙的MAC识别功能启动。

[案例二十三]路由器工作不稳定,自生垃圾太多,通道受阻
 
   [
症状]今天的病人很特殊,是某电力信息部门的主管。称其特殊是是因为该部门主管曾多次打电话要求网络医院为期诊断广域连接的问题,但每次都会在15分钟内来电通知故障已排除。询问其排除方法,回答基本上都是“Reset”整个系统。由于该用户只安装了一套价格不菲的网管系统来管理整个网络,没有配备其它用于网络维护的工具,网络医院为此曾建议专门为其做一次全面的体检,对该信息网络的各个布线系统、网络设备、工作协议、负荷均衡性、负荷能力、错误帧耐受能力等做详细检测,但一直因各种原因未实施。今天的症状还是老毛病:某电厂的信息网络与电力信息中心的网络联系不畅,数据传输速度不稳定,连接时断时续,有所不同的是系统Reset后仍然不起作用。

   [诊断过程]该网络下辖9个电厂子网络,一个子网络用X.25连接,8子网络个从去年起陆续更换为DDN链路。其中一条专线DDN线路(7#线路)偶尔会出现连接中断的现象,恢复系统时必须将路由器Reset才能重新连接。今天按老经验,故障现象出现时重复以往的操作程序却发现此办法不管用了,系统仍然不能连接。直到我们赶到现场时系统还未能恢复正常。将网络测试仪接入信息中心网络,可以看到与各电厂子网连接的路由器,查看7#路由器工作表,有少许传输延迟错误记录,通道流量30秒记录为7帧,其它线路的30秒记录则从170帧~2700帧不等,明显高于7#线路;对7#子网络做通道测试,最高为2kbps,远低于64kbps的线路最高速率,说明DDN链路传输正常数据的能力很弱。由于该路由器支持的错误识别和统计功能有限,用网管系统不能查看更详细的统计信息,故改用F69x流量分析仪串入WAN通道进行测试,发现少量未定义帧类型,其记录标识不稳定。也就是说,通道上有一些是网络不需要的且不稳定的比特流。这些比特流不便于分类,流量不稳定,时高时低,表明网络可能存在垃圾,且比较象窜入系统的干扰信号。这些垃圾严重影响正常数据的交换和传输。
   
为了验证其影响程度,我们用F683网络测试仪向远端子网络作ICMP Ping测试,损失率为10%,不算高,作ICMP Monitor测试,目标不可达50%,重定向20%,拥塞85%,这说明路由通道存在很严重的问题。从中心网络的主网段检测没有发现网络上有干扰比特流,测试为7#路由器供电的UPS输入输出电源谐波含量,显示正常,由此基本上可以排除垃圾比特来自于网外窜入干扰比特的可能性。将其它路由器与7#路由器掉换,重新设置后启动系统,故障依旧。由于垃圾比特数量少,不可能引发网络通道传输速率性能大幅度降低,因此推断垃圾比特极有可能是来自于专线DDN链路或远端子网络的路由器。本地信息中心没有配备测试DDN链路的工具,在没有足够证据怀疑就是DDN链路的问题(DDN链路系租用的电信线路)的时候,我们只能先从远端子网络查起。远端子网络没有任何网络维护工具,从中心网络的网管系统又看不到远端路由器存在异常数据,我们只能立即启程赶往7#电厂所在地。4小时后,我们抵达目的地并开始测试。先检测7#子网的工作状态,LAN内部数据交换正常,没有垃圾比特流存在。打开路由器工作表,其中的错误数据记录有少量帧延迟数据包,WAN连接数据交换故障现象依旧,网络测试仪测试的通道测试数据基本与中心网络相同。用F69x流量测试仪测试通道流量,发现大量垃圾比特,数量为55kbps,其中35%指示数据来自远端路由器。由此可以断定故障是由远端路由器或靠近路由器一段的DDN链路(可能性很小)造成。更换从信息中心带来的备用路由器后,故障消失。

   [诊断评点]WAN通道故障可由多种原因造成。一般来讲,通道测试不合格就表明含路由器在内的WAN链路有问题。由于WAN链路可以由多种传输介质及传输协议组成,比如ATMDDNISDNFrame RelaySDH等等,所以针对不同链路类型严格地讲要用专门的测试工具进行测试。但因为一般用户都不配备WAN测试工具(部分集成商有相应配置),所以用户或系统集成商只能先用排除法首先确定是否是路由器(含路由器)以内的网络问题,然后,才能向WAN链路运营商提出检查服务通道的要求。本故障是由远端路由器故障造成,路由器除了传送正常数据外还向WAN链路方向发送大量垃圾比特,从而占用通道流量,严重影响正常数据传输。早期路由器工作虽然不稳定,但每次故障时间不长,所以在“15分钟内故障能自愈(此类故障我们称其为软故障)。本次故障由软故障转变为不能自愈的硬故障,反而为排除故障提供了有利条件。由于多数数据被DDN专线链路给过滤掉了,且远端路由器对错误数据的统计识别功能有限,所以从信息中心观测到的垃圾比特比较少,观察远端路由器也不能发现详细的错误统计。但ICMP Ping测试、ICMP Monitor等测试错误数据较大,与远端测试数据基本相等,同时从远端测试到的垃圾比特流很大(“F69x流量分析仪+F68x网络测试仪组合具有极强的检测功能,支持完整的错误识别和统计功能,这也是为什么我们认为DDN链路出故障的可能性小的原因),所以断定故障出在远端路由器。其实,如果远端子网络配备有合适的测试工具的话,本故障在很短的时间内就可以排除。

   [诊断建议]工欲善其事,必先利其器。大型网络配置一些备用网络设备是必要的,还需要按网络规模和使用级别、维护人员的技术等级配备相应的维护工具,并建立一整套测试维护的方案和规定,这样才能保证网络的可靠性,并保证能及时处理各种网络故障。因为一般的网络设备都具备部分网管功能,能统计并识别30%~40%左右的网络错误和故障信息,所以,有时这给人一种错觉:认为只要具备网管功能,就能发现网络的一切故障。其实,进一步的性能测试需要专用工具,要求这类工具不光能能识别各种正常的工作协议,还要能识别形形色色的网上垃圾。一般来讲,除了配备相应的LAN测试工具外,由于WAN链路的测试维护由WAN链路运营商(比如电信公司)负责,但网络用户和系统集成商也需要配备一定数量的WAN测试工具以备性能评测、故障救急以及定期测试的需要。

   [后记]两天后病人来电告知,经过对电路板的测试,发现路由器供电直流电压不稳,进一步测试发现稳压电源IC工作电压不稳定,温度很高,更换IC后路由器恢复正常。

[案例二十四]PC机开关电源故障,导致网卡工作不正常,干扰系统运行
 
   [
症状]今天的病人很有趣,是某电信局网管中心,十万火急地要求网络医院帮助立即解决燃眉之急。放下电话我们立即启程奔往目标所在地。为提高效率,途中继续与该中心主任进行通讯联络了解病情。网管中心所在地为一地区中心,下辖两个县级市和7个县,安装在地区网管中心的网管系统在两个月前发出了报警信号,提示某县级市的网络有异常情况。一个月前省局工作组在检查工作时发现该县级市不在网管中心的网络拓扑显示图上,询问原因,当时答曰:今天正好赶上该县级市进行工程施工,所以将网络管理功能暂时关闭,故在网管机显示器上的拓扑图中无该县级市的网络图标。现在所谓十万火急的问题即是:明天工作组将要进行第二次验收检查,而网管系统是此次的重点检查项目之一,不可能再用网络工程在施工为由回避检查该子网的状况。因为网络拓扑图上的报警信息仍在,该县级市的问题也一直没有彻底解决(县级市子网却一直报告网络正常,速度很快!对定位故障一直不太主动),明日检查恐怕无法过关,所以才想到引入紧急外援。另外需说明的一点是,该故障在初期时隐时现,最近才由飘忽不定演变为高频发作甚至是持续存在的故障现象。针对这一情况,我们决定先不去地区中心,而是直接转道前往该县级市网管中心,因为从网管指示的范围看问题很可能出在此处。另外,该中心距我们现在的位置比地区中心也更近一些。
 
   [
诊断过程]半小时后即抵达目的地,立即投入体检工作。根据地区网管中心提供的线索,该子网的路由器报告错误数据流量较高,因此直接对该子网进行测试。该子网为用交换机连接的多网段结构,含810BaseT18100BaseT以太网。用网络测试仪接入网络作自动监测,测试路由器平均错误流量记录为3%,有效流量为7(广域连接用的是E1链路)。观察交换机自身提示的错误流量系指向第一插槽的3#端口所连接的子网段,其它子网段测试正常。3#子网段为拥有97个工作站的100BaseT以太网网段,DNS服务器、IP服务器和其它主要的业务服务器也挂在该子网段内。测试3#端口的错误计数统计值为25%,随即将F683“网络万用表”(即网络测试仪)移动到3#网段进行监测。结果指示:错误类型为帧校验错误和其它未分类错误(这可以是为无帧头结构的、且非碰撞类型的自由帧、离散帧等),比例分别为27%和11%,其中正常数据包流量为3%。27%的错误统计值与交换机提示的错误统计值基本一致,但还有11%的错误交换机和路由器等不能识别,需要进行定位。断开路由器,错误指标略有降低。这表明故障确实是在该子网,与WAN链路基本无关。由于子网段全部由集线器堆叠而成(8×16Port),故进一步观察网络测试仪F683指示的全部错误定位数据。仪器提示97个工作站和5个服务器均发出类型为FCS帧校验错误的数据包,数量不等。
   
由于全部工作站均发出FCS帧校验错误帧,所以不认为是所有的工作站网卡都有问题(这种可能性微乎其微),而故障原因很可能是电缆故障(全部电缆打线有误或采用了假冒伪劣电缆)和干扰窜入,如信号干扰、接地干扰、电源干扰、辐射干扰等等(包含在未分类错误类型中)。网管人员认为,由于电缆系统在竣工验收时全部都采用ISO11801标准进行过认证测试,测试工作是网管中心自己承担的,所以应该没有问题。为快速定位故障,采用通常的二分法隔离网段:先将一半的集线器断电,故障依旧,再次将其中一半集线器(即总量的四分之一)断电,故障消失。恢复供电,逐个拔掉该四分之一集线器(两个集线器)上的工作站电缆插头,当拔下6号集线器的7#端口连接的工作站电缆插头时,网络万用表上的错误指示全部消失!网管人员断定,故障为该工作站之网卡的可能性不大,因为所有的网卡昨天为了迎接检查验收都进行过相邻三组网卡的两两互换试验和三台相邻整机的两两换位试验(该中心没有配备其它的网络测试工具,只好采用这种常用的但经常是有效的所谓笨办法”)。用网络测试仪对此故障工作站的网卡进行测试,结果其端口的物理参数和工作协议都正常。由此可以大体断定故障出在工作站的其它部位,且基本是干扰类型的错误(属于未分类帧错误类型),不排除线缆引入过量噪声的可能。拔下网卡一侧的电缆插头,故障消失,说明故障不是由电缆噪声引起。靠近该工作站可以闻到一股虽不是十分明显,但却比其它工作站都强烈的电器烧焦(不过,还远未到令机器冒烟的地步)。贴近机器可以听到开关电源中发出的明显的咝咝响声。测试工作站与服务器的联络情况,可以看到大量的重发帧和无效帧。更换备用的开关电源,故障排除。
 
   [
诊断评点]故障原因比较简单,是由单台工作站开关电源故障产生的放电干扰信号窜到网卡输出端口后进入网络所造成。该干扰信号进入网络后占用大量的网络带宽,破坏其它工作站的数据包(即表现为患者众多的FCS帧校验错误类型的数据包,其比例随各个工作站实际的正常流量而定);同时该干扰信号还干扰服务器、路由器的工作(重发帧、无效帧等),使得地区中心的网管机屏幕上经常有报警状态提示。由于网络总流量为41%左右(低于40%的平均流量时用户基本不会感到网络变慢),有效流量只有3%,所以县级市子网上的用户虽然自己发出的数据包有很多被破坏而需要重发,同时接收到的数据包有很多已被破坏而需要重收,但是基本上不会感到网络速度有明显的变慢!!
 
   [
诊断建议]网管系统通常只能发现约30%~40%的网络故障(这取决与被管理设备支持网管的能力和分析、记录网络异常流量的能力)。当有故障报警后,多数情况下需要进一步迅速确定具体的故障位置和故障属性。本次故障不能精确定位并立即排除的原因是多方面的,其一,县级网由于没有网络维护工具,仅靠网络维护人员的经验和从互联网上下载的某些软件来监测自己的网络,这是直接导致了此次故障长时间无法解决的原因。现阶段,按不同的网络维护规模和级别为相应技术水平的网管人员及运行维护人员配置合适的工具到目前为止一直是让网络规划人员、计划单位和网络维护人员自己都搞不清的事情。其二,本次故障本来原因比较简单,但因维护体制方面存在的问题从而导致在故障查找过程中不能密切配合和协作,使得问题长期未能解决。其实,如何比较全面、有效、快速和低成本地实施网络的管理和维护已经有许多成熟的方案和做法。建议网管人员和运行维护人员在忙于快速建网、不断跟踪网络新技术和接触新设备的同时也要抽出部分精力来研究有关网络维护的理论、方法和成熟的方案,力争达到事半功倍的效果。比如,进行完整的网络文档备案工作、定期测试、网络基准测试、性能监测、体能测试、通道测试、协议监测、流量分析等工作就一直是一些大型网络成功地防止严重事故发生的有效而简便的手段。你知道吗,与你见到的和想象的都不一样,消防队平时更重要的工作并不是救火,而是防火!!网络维护工作亦莫不如是!可以完全相比拟。

   [后记]该地区网对下辖子网后来作了一遍比较全面的认证测试,发现了许多平时无法察觉的故障隐患,现在的网络健康水平应该是最高的。我们最近将应邀对其所属的网络进行一次总体评分,希望能有所突破(10分制,目前最高得分记录为5)

 

[案例二十五]私自运行Proxy发生冲突,服务器响应速度变慢,网虫太勤快
 
   [
症状]某市工商局信息中心今日向网络医院报案,报告其关键的企业数据服务器经常出现阻塞,起因是分布在各地的各个业务受理局、所等的工作人员时常向信息中心抱怨在进行企业数据调用、核查和进行新企业登记操作时经常遇到梗阻,速度变慢或业务出现暂时性的停顿的现象。由于故障现象不是持续存在,虽然检查过多次,也杀过多次,更换速度更快的服务器后情况好转,但未从根本上能解决问题,始终没有找到真正的病根所在。要求帮助查找元凶。走进该工商信息中心崭新明亮的机房,可以看到正面的墙上有一幅巨大的网络结构拓扑示意图,上面非常清楚的标明了各种网上设备和网络设备的型号、名称、位置、速度、链路类型和连接关系等等。初步感觉这样的网络器管理水平应该是不错的。但,经过了解获知,目前实际的网络的结构比较特殊,与拓扑图上的结构有较大区别:用于业务网的大部分机器还设在旧的信息中心机房中,只有企业数据服务器等关键设备安装在新工商大厦的信息中心机房中,且同办公网连通。新大厦和旧信息中心相距约2000,中间通过光缆和路由器连接起来,并在办公网侧设置了防火墙。办公网的多数用户都可以通过WAN链路访问internet国际互联网。信息中心主任对此的解释是:按工程规划的要求,需要把原信息中心机房的全部设备和人员搬迁到新大厦的信息中心机房,但因发现新大厦存在建筑质量问题,两个月前只搬迁了少部分设备和绝大部分的人员。为了不影响业务,在对设备采取临时性的重新布局后即投入了运行。工作状况一直正常。多数业务设备还留在了旧机房中,由2名留守人员负责管理。大约一个月前开始出现故障征兆。该信息中心负责下辖8个工商分局,76个工商所的网络连接和业务保障工作。局和分局之间用帧中继链路连接,工商所和分局之间用DDNISDN连接,少数用拨号方式连接。业务网与办公网之间用防火墙隔离。业务网中的用户除分局的少数用户外按设计要求均不能上互联网。

   [诊断过程]从安装在办公网中的网管系统上观察,企业数据服务器流量为28%,属正常。就近从办公网用网络测试仪F683对服务器进行连通性测试,损失率为0%。这说明至少在此时此刻服务器是工作状态是不错的。用网络助理(网络一点通)对服务器发送10%的流量,观察服务器的使用情况。从数据包交换对话矩阵中发现,服务器对办公网中的用户均有响应,而对原业务网中的用户则有少数几个不响应的记录。由此可以推断故障原因绝大多数可能还在原业务网中。将网络测试仪移动到信息中心旧楼中进行测试,结果如下:网络流量为45(略高),碰撞率为3%,错误率0%,广播7(略高)。总体基本正常。进而观察网络协议的分布状态,基本正常。查看数据包对话矩阵,则发现凡是对企业数据服务器的访问数据包均有部分不响应记录。该记录涉及面很广,几乎40%的工作站均有牵连。为了验证是否是数据链路的问题,进行了ICMP PingICMP Monitor测试,前者报告有两个MAC地址响应,后者则报告记录到大量的目标不可达、重定向、拥塞告警等数据帧。这说明网络的数据链路中有重复的IP地址,而且网络对数据帧的路由运算也存在问题。启动网络测试仪的网段自动搜寻功能,自动查询网络连接结构,结果发现有多余路由解析操作(Proxy),但没有发现重复的IP地址(这说明重复的IP地址不在该网段,而存在于数据访问通道中)。因网管人员没有MAC地址备份文档,故建议将旧楼中的所有本地工作站关机,此时网络立即恢复正常。为确定与服务器重名的工作站,再分批打开所有工作站,结果发现留守人员的2台机器中有1IP地址与企业数据服务器重名。进一步检查该工作站,还发现其私自安装并运行了Proxy代理,与网段搜索的结构一致。

   [诊断评点]故障原因有三。一是IP地址重复,二是运行非法路由代理。当业务网用户要求进一步的地址解析分析时,留守机与数据服务器发生冲突,多数的数据流向发生混乱(注意,此时的数据帧结构仍正常),使用户的访问发生梗阻。应用软件则经常要求重新联络和重传数据,导致流量偏高、业务流程速度变慢。由于冲突基本限制在原信息中心网络中,所以企业数据服务器的流量显示正常!网管系统也无错误数据包报告!原因之三:对留守人员的管理出现真空。留守人员因无聊”(员工自述)而渴望越权连接互联网,并由此开始迅速成为一名白日网虫,进而干扰正常业务流程。由于其操作并不一定持续存在,从而导致问题出现一个多月不能解决。
其实,办公网中的互联网用户也会或多或少地受到影响,只不过因白天用户的使用频率低未曾察觉而已。

   [诊断建议]网络管理的漏洞大多数来自于内部管理人员,建立严格的内部管理机制是非常必要的。同时,建议将MAC地址的备份列入必备文档。另外,每日对网络进行状态自动搜寻会有助于很快发现并清除非法用户。健康的网络维护方案中其实早就有关于定期测试(包括每日测试和每日循环测试)的项目,只要坚持每日必要的测试和检查,就可以保证99.9%的网络不会有超过2天而解决不了的严重网络问题存在。

   [后记]一个月后用户来电告知全部设备已经迁入新居,现在每日坚持定期项目的测试和记录,网络工作状态良好。提心吊胆的日子终于结束,可以松口气了。

[案例二十六]供电质量差,路由器工作不稳定,造成路由漂移和备份路由器拥塞
 
   [
症状]今天的病人是位居某中心城市的一家大区银行,报告的故障现象是:故障时断时续,呈周期性发作,每隔10分钟左右在其辖区内就有部分支行或分行打来电话报告业务流程出现问题。具体表现都很一致:先出现业务中断,1分钟后连接恢复,但速度非常慢。此故障已经持续了2天,网管人员怀疑是路由器故障,曾试着分别更换了备用的同城结算路由器和主路由器,无效。

   [诊断过程]我们驱车来到病人的计算中心,首先向网络管理人员了解故障情况。基本上与网络医院接诊记录报告的内容相同。从表现的故障现象来看,根据以往的经验,基本上可以初步推断是路由链路的问题。网管人员确认,业务中断时,普通Ping测试不通,此现象以前也出现过几次,很快就恢复了。因此也没有引起注意。从记录的故障报告(电话登记)看,无论是本城辖区还是大区内的远程网络都报告过路由中断现象。由于故障每隔10分钟左右就会周期性地出现,虽然比较频繁,却为故障诊断提供了很大方便。可以考虑选择任意路由进行连续的Ping测试,监测其连接状况与故障发生时刻的关系。为此我们将F683网络测试仪接入计算中心网络进行监测。选择曾报告过故障的其下辖的某郊县路由器作连续的ICMP Ping测试,响应时间为9ms,质量尚可。3分钟后,有用户报告故障出现,不过网络测试仪显示正常,说明我们监测的路由链路可能是正常的。立即改变监测方向,向报告遇到故障的用户的路由器做ICMP Monitor,结果大量的目标不可达记录出现,并出现源限制、回应请求和回应响应帧。20秒钟后,出现大量重定向帧记录,目标不可达帧记录速度减缓,源限制、回应请求和回应响应则开始大量出现。以上记录表明,路由器的动态路由表在故障出现时发生了很大变化。网络原来的路由中断后,继之被重定向路由取代。打开静态路由表,为了与动态路由作比较,我们启动F683分段路由追踪功能,追踪从测试仪到先前报告故障的远程路由器。可以看到,路由在本城出口的下一站,即大区链接的第一个路由就发生了中断。动态路由已经由备份路由取代。状态:拥塞。原路由为主路由,通道速率为E1,为ATM链路,备份路由为DDN基本速率链接,速度仅为64Kbps。打开主路由器的Mib库,观测到主路由器的流量为0.02%,错误为2%;表明它处于轻负荷状态,并有少量错误流量。观察备份路由器的Mib库,流量为100%,说明它处于超负荷运行状态。由于故障为周期故障,为了观测它的发生规律,我们在征得病人同意的前提下,决定不急于寻找主路由器中断和拥塞的原因,而是先观测在一个周期里故障变化的全过程并记录之。我们用第二台网络测试仪和网络故障一点通接入网络,分别观察主路由器、备份路由器、主服务器的工作流量和错误,并对主路由器作连续的ICMP 监测。约8分钟后,主路由器流量开始迅速上升,备份路由器出现重定向指示,约15秒后报告备份路由器推出优化路由,动态路由表恢复到与静态路由相同的设置。网络完全恢复正常。分析故障关系,可以断定故障的最大关联设备是主路由器。由于用户在机架上已经安装了冷备份的主路由器,我们先将冷备份路由器替换到主路由器的位置。5分钟后路由器更换完毕,开机接入网络,3分钟后网络恢复正常。但只持续了2分钟,故障现象又重新出现。看来,必须对主路由器做详细监测才能发现真正的故障所在。网络建构拓扑是,主路由器与三个外区远程路由器和一个本地路由器相连,我们可以同时监测这几个路由器的工作状况。监测结果如下:故障出现时,外区主路由器和本城路由器的路由表随着故障的出现也发生变化,而此时同城结算业务不受影响。受影响的业务方向是外地与本城、本城与外地、外地经本地跨区等。用FlukeATM测试仪测试远程ATM路由通道,将远端ATM交换机Loopback(环回)以后监测三个方向的通道情况,显示完全正常。再对与主路由器相关的连接电缆进行测试,全部合格。这表明主路由器的工作环境是基本正常的。此时我们需要了解主路由器链路中的垃圾流量的分布。但由于网络医院的流量分析仪出借给了别的病人,所以我们暂时不能观察主路由器的详细流量状况。实际上,我们这是也只需要检查主路由器的接地质量和供电环境即可(因为已经试验更换过主路由器),这两个因素当中的任何一个不负荷要求,都有可能引发主路由器中断的故障。首先观测为主路由器供电的UPS电源。当故障发生时UPS显示过载,而输出回路却显示轻负荷。用F43电力质量分析仪观察也显示故障时输入谐波超差6倍。输出回路超差400倍,故障恢复后,过载指示也随之消失,但输出回路仍超差80倍。证明UPS电源低效。将主路由器的供电电源接到另一台UPS电源上,故障彻底消失。故障原因为供电质量不合格。我们注意到,该计算中心所在的大楼正在装修,网管人员说等大楼装修完毕后还要将网络设备扩容。初步干扰源很可能就来自与装修有关的部分。由于故障的周期性,经过仔细观察发现,故障出现的周期与楼旁塔吊的上下周期一致!为准确判定谐波干扰的源地点,我们将F43电力质量分析仪接入供电网络进行核实,结果发现,每当塔吊上升时,故障现象就出现(下降时谐波为上升时的三分之一,网络有少许变慢)

   [诊断评点]为主路由器供电的UPS电源由于失效,对外界电力干扰谐波的过滤能力下降,当为重负载的用电设备供电时,此谐波会引发许多设备出错。如果此时恰逢UPS电源滤波失效,则相关设备会受到干扰。本故障中,主路由器由于大量干扰进入,使得链路阻塞,路由器连接中断,路由变更指令使得各业务流量流向备份路由器,备份路由器的路由通道能力又不能满足,致使网络出现拥塞。这就是本次故障先中断后恢复然后阻赛的原因。同城结算数据由于多数不经过主路由器,所以未受到影响。塔吊下降时,虽然引入的干扰也不少,不过因为其干扰的绝对值未超过主路由器的承受范围,所以主路由器还能应付。大楼装修以前也出现过类似的故障,因干扰源很快消失并不再持续存在,因此不可能引起维护人员的注意。

   [诊断建议]与电缆和光缆系统一样,电力谐波和UPS电源也是列入定期检查的内容,一般建议作半年定期检查,关键的网络建议作为周定期检查的项目。谐波干扰是经常存在的环境因素,如果此时UPS电源不出问题,一般不会影响网络的正常运行,但谐波干扰是严重影响网络性能的原因之一,一旦窜入网络则引起的故障多数都是致瘫性或致命性的。还由于多数用户对干扰类型的故障相当地不熟悉,故提请大家引起较多关注。

   [后记]更换UPS后,该网络从此表现优异。让我们感到欣慰的是,定期维护的概念已为病人所接受。在网络医院的帮助下,他们制定了详细的网络健康维护方案,确定了定期维护、视情维护的详细规章。其实,这才是网络医院的工作最有价值的一部分。那就是:未雨绸缪,防患于未然。

[案例二十七]中心DNS服务器主板失常,占用带宽资源并攻击其它子网的服务器

   [症状]病人来电报告网络的一个子网突然变慢,中心主网络则基本正常。以下是病人的主述症状病人是某市电信多媒体网络服务公司(163169),该市为地级市,为本市及市辖县的普通用户提供本地热线网站服务和Internet接入服务。昨天,其服务的用户反映网络速度很慢,Email经常需要等待超过60秒以上的时间才能联通,随即其市营业厅(即子网所在地)报告速度突然变慢,影响业务。病人在主机房安装有网管系统,从网管上观察发现除了营业厅子网路由器流量很高以外(测试为97),中心网络的路由器与其它子网的交互流量均为40%以下。没有其它特别现象,应该说网络速度不会受影响。由于维护人员没有配备其它网络测试工具,又不能在白天断开网络停止用户服务来进行检查。经人介绍遂请网络医院派员帮助检查。

   [诊断过程]这个故障表现比较简单,检查的时候只要查出子网的路由流量来源就可以很快确定故障方向,进一步则立即可以查出流量源。由于用户没有配备分析网络流量的工具,我们估计故障在子网的可能性比较大,所以我们直接驱车驶向子网所在地,即电信营业厅。从网络拓扑图上看,营业厅子网与中心网络的链路为E1,平时作为业务营业厅网络的业务通道。由于营业厅网络一般只用于传输一些业务数据,其子网的网站数量为45台,网管报告97%的流量肯定是过高的。有一种情况可以比较多地占用E1通道的有效流量,那就是营业厅子网有网站与中心网络的网站或服务器之间有多媒体动态图象传输,比如VOD等。这种情况在不少地方发生过,但它要求必须有动态图象源才可以实施点播,中心网络目前不可能提供这种服务(但不排除私自安装的可能性)。营业厅网络由于规模小,中心网络的网管系统只支持到路由器一级的管理。交换机和服务器等采用的是廉价的桌面交换机,所以无法支持网络管理。我们将网络测试仪F683接入交换机进行测试,启动便携网管功能,可以看到路由器的流量和网管系统观测的到的流量是相同的,均为97%左右。查看中心网络处与此相连的路由器流量,也是97%左右。这说明路由器通道链路性能基本正常,不过这样高的通道流量必然导致路由器拥塞和丢包,所以从流量的角度看又是不正常的。现在需要了解的是,如此高的路由流量是从哪里来的?数据包到达路由器以后的去向等。这样就可以很快定位导致如此之高的通道流量的数据源和拥塞源。将FlukeF695网络流量分析仪接入网络的路由器通道进行监测和分析,结果显示95%流量流向了业务数据服务器,且多数为HTTPEmail方面应用(流量分析仪专门分析包括应用层在内的网络上层的协议的应用流量)。其中,Internet访问流量占88%,本地流量占7%。查看流量分析仪指示的流量来源分布图,没有发现集中的流量应用,IP地址分布比较均衡,最高的流量只占0.5%。这些数据表明,用户的应用比例均衡,故障原因应该在应用过程中而不是某个集中的用户轰击,比如黑客等。也就是说,应用的过程和通道出了问题。这是因为,这些流量按通道设计不应该到达营业厅网络的业务服务器。而是应该直接从中心网络的Internet主路由器进入互联网。那么,这些流量是如何被引导到营业厅服务器方向上来的呢?我们知道,IP数据包在传输过程中会在路由器中作地址解析(ARP),或是在本地DNS中进行域名分析。如果这些分析路径出问题,则IP数据包的传输和交换就会出问题。根据流量分析仪的指示,我们任意选择了10IP地址做路由追踪测试,用FlukeF683网络测试仪追踪的结果是,他们都要经过一个DNS服务器。而模仿营业厅网络成员分别对已知的本地和外地用户做ICMP监测和路由追踪测试,结果发现,ICMP监测中重定向数据包占82%,目标不可达数据包数量占13%。这表明,只有约2%的用户能一次性出入正常路由到达目标站点,其余95%的IP数据包都要经过路由竞争或重新发送才能有部分机会到达目的地。由此,可以重点检查主路由器的路由表和DNS的转换表。由于多数Internet访问流量被引导到了营业厅业务服务器,所以可以重点检查DNS服务器。用F683网络测试仪对DNS服务器做查询,观察查询结果,发现DNS转换表有相当大的比例指向了营业厅子网中的业务服务器。怀疑是DNS服务器出了问题。我们随机通知中心网络的网管人员将DNS服务器重新启动并快速设置一次,稍后网络管理人员报告网络业务恢复正常。用F683网络测试仪的Internet工具包查询DNS服务器,可以看到指向营业厅业务服务器的数据已经全部消失。这表明网络已经完全恢复了正常工作。但好景不长,约3分钟后,故障重新出现,仍有97%的通道流量被指向了子网。由于DNS服务器只设置了一台,没有备份或备用服务器。我们不得不立即来到中心网络机房,对DNS服务器及其周围设备进行检查。测试服务器网卡和与路由器的电缆,正常。为了不中断服务,我们请网管人员在另一台备用服务器上临时安装设置了DNS服务器。经过短暂的业务中断后,更换上的新DNS服务器开始投入适用。只见子网路由器的流量立刻降低到了1.5%。经过30分钟的稳定工作后,所有用户均恢复到正常工作状态。

   [诊断评点]DNS服务器用于将用户域名转换为IP地址,一般来说不会出现什么问题。但由于某些原因,转换地址通通指向了营业厅子网的业务服务器。业务服务器不具备路由处理功能,对发送来的IP数据包要么拒收并置之不理,要么返回目标不可达或需要重定向的报告数据包。这就是我们在ICMP监测时经常观察到的现象。该地区城市中心网络的用户数量不多,与省中心网络的链路带宽为155MATM链路,大有富余。所以上Internet的用户其上网速度主要受子网带宽的影响。因为许多的用户要经过拥挤的无效E1链路,造成路由重定向和严重的时延。大量的IP数据包拥向只有2M带宽的子网路由器,流量达到了97%,造成子网工作速度突然变慢,路由器出现严重拥塞等现象。为了确定地址指向的错误原因,我们建议用户抽时间按下列步骤定位故障:首先,将原来的故障DNS服务器的工作平台和应用软件以及网卡驱动程序全部重新安装一遍,然后选择深夜用户数量最少的时候接入网络使用,查看转换表是否正常;其次,如果仍然不正常,则更换网卡,主板等硬件,逐步缩小故障范围。

   [诊断建议]基为了防止DNS服务不稳定造成业务中断或出错,不少网管人员在设置DNS服务器时都安装了备用DNS服务器,亦即安装不只一台DNS服务器。但这样做也会带来一个潜在的危险:即主DNS服务器出问题,备用自动服务器投入运行,这样会牺牲一定的网络带宽,使得系统总体性能有所下降。危险在于,性能的下降常常是在不知不觉中来到的。所以,为了保证网络经常处于良好的工作状态,网络管理人员需要定期检查DNS服务器的转换表。这也是周维护”(即美洲定期维护项目)中建议的内容之一(当然,要保持网络的优良性能不只是检查路由优化性能,还有其它许许多多工作需要做。比如:性能评测、基准测试、通道测试、应用监测、拓扑结果管理、定期维护等等,有关这方面内容读者如感兴趣可参阅《网络测试技术简介》)。本故障中的DNS指向错误导致用户的IP数据包对准了子网服务器,但如果对准的不是服务器而是中心网络本地网段中的某台机器,则故障强度会减弱,用户不会感到非常明显的速度变慢。这样病人可能不会感到明显的身体不适从而使得网络长期带病运行。就象人一样,定期的体检对及时发现疾病及其隐患是非常必要的。而如何及时发现路由优化方面的问题,也是网络定期项目测试中的内容之一,对大型网络则更有必要,必须坚持定期维护和测试。
   
许多网络设备如路由器、交换机、只能集线器等都支持SNMP网管功能,但为了全面监测网络通道功能,还需要网络设备支持全面的RMONRMON2。用这样的设备组建起来的网络其管理和故障诊断功能是很不错的。但现实的问题是,这样的网络设备价格是普通网络设备的610倍左右,用户难以接受。因此,为了随时监测网络的服务应用流量及其比例、来源,工作记录以及必要时进行解包分析,建议用户在重要的服务器通道或路由通道上安装监测接口。以便必要时可以随时将流量分析仪、网络测试仪接入通道进行监测和分析。这样,本故障的查找时间可以缩短到20分钟左右。当然,如果资金允许,也可以将流量分析仪长期接入通道对多个重要的网络设备进行全速率透明流量监测,这样可以把故障定位时间缩短到1分钟以内。

   [后记]第三天,电话回访病人,网络表现一切正常。用户自己已经查明故障设备是原来的DNS服务器的主板。该主板工作不稳定,我们推断该服务器在应用层的数据交换和计算时或与网卡交换数据时出现程序错误。更换另一台DNS服务器的主板后功能恢复正常。病人已将修复的DNS服务器设置为在线工作的备用DNS服务器,以提高网络可靠性。

 

 

 

 

- 作者: 孤独疯子 2006年11月17日, 星期五 10:14  回复(0) |  引用(0) 加入博采

网络故障汇编(三)

[案例十八]六类线作跳线,打线错误造成100M链路高额碰撞,速度缓慢,验收余量达不到合同规定的40
 
   [
症状]周末,某著名系统集成商今日报案,他们为一家银行集成的新大楼在进行网络验收时达不到合同要求的40%余量指标,经多方检查仍原因不明。整个系统采用超五类线布线,系统的其它问题都已全部解决,只剩下服务器验收这一项,报告说明全部不合格。下周三就是工程验收最后期限,如果不能在周二以前解决问题,将影响用户的实际使用。集成商的声誉也将受到不利影响。集成商负责系统集成总包,布线工程由另一家信誉良好的专业布线工程商承担,布线系统全部经过超五类线现场认证测试。集成商负责网络的验收测试系统平台的开通测试。网络验收测试中的一项测试内容是通道性能测试,对包括服务器在内的关键设备进行联通性和通道能力测试。合同要求服务器留出40%的可用余量,测试方法是对服务器加上60%背景流量,然后进行联通速度测试,Ping测试在整个网段内小于2ms为优,下载20M字节的文件小于10秒为优。实际测试时Ping测试值为5ms60%流量背景时下载速度为80秒。主观感觉服务器访问速度缓慢,原因不明。若将背景流量降为15%,测试结果则能达到要求的参数值。要求网络医院帮助查找原因。
 
   [
诊断过程]服务器通道测试速度慢的原因有很多,象网络设置错误,网卡驱动程序版本不匹配,网卡协议邦定不良或有冲突,网络设备如网关、桥、交换机、路由器等设置错误或不良,链路故障或次生垃圾过多,干扰信号进入系统,系统平台设置有误,开发的应用系统程序设计优化度差,平台和终端设备不协调/匹配,服务器和网络的协议不匹配等等等等,我们需要确定具体的故障原因。一般来说,定位故障可以先从联通性和协议匹配性入手比较简单和快速。从工程人员哪里了解到,平台已经安装了三遍,网络设置和网卡驱动程序也调整过多次,鉴于网络Ping测试可以通过,因此他们倾向于故障存在于服务器与网络协议的匹配性不良。我们将网络测试仪接入网络,重复上述测试内容,证明其先前的测试数据基本属实。问题是几乎所有的服务器都出现类似的问题,所以我们必须查找与此相关的公共参数。首先,将服务器从网络上摘下,抽查14台服务中的任意4台,将网络测试仪串入链路进行专家级测试,检测服务器与网络的连接关系和性能。先对其网卡接口用网络测试仪的NIC测试功能进行测试,全部显示正常,然后观察网络的工作参数和工作协议,全部正常。这表明网络和服务器的网络设置、协议设置、物理工作参数、协议匹配性等是基本合格的。但因此时的网络流量是比较低(1%),许多网络性能方面的问题都是在流量比较高的条件下才暴露出来。所以,采用如下方法选中任意一条服务器链路进行测试:用网络测试仪在离服务器最近的交换机端口上对被监测的服务器模拟发送流量,用网络故障一点通或网络万用表监测通道数据。当模拟链路流量曾家至3%时,被选中的链路碰撞指标开始超过5%健康底线,当流量曾至40%,碰撞率达到98%,流量60%时,碰撞率99.8%。很显然,网络的链路性能存在较大问题,对另外4条链路进行同样的测试,结果类似。在交换机紧邻的接口直接对网络故障一点通做上述类似测试,显示正常。这说明链路存在严重问题的可能性极大。与网络设备设置关系不大。询问工程人员,声称布线系统经过了严格的超五类线测试,布线工程商并信誓旦旦地保证链路不会有问题。查看布线系统认证测试报告,BasicLink超五类线认证测试全部通过。服务器是由服务器供应商指定的分销商负责安装调试的,他们当时也在场,自称安装过上百台服务器,也从来没有出现过类似问题。各方似乎都有道理,但链路存在问题是很显然的,所以我们决定对链路重新进行现场认证测试。测试刚才抽查过的链路,结果是全部都不合格,电缆测试仪提示打线错误。且电缆测试仪的HDTDX分析功能启动后定位出近端串扰在整个链路的远端约23长的线段内超差。为分清责任,改对BasicLink测试,水平电缆测试全部通过,这说明布线工程商的施工参数确实是合格的,问题很可能出在服务器安装服务商身上。试着更换服务器链路跳线,故障现象立即消失。随即对全部服务器跳线进行更换,之后对网络重新进行验证测试,参数全部通过。
 
   [
诊断评点]故障是由服务器连接跳线打线错误造成的,我们知道,打线标准中规定了568A568B两种格式,这两种格式原理上是完全等效的,区别仅在线序不同而已。常见的打线错误是被称作串绕的一种,特点是将线序按1-23-45-67-8的自然顺序排列。这样将会造成近端串扰严重超标,一般来说会令服务器无法与网络实现100Mbps的网络连接。本案中由于跳线的线序错误按理应该导致服务器不能上网,但实际的情况确是服务器能上网,只不过碰撞率严重超标而已。由此看来其中必有蹊跷。我们专门对服务器安装商提供的电缆进行测试,近端串扰超差,重新打线后再测试,通过,近端串扰参数的富余量很高。遂怀疑服务器跳线是用六类线制作的,查看电缆标记,确实是朗讯的六类线产品。改用六类线标准专门设计一条六类线BasicLink基本链路进行三接点(串入被测跳线)验证测试,不通过。电缆测试仪故障信息屏幕提示接头不合格,为六类以下器件。重新进行通道性能测试,加载60Ping测试小于1ms20M字节文件拷贝8秒以内全部服务器链路都能完成。
 
   [
诊断建议]服务器安装商误用朗讯的六类线来制作超五类线跳线,使得原本根本不能上网的服务器能够勉强上网,并同时造成其它参数健康指标不合格。一般来讲,采用六类线制作的跳线其性能会优于五类线。所以建议用户可以保留六类线制作的超五类链路跳线,只需将打线顺序改正即可。
 
   [
后记]下周二集成商来电告知,他们最终没有保留原服务器跳线,而是全部更换合格的超五类跳线。集成商由于没有自备电缆测试仪才造成如此被动,为此他们于今天专门配备了一整套布线系统认证测试工具和网络验收测试工具,希望能从此无忧少忧,并且希望能更好地进行网络的性能测试和维护,帮助快速方便地进行网络的验收测试。

[案例十九]六类线工艺要求高,一次验收合格率仅80
 
   [
症状]某著名布线工程商及系统集成商,采用六类线为某市新建的电信大厦布线,点数虽然不多,只有共1,800点,很快就完工,但在验收测试时遇到一些小麻烦:合格率一次性测试通过值只有80%,其余的20%近360条链路不合格。布线商采用的都是某电缆生产商的正规产品,包括全套的电缆和连接模块,其质量在施工前进行过验收,抽查过其中三卷产品,均合格。承担施工的队伍也是有近四年工程经验的下属布线工程公司,曾经有10万条链路的成功施工经验。此次工程项目为第一个六类线试点工程,对公司的布线施工队伍也是一次考验,结果却不尽人意。如果360条链路全部返工,计算下来也是一笔不小的损失。因此公司决定先对剩余的六类线再行进行抽查,以确定是否是产品的问题;然后再安排如何更换或修复这些不合格链路。
   
抽测结果如下,抽测的10卷产品,每卷产品截下90,按90六类线“Basic Link”基本链路连接后进行现场认证测试,结果有7卷产品不合格。由于该工程商同时也是厂商的产品代理尚,厂商的销售代表也无法解释测试结果。接着再进行了第二次抽查,结果10卷产品的90模拟链路仍有6卷不合格,遂请网络医院帮助确认原因。

   [诊断过程]到达现场后计划部分测试不合格的链路,共抽测了20条,结果全部不合格。打开电缆测试仪DSP4000中保存的参数,查看主要不合格的参数有回波损耗“RL”“PSACR”综合衰减串绕比等,比例占80%,其次是“PSELFEXT”综合等效远端串扰、“PSNEXT”综合近端串扰等。对工程商原来抽测过的链路进行复检,结果与上述结果基本一致。仅靠生产商提供的产品证明和合格证书似乎已不足以证明其产品是否满足工程施工现场认证测试的要求。为了确认是否是厂家电缆产品和接插件、连接模块等本身的问题,我们建议布线工程商将他们代理的另外一家电缆生产商供应的产品拿来与本项工程采用的电缆进行对比。对比方法如下:同样制作10条链路,测试条件与上述抽查时的测试条件相同,然后统计测试结果,与前面的测试结果进行对比,以便验证是否是产品本身的问题。一小时后,工程商依此建议制作了两组共20条用另外两家电缆生产商提供的电缆产品加工成的90基本链路,每家10条链路。我们分别对这些链路进行测试,结果如下:链路合格率为A产品80%,B产品70%;且各有20%合格的参数比较靠近测试标准的边缘,一般只有0.5~1.3左右的参数富余量。
   
由此看来,各电缆生产商提供的产品都有相近的合格率,这岂不等于说各电缆生产商提供的产品都有问题?根据逻辑分析只能有以下几种可能:一是产品质量确实有问题,但有问题的比例为何如此一致呢?似乎可能性不大;二是测试仪器或测试环境有问题,比如仪器误差偏差或损坏,测试环境有大量电磁干扰源或干扰信号,但施工现场和试验测试地相距达400,电磁环境相异甚多,且周围没有其它使用特殊电磁设备的邻居和大型用电设备、强功率辐射源等,这条原因似乎也不象;三是施工方法、施工工具和测试的方法有问题,但工程商承担施工人员的都是有至少一年施工经历的员工,且为试验链路打线的人员已经为该公司工作了两年半,技术上应该没有问题。打线工具经过目测检验没有问题,并且工程施工中的打线工具不是刚才试验链路制作时的同一个工具。
   
我们暂时假定产品没有问题,采用另一台自身携带的DSP4000电缆测试仪和工程商自备的同一型号的电缆测试仪进行对比测试,各测试结果一致性相当好,说明测试仪没有问题。为了定位故障位置,使用DSP4000电缆测试仪中的“HDTDX”高精度时域串扰分析功能和“HDTDR”高精度时域反射分析功能进行故障图谱分析,结果发现不合格参数的突出位置都在接插件和连接模块的位置,这说明要么接插件和连接模块有质量问题,要么就是施工工艺存在问题。接下来将不合格链路中的接插件和连接模块重新更换一遍以后进行测试,结果三家产品各自10条链路中有一家全部合格,两家只有一条不合格。将不合格的链路再回炉一次,进行第三次测试,结果全部通过测试。对20%参数靠近边沿的链路认真回炉进行测试,结果全部合格。这说明,接插件和连接模块的施工工艺可能是链路认证测试不合格的重要原因。下一步,为了验证是否是电磁干扰等可能原因,回到工程现场,选取20条原来测试不合格的链路也如法炮制,重新回炉,将接插件和连接模块重新认认真真制作一遍,结果一次重新测试就全部通过!!

   [诊断评点]综合布线的施工工艺看似简单实则要求不低。在三类线的施工过程中,大量的布线商采用临时性的施工人员,经过两小时培训后就上岗工作,工程验收合格率仍比较高。在五类线和超五类的施工过程中,工艺问题开始被工程商重视,但一般不足以形成如此大面积高达20%的链路不合格的严重后果。而在六类线的施工过程中,施工工艺问题被推到了非常重要的位置,在打线和安装时稍有不慎就会使整条链路认证测试不合格,这是工程商始料不及的。其实,诊断具体的故障位置方法很简单,使用电缆测试仪的高精度时域串扰分析技术“HDTDX”和高精度时域反射分析技术“HDTDR”两项故障诊断功能就可以非常方便地显示出故障的实际位置。施工人员可以据此立即采取修复措施,而不会等到认证测试和验收时去丢人现眼”“出洋相了。六类电缆频带由100MHz增加到250MHz,对特性阻抗机器连续性的要求提高了很多,另外对近端串扰、等效远端串扰、衰减串绕比等参数的要求随着频率增加的平方数成正比。上述参数的Power Sum (功率和)参数也被提高到非常严格的程度,表现在施工工艺中比较突出问题就是接插件和连接模块的制作工艺对整条链路的影响变得非常突出。所以严格的施工工艺要求需要引起布线工程商的高度重视,只有这样才能避免造成影响工期的大面积返工和资源的浪费。否则,一次性验收测试一般会停留在80%左右。

   [诊断建议]将不合格的360条链路重新严格制作一遍,并对参数靠近边沿2dB以内的的360条链路也采取同样改进措施,以确保工程品质。另外,施工队伍的严格培训和强调施工工艺的严格性也必须认真对待之。

   [后记]一周后,工程商告知,经过回炉后,1800个链路全部验收合格。除了重新处理不合格的360条链路外,对边沿值的360条链路也进行了重新制作,参数测试富余量全部都在2dB以上,他们准备把这项工程作为该公司的样板工程。

[案例二十] 服务器网卡损坏引起广播风暴

   [症状]今天是周末,某银行向医院求助,其西城区整个网络瘫痪,与电脑中心的联络基本中断,只偶尔有部分交易能达成,但速度很慢,不知何故。由于电脑中心的网管系统也陷于瘫痪状态,无法观察任何网上设备的情况。

   [诊断过程]从火车站匆忙告别家人和朋友直奔该行电脑中心,途中与中心主任继续联络了解情况。系统故障是凌晨4:30左右出现的(4小时前),值班员当时发现网管系统有报警信号,20秒钟后网管机就基本上处于死机状态了,想进一步了解故障,遂将系统重新启动过三次,每次网管机都在20秒钟左右失效,而主服务器和网管机脱机自检均正常。
   
询问各营业所网络内部工作情况,回答正常,只是交易动作无法实现。可以基本断定故障就在中心的计算机系统中。中心除了配置有HP公司的网管软件OpenView外,没有再配备其它任何网络维护工具。所以一旦网管系统不能正常工作,运行维护人员也就无从下手。东城区和西城区的网络主服务器分别在两个不同的网段中,之间用交换器连接起来。全城结算主机与东城区主服务器在同一网段。用F683网络测试仪接入东城区正常工作的网段观察,发现Cisco5500交换机的Plot3Port4(3插槽的第4端口)有异常流量,而该端口连接的正是西城区主服务器和网管系统所在的网段。为更仔细地观察此网段的工作情况,将F683网络测试仪和协议诊断器PI接入该网段,测得网络持续流量为97%,其中错误帧占98%。错误类型为短帧40%,帧常5060字节不等,长帧58%,帧长30005200字节不等,并报告了出错机器的Mac地址。依此地址查找对应的机器,遗憾的是该电脑中心没有Mac地址备份表(只有IP地址和符号名对应表)。试着用ICMPPing查找网管机和服务器,显示Mac地址对应的是服务器的IP地址。重装服务器网卡驱动程序,无效,用F683测试服务器端口,协议显示Unknown,更换服务器网卡,重装驱动程序并设置响应参数,重启系统即恢复正常。

   [诊断评点]服务器网卡已经损坏,发出的数据帧错误率为98%,只有不足1%的数据正常。所以网络偶尔还有交易可以达成。我们知道,超长帧有封闭网络的作用,主要是引起网络速度变慢或网络瘫痪,而短帧达到一定流量则会对网络设备的工作协议造成一定程度的破坏,引起设备死机(实际测试中发现工作站对此更敏感些)。网管机上网时在收到高错误流量帧后约20秒钟即被破坏死机,无法观测参数。
   
许多设备在自检时只检查部分参数(有些参数尤其是某些物理参数无法仅靠自检来测试),此案例中网管机和主服务器自检表现正常,而实际上主服务器的网卡物理功能已经失效,但在自检时与操作系统的通信协议能正常工作,靠1%左右的正常帧可以维持极低的网络活性。其它网站会在高流量错误帧的轰炸中陆续丧生。

   [诊断建议]交换机用来隔离网段和网络故障有较好的作用,主服务器、网管机等重要网络设备应以独享交换机端口为佳,不宜再用共享式集线器连接上其它设备,这样可以迅速孤立出故障设备,减少因网络停运造成的损失。如果恰好遇到交换器故障,那么根据网络拓扑结构图就可以迅速定位交换机的问题,提高维护工作的时效性。另外,Mac地址是文档备案的最重要内容之一,除了用于排除网络设备故障有极大方便外,对于迅速查找我们称之为恶意用户的非合法上网成员也有很大帮助。

[案例二十一]交换机软故障:电路板接触不良

   [症状]今天的病人是某大型证券公司,在全市有近11个营业网络。以下是该公司信息中心工程师对故障现象的描述:一段时间以来,整个网络交易时常中断,有时一天内会出现23次。起初每次持续的时间很短,没有引起我们的足够重视;我们做过简单的测试,约几秒钟至十几秒钟不等,规律性不太明显,一般开市时都正常。随后一段时间病情不断加重,发病频率不断增加。好几个资深用户曾向老总抱怨,近来碰到几次原本估计十拿九稳的网上交易不能及时成交:当我按下交易确认键时,计算机对此却没有任何响应,也不知道成交了没有,只好再等上一会儿。我给伙伴们介绍的绝招是,过半分钟再试,计算机就会显示成交。不是每次都这样灵光,但以前极少遇到这种事,而最近一周已经遇到好几次了,好象一天比一天厉害,搞得我们的神经紧张兮兮的。昨天15:26,临近下午闭市时,故障现象再次出现:行情数据的显示和更新都正常,就是普遍不响应交易命令(但不是绝对不响应,其中仍有少数交易能成交)11个子交易网络均反映受阻。网管人员初步判断是中心网络的问题,立即在电脑科计算中心检查交易服务器,CPU利用率、协议交换及包交换等指示正常,试验重新登录服务器和Ping测试也正常。时间到,转为休市状态。休市后保持交易网络继续运行,启动模拟交易功能模块,进入故障诊断作业程序。在计算中心LAN内连续作了40笔模拟交易均成功。同时在3个子交易网处作对内和对外的模拟交易,对内100%,对外成功率约15%左右。基本上可以肯定故障在网络本身。保持模拟交易连续工作状态,启用计算中心的网管系统查看网络,服务器工作状况指示正常。检查与其它11个营业网络的联系的交换器端口,有流量指示,但时有停顿。对其作Ping测试,偶尔会有中断(约有3Ping测试不响应)。用DSP-100电缆分析仪检查与交换机连接的端口电缆链路(服务器、网管机均在此网段内),没有问题。这说明服务器所在网段是正常的,怀疑是交换机端口损坏。将与服务器网段的电缆改插在别的交换器端口并作相应设置,网络恢复正常工作,故障消失,确认为交换机端口损坏,心想总算可以松一口气了。不料,今日开市后不久故障依旧如期光临

   [诊断过程]晚上19:50我们赶到该证券公司所在地,立即启动系统,自检显示正常。然后启动模拟交易系统,观察与子交易网络的通信情况,表现正常。网络拓扑图上显示各子交易网络是用DDN专线通过路由器与计算中心本地网段的交换器联系起来。打开各Router的工作表Mib检查,无异常和错误记录。逐个检查交换机各端口工作表Mib,亦无异常和错误记录。交易服务器和网管机同在一个网段,通过一个智能型集线器连接到交换机端口。打开集线器工作表,记录数据正常。将F683网络测试仪接入集线器端口进行连续监测。同时启动测试仪流量发送功能,抽查3个子网的通道性能,并做体能测试,持续流量承受能力为98%,说明网络很正常且表现相当优秀。
   
本故障属于软故障。可以由网络设备、应用软件、供电设备、外来干扰等故障引起。由于故障时检查过本地网络,登录服务器和进行Ping测试也是正常的,所以可基本判定集线器下挂网段是正常的。为了定位网络故障,在某个选定的远端子交易网络处和网管中心同时用F683网络测试仪双向发送流量作通道性能测试和故障监测,并作ICMP Ping连续测试和ICMP监测。为便于观察和比较,流量发送的帧长都设定为100字节,流量总和约30(各占15%约10K左右)
   
21:30故障如期出现。ICMP Ping测试出现断层,立即打开交换机和路由器的工作表,记录的流量等数据出现停顿或断续,并显示出现FCS帧错误。从远端打开相应工作表的结果是:路由器接转流量为17%,交换机接转流量为2%,ICMP Ping断层损失90%。ICMP监测显示不可达97%左右。从中心打开路由器和交换机工作表Mibs,接转流量均为0.5~0.9%。这表明远端数据可以顺利到达路由器但不能在交换机端口顺利进行交换。最后用F43电源谐波测试仪测试UPS电源参数,验证UPS电源合格。可以判定确实是交换机的问题。由于网管中心没有备用的交换机,已知原交换机供应商已经停产该型号产品,所以只能考虑更换新型交换机。为了应付明天开市,试着确定一个好的代用端口,这样可以将服务器网段临时连接入网,防止明日开市遇到不测事件发生。查看交换机与路由器一侧的连接端口,发现工作表是正常的。因此只需要代换与服务器连接的端口即可,询问网管工程师上次故障时曾经更换过的是那个端口,答曰第4插槽上的空闲端口都试过。改用第5插槽上仅剩下的一个端口试验连接,网络恢复正常。由于故障时隐时现,故怀疑第4插槽存在软故障。重新将端口还原为第4插槽,故障已经消失。为重复故障现象,试着用改锥木柄敲击第4插槽,故障出现,再次连续敲击,则故障时隐时现。取下第4插槽的电路板观察,发现插针有较厚的氧化层(黑色氧化物)。用0000#细砂纸打磨插针并用酒精清洗,重新安装好电路板,故障彻底消除,并且不再随着敲击电路板而时隐时现。为保险起见,顺便检查其它7个插槽的电路板,插针均没有黑色氧化痕迹,证明只有4号插槽的插针在生产时使用了一组不合格的接插元件。交换机应属于不合格产品。暂时确定用第5号插槽的空余端口作代用端口,并要求网络不停机持续运行直到第二天休市为止,进行连续观察。

   [
诊断评点]网络故障分硬件故障和软件故障,有时是软硬件相结合的故障。某些情况下从网络表现出的故障现象不能立即确定是那一类故障。本故障是由硬件设备接触不良引起的故障,原因是计算中心用作分隔网段的交换机其第4插槽的插针接触不良,使得与交换机第4插槽有关的接口工作都不太正常,出现断续和停顿。设备在刚启动的一段时间内,机器的元器件温度较低,工作正常,随着元器件温度的升高,器件受热膨胀,出现接触不良的故障,所以每天开市后的一段时间网络一般都不出问题。多次重复这一过程故障现象就会由较低频率的时隐时现转为较高频率的时隐时现,故障每此持续时间也会延长,最终可能会演变为持续的硬故障现象(硬故障在故障诊断时反而容易些!)。当网络维护人员作停机检查并更换端口后由于元器件温度降低的关系,网络也会正常工作一段时间。这往往给人一种错觉,以为故障排除了,但第二天开市一段时间后故障又会重新出现。
   
由于本故障的故障点在交换机向中心网络的一侧,所以从计算中心不能准确地观察路由器和交换机的工作情况,这样要从网管系统一侧判断故障是很有困难的。若改由从路由器的另一侧对路由器和交换机的工作状况进行实时监测,就会发现流量不均衡的故障现象,加上ICMP Ping测试的损失率为90%以及ICMP监测结果,定位故障就很容易了。由此确定是交换机的问题。时隐时现的故障我们称作软故障(注意,不是软件故障的含义),可以由软件故障引起,也可以是硬件故障引起,是难度比较高的一类故障。这除了需要网络维护和管理人员具备一定的软硬件故障诊断知识外,对诊断经验的积累也有一定的要求。目前,多数的网络维护和管理人员是由计算机专业的人员来担任,对硬件设备的诊断还比较地不熟悉。

   [诊断建议]如何选择合适的检测工具对故障监测点进行测试是很有讲究的。许多故障需要进行多点测试才能定位,这时非常需要的是便携式的测试工具。网络故障的诊断发展方向是测试工具的网络化和故障诊断的网络化。一般的网络设备和网上设备只支持有限的网管功能,所以监测网络性能和快速定位网络故障需要一些必要的固定测试工具(如固定探头、网管系统等)和移动测试工具(如网络测试仪、流量分析仪等)。对重要的网络设备要准备适当的备用设备,至少要留足备用通道。网络关键设备不一定要选用最昂贵和功能最齐全的设备,但一定要选用应用比较成熟,可靠性高、用户数量大的设备,这样技术支持的难度就会降低。如果将关键网络设备的维护工作交给集成商或厂商来做,那用户就得准备将网络的命运完全交给集成商或厂商来控制,而这是非常危险的。因此对人员进行适当的培训并配备合适的、易懂易用的工具是做好网络维护工作的必要条件之一。尤其对占维护队伍总数90%以上的初级和中级网络维护技术人员和工程人员,这一点更具有实际意义,因为操作复杂、参数难懂难记、培训时间长、价格昂贵的工具对他们来说是豪无实际意义的。

   [后记]以后连续几天工作都正常,新购回的交换机上网试验调通后即投入了使用。原来的交换机被该计算中心作为了备份设备。

- 作者: 孤独疯子 2006年11月17日, 星期五 10:13  回复(0) |  引用(0) 加入博采

网络故障汇编(二)

[案例十一]电梯动力线干扰,占用带宽,整个楼层速度降低

   [症状]某大型家电制造企业计算机中心主任,今天极其沮丧地了报告了该公司的一起顽固的网络故障。该故障表现虽奇特但比较有规律,具体表现是:公司主办公楼的网络在员工上班的时候运行速度会变得很慢,下班后速度回升,有时基本上能回复到往常水平。故障时间大约三个月,准确发病的日期已无从记起。每天上午8:00左右开始发作,症状范围是三楼的整个楼层,现象是速度突然变慢,无论是从互联网上下载文件、收发电子邮件都很慢且经常中断和出错。本楼层中的用户之间在传输文件时、与其它楼层的用户传送文件时或是其它楼层的用户与本楼层的用户交换文件时都要用很长时间,但其它楼层的用户之间互相交换文件则不受影响。第一此发作,故障一直持续了三天我们也没有查明原因。由于三楼是公司设计开发部门,每日都要使用网络环境进行大量的数据交换、资料查询等工作,为了不影响新产品开发进度,当时将研发部的工作时间暂时推迟到下午6:00上班。两周后情况仍未见好转,故障仍然存在。不得以公司决定将研发部与二楼的行政管理部门临时对调,以保证已经开始习惯于上夜班研发部员工正常的作息时间。谁知一临时就是三个月之久。网管人员将布线系统、网络平台、所有主机和服务器、路由器都彻底检查或互换过,一直未能查出故障琐在。听某知名系统集成商介绍可能是电缆系统的问题,随即将布线系统进行了一次认证测试。结果还真的查出了不少严重问题。比如,原来的5类线系统全部不合格,系采用假冒伪劣的5类线,现场测试只能通过三类线指标。为正宗的假货。接插件和模块也大部分不能通过5类线标准测试。进一步对整个大楼的布线进行检查,发现与三楼的情况相同。公司网络基本上还是10Mbps系统,工作一直正常。由于布线工程是三年前做的,现在已经无法联系上当时的系统集成商。公司董事会责成计算机中心将整个布线系统全部更新。经过一个月的紧张施工,工程于前天结束,满心希望通过这次工程能将原有的故障及隐患彻底清理干净,谁曾想,昨天开机调试系统时发现原来的故障依然顽强地存在!虽想尽了办法,面对我们的艰苦努力,第三楼层的网络系统仍无动于衷。计算机中心的全体员工均感倍受打击,且愧于无法向研发部的员工和董事会交差

   [诊断过程]根据以往的统计,越是顽固的故障对网络医院来说往往越可能是最简单的病因引起的。从病人”“主述的情况看,布线系统还存在问题的可能性不大。由于网络的设备都经过多次的检查,发生问题的概率应该是比较低的。如果说是网络有关平台安装、应用软件安装和使用以及路由通道等方面的有问题,那么其它楼层的用户应该有类似的问题。分析故障出现的特点,由于故障出现的时间是上班时间,所以故障原因应该与某些定时工作的设备或工作环境有很大关联性。故障造成整个楼层速度受影响,为公共部分故障的概率较高。根据计算机中心主任介绍,包括其它楼层在内的每台设备都进行过逐个关机筛选检查,每台供电设备都进行过替代检查,所以可以保证设备都是正常且合格的。
   
分析网络的拓扑结构,每个楼层都是用集线器搭建的10Base-T传统网络。各楼层以及邻近大楼的网络用户之间用一台故障前添置的核心交换机连接起来,端口为10Mbps,路由器与核心交换机经过128k帧中继链路与Internet连接,其它分部及分公司则用DDNISDNVPN连接。在计算机中心设有一台网管机,但没有配置其它维护工具。由于故障只影响一个楼层,很可能是在一个碰撞域内的问题。因公司网络与Internet相连,所以我们从网络医院对该公司的网络先简单地做一下远程诊断。启动网络测试仪F683的便携网管功能,由该中心主任输入其公司路由器密码后,查看路由器和交换机的端口管理信息库,结果发现交换机上与三楼连接的接口存在大量碰撞和错误帧记录。数据如下:流量2%,错误为35%,其中CRC错误占83%,传输延迟96%,碰撞10%。中心主任说从网管机上也看到过类似的数据,只是不清楚其含义,也不知道这些数据会与故障诊断有关(网管机从来不用)!我们需要确定这些数据的具体来源,故第二天抵达现场进行测试。
   
将网络测试仪F683接入三楼网络观察,显示网络流量在67%~95之间摆动,错误的流量则在60%~90%之间摆动。其中多数为Ghost错误,占错误流量的77%,其次为碰撞和FCS帧错误,合计占23%。Ghosts错误(幻象干扰)一般指示网络存在严重的干扰。由于干扰比特没有以太网的帧结构特征,在碰撞域内又可以随处游荡,所以这类故障在没有测试工具的条件下一般很难进行诊断。
   
F43电力谐波分析仪测试供电质量,谐波含量指标较大,但未超标,说明电力质量尚可。用场强计测试970MHz以内的空间电场强度,合格。那么干扰信号是从何处进入网络的呢?一般可以用如下方法检查:检查接地系统,检查设备接地,检查周边大型用电设备,检查无线通信环境,采用二分法断电检查串入位置。从故障的特点看,为定期定时故障发生,所以与周边大型用电设备的关系比较大。由于是办公楼,大型用电设备一般以空调、电梯和照明系统等为主,故决定先将电梯、空调等供电系统切断。当切断电梯电源时,故障消失。重新接通电梯电源,故障重现。说明接地或布线系统串如了电梯动力强干扰谐波。检查三楼布线系统,发现一台饮水机的用电电源与布线系统走线槽在一起。立即测试饮水机电源,发现大量高强度干扰谐波,请电工从配电室切断这条电缆,故障消失。

   [诊断评点]故障原因是电梯动力干扰经过新散装的饮水机电源线传递到网络布线系统,致使网络中的干扰比特流量占很大数值,争用网络有效带宽,破坏网络正在传输的有效数据(表现为大量的FCS帧错误),使得网络速度大大下降,网络垃圾骤增。由于电梯在上下班时间一直有人使用,所以网络工作也定期受到严重干扰。下班后,电梯运行频次降低,干扰减少,网络逐步回复到正常运行速度。以下是电工和研发部员工的回忆。
   
原来,为了改善工作环境,公司于三个月前为每个部门和科室配备了冷热饮水机。由于三楼休息室电源插座无电,电工检查后发现该插座的电缆没有与配电盘相连(建筑施工时遗留问题),于是随意将其联线的远端连接到电梯供电动力线的配电盘上为饮水机供电。当时正值炎夏,员工们本来好不开心,心想从此可以随意冷热饮自助,没料想却是从此恶梦不断,网络工作异常,严重影响到了他们的正常工作和生活。
   
没有人记得这条供电电缆与布线系统安装在了同一个线槽内,并与三楼布线系统穿入同一根PVC管内。本来,有一次机会可以解决故障,那就是如果在这次网络更新工程时能严格地按标准化施工,那么这根电源线将会被分开安装,更新后的网络便可能正常运行。另外,由于有多根网线同时受到干扰,所以在采用二分法分割故障区域时只能得出干扰与设备数量有关系这一模糊结论,此非但不能有助于定位真正的故障部位,反而可能将故障诊断工作复杂化。

   [诊断建议]标准化设计、标准化施工、标准化验收(认证测试)是保证网络工程质量的重要手段和方法。其中一条就是要求动力线和计算机网络布线系统必须分开走线。如果采用金属穿管的方法近距离屏蔽,则金属管必须要有良好的接地措施。否则极易获得得不偿失的回报。
 
测试统计显示,现阶段并不是所有动力线谐波含量都很大,多数动力线谐波含量还是很小的。但用电环境的变化趋势是非线性用电设备的用量越来越多,谐波污染也会越来越严重,且呈加速趋势。为了避免后患,还是少存侥幸心理为妙。

   [后记]一周后电话回访用户,得知经过检查,还发现其它楼层的布线系统也存在电缆线与布线系统同槽敷设的情况,该电缆上谐波污染可能比较小,没有造成严重的网络不良反映。现在已经全部更改,并计划对其它相关建筑的布线也进行一次全面检查。

[案例十二]三类线仿冒5类线,加上网卡出错,升级后比升级前速度反而慢
 
   [
症状]病人抱怨他的大多数站点上网连接速度比系统升级前还慢,有的站点时断时续,有的则根本不能上网。原来用的是10M以太网,工作非常稳定,性能优良。升级后全部更换为100M系统,出现上述症状。用户总数未有增加,也没有启用大型软件或多媒体应用软件。重装系统软件、应用软件,重新设置服务器和网站,查杀病毒,Reset所有联网设备均不奏效。其中,有两台机器换到另一地点后能基本正常工作。用笔记本连接到这两个不正常链路的集线器端口上网,也能正常工作。更换这两根网线后现象依旧。将机器还原到原位置,更换网卡(原卡商标为3COM)后恢复正常,不知何故。由于以太网大多数用户不能工作,只好暂时退回到10M以太网系统。
 
   [
诊断过程]10M系统的网管上观察,网络的平均流量为3%,低于40%,由于未运行大型软件和多媒体软件,应该不会感到任何速度上的折扣。将FLUKEF683网络测试仪接入Hub端口,测试网络流量为35%。碰撞率为23%,远远高于5%的健康标准。报告的错误类型有:延迟碰撞、FCS帧错误、少量本地错误。基本可以断定是布线系统的严重问题。遂对线缆进行测试,结果显示除了测试点的两根电缆线外,其余所有布线链路的衰减和近端串扰均不合格,用3类标准测试这些电缆则显示全部合格。查看线缆外包装上印有Lucent Cat5的字样,可以断定是仿冒产品。测试两台工作站的链路长度分别为7886,测试其网卡端口,显示网卡发射能力(信号幅度)不足,并且仪器上没有内置的3COM厂商标记显示。
 
   [
诊断点评]3类线外覆5类线产品标记在假冒伪劣产品中为数不少。用户在10M以太网环境中不会出现应用上的问题,一旦升级到100M环境在只有少数短链路能勉强使用。对于两台更换地点后能正常工作的网站,查明链路长度只有3,且为标准的5类线(平时此站点用于临时测试)。原地点测试长度为4537,由于网卡发射能力弱,信号在100M系统衰减大,造成上网困难。改在3链路连接时,衰减的影响小,故可以正常上网。网卡测试显示为仿冒卡。
 
   [
后记]一个月后,病人打电话告述我,重新布线后网络工作完全正常,即使跑一些多媒体软件也丝毫没有停顿的感觉。不好的消息是,原来的系统集成商已不知去向,无法索赔了。

[案例十三]UPS电源滤波质量下降,接地通路故障,谐波大量涌入系统,导致网络变慢、数据出错
 
 
   [
症状]今天的病人是一家著名的证券公司。上午9:45,用户来电请求紧急救援,说大户室中的一群声称遭受巨额无端损失的愤怒的股民们正聚集在营业部计算中心的机房门前,质问为什么实时交易的动态信息显示屏幕出现大片空白,数据刷新和交易的速度都极慢,且经常中断,根本无法进行交易。扬言如果不立即恢复交易,将砸掉证券交易所的计算机。交易大厅的散户门也开始向机房云集,如果不及时处理,情绪激动的股民们很可能真的会将营业部计算中心的网络设备砸个希巴烂。放下电话直立即直奔该营业部,途中继续用移动电话了解得知,该网络为10M以太网,用户数为230个。从卫星接收广播的行情数据,并回传交易信息。由于从卫星接收机监测口观察接收数据完全正常,故网管人员初步判定是网络系统的问题。两个月前就开始有传输数据错误的现象出现,有时数据更新出现空白,数据更新速度偶尔变慢,有时出现断续。虽用网管和协议分析仪检查过,但因这种症状并不连续出现,且对网络的速度和股民的交易基本没有影响,故一直心存侥幸,没有彻底查找真正的故障根源。前天参加第二轮证券系统Y2K统一认证测试,顺利通过。利用剩余时间对硬件设备进行了检测和维护,之后进行联网检查,网络表现正常。不料今天开市就出现严重问题。
 
   [
诊断过程]F683网络测试仪监测网络30秒,观察网络流量为81(但网管报告为0.2%),错误帧97.6%。错误类型为Ghosts(93)FCS错误(又称CRC错误)Jabber,即幻象干扰、帧校验错误和超长帧,这表明网络中有大量的非法数据包存在。此类症状一般以电磁干扰和接地回路方面的问题居多。为了确定干扰源的准确位置,将大部分与工作站相连的集线器组电源关断,服务器继续工作,观察错误率降为87%,仍然很高。重新打开集线器组电源,用F43电源谐波测试仪观察,发现谐波含量严重超标(最高970mV)。该网络用一台大型UPS电源给所有网络设备供电,测试UPS输入电源谐波,约为输出电源谐波含量的30%,明显低于输出端的指标,断定为内谐波含量超标。启动小型备用UPS后,网络恢复正常工作(为减少负荷,网络设备分批轮换接入),但网络测试仪显示仍有错误存在,错误率(幻象干扰)下降为1.3%。再次关断集线器组的电源,类型为Ghosts的幻象干扰错误率下降为0.8%,证实仍存在由接地回路串入的幻象干扰,且应该是从主通道进入。摇动卫星接收机的数据输出电缆,幻象干扰时有时无,拔下电缆则干扰消失。网管人员回忆前日维护机器时曾动过该电缆。由此造成连接不良。为使股民能继续交易,稳定情绪,在更换电缆后又将原UPS启动继续工作提供服务。收市后再更换大型UPS,故障彻底排除。
 
   [
诊断点评]故障原因有二,一是UPS对电源的净化能力下降,网络外谐波容易从电源系统串入网络系统,为重大故障的发生提供了基础,但只是累积的内谐波超标还不足以引发致命问题。二是接地回路问题,给大量的内谐波串入网络提供了通道。内谐波是指从电源净化设备的输出端比如UPS的输出端测得的谐波功率,由各种用电设备产生(网络设备绝大多数都采用开关电源,本身就是一个较大的谐波源)。本案中,大量的内谐波功率叠加后从卫星接收机数据输出电缆串入交易网络,一方面以幻象干扰的形式侵蚀网络带宽(此时网络测试仪监测到的错误类型即为Ghosts),当以太网的网络总流量高于80%时,会导致绝大多数的网络瘫痪;另一方面,串入的内谐波将干扰正常数据传输(与正常的卫星广播数据叠加,表现为FCS帧错误和少量长帧),使卫星接收机接收到的数据出错,显示屏出现大片空白或不能实时更新数据。本故障为累积故障,两个月前因UPS性能下降就开始出现少量干扰超标,不过这没有引起网管人员的足够重视。前天维护设备后又增加了电缆接地回路的干扰问题。但因当时未将卫星接收机连入网络,网管人员仅检查了网络部分的工作状况,所以此时的网络表现肯定是正常的。直到今天临近股市开市,当接通卫星广播数据的输入通道时,问题才爆发出来。此时内谐波干扰信号大举入侵网络,几乎造成网络瘫痪。
   
关断集线器组电源,内谐波总功率下降,干扰信号强度减弱,错误率自然有所下降。更换UPS电源后,错误率大幅下降(理论上应降为零)。但因接地回路问题使50Hz电源及其高次谐波感应信号仍能进入网络形成较小数量的错误帧。需要注意的一点是,一般人在更换UPS后看到网络恢复正常工作即认为故障已经排除,因此很容易忽视仪器监测指示仍存在的少量错误(1.3),这可能使接地回路问题这一重大故障隐患得以长期存在下去。此故障的诊断网管系统基本上无能为力。
  
   [
建议]电源谐波功率含量和网络错误率要定期测试,当发现错误帧时一定不要掉以轻心。另外,一路电源能带动的工作站建议不要超过30台,否则应象划分网段那样重新划定供电区域。以免内谐波功率累积过大,超过设备的容许范围。如果您的网络可靠性要求很高,或者您的网络对您来说非常重要,那么建议您将主要的网络设备如服务器、路由器等,在网络规划设计时就选择由单独的UPS供电。

[案例十四]光纤链路造侵蚀损坏