服务器响应异常慢之谜
2021-01-06山东张艳霞樊培彩
■ 山东 张艳霞 樊培彩
编者按:笔者在处理服务器内存故障中遇到服务器响应异常慢的现象,经分析后发现是由于服务器内存插法顺序错误导致的。
笔者有一台2013 年购置的HP DL388eGEN8服务器,为双CPU配置。近期该服务器出现内存报警,提示内存故障。
该机器上本来有4 条4 GB 内存,笔者因不确定哪一条内存故障,故顺手拔掉了其中两条内存,机器能识别剩余8 GB 内存,也能正常启动。而启动后,内存利用率不高,CPU 利用率却居高不下,基本上是大于80%,经常是100%。机器响应异常缓慢,system 进程过高占用CPU,大于50%。运行Ping 命令时明显响应慢。该设备作为Ping 的目标机,响应异常慢。笔者在处理这个问题时,颇费了一番周折。
开始笔者怀疑机器中病毒了,通过升级杀毒软件,系统打补丁,但故障依旧,并未发现中病毒的迹象。无意中笔者看到了服务器内存插槽图,终于明白了服务器异常慢的根本原因。内存插槽图如图1 所示。
Intel xeon 5500 系列处理器集成3 个内存控制器,内存子系统划分为通道channels,每个控制器控制一个通道(channel),组成3通道内存,每个处理器支持3个channel,每个channel 支持2 个内存。对内存的插法也有很多种情况,根据不同的插法可以达到性能和安全不同的效果。在多处理器配置的机型中,为达到最大化性能的目的,应尽可能均匀地分配所有处理器对应的内存总容量。内存条的配置:插法按照“ABCDEF”配置。
图1 内存插槽图
笔者拔掉的2 条内存,正好位于P2 这个CPU 旁边,导致P2 边上没有内存。
这才是造成服务器异常缓慢的根本原因。
因此,笔者通过拔出故障内存,在P2 处理器旁边A插槽插入正常内存,服务器内存从4 条4 GB 减为3 条4 GB,最终恢复正常。