高校计算机实验室机房的硬件设备维护
2020-02-03王光烨
王光烨
(山西管理职业学院 山西省临汾市 041051)
随着高校教育的不断发展,计算机实验室不再仅仅承担计算机课程的实验教学任务。计算机实验室的作用正在逐步增多。除了进行计算机课程的实验教学外,还负责进行课程的设计。计算机课程以外教育目标的实现,需要软件的协助,以及负责多种质量考试和多种技能竞赛的任务,导致计算机实验室中的计算机使用紧张。此外,计算机机房中还存在许多不确定因素:灰尘、室温和湿度、电压不稳定等现象。因此,计算机机房中的计算机硬件进行维护十分重要[1]。
1 硬件维护的基本原则及方法
如果计算机出现故障要遵循先软后硬、先外后内、先简后繁、先大后小的原则,通过直接观察法、简单插拔法、逐一插拔法、替换法、内存交换法的步骤进行故障排除[2]。
2 硬件维修的基本步骤
2.1 观察故障
在启动或操作过程中,请仔细观察微机故障现象。假如在计算机可以进行继续加操作的状况下,可以通过进行重复操作并对相似故障进行详细分析,从不同之出来进行故障的分析,以便可以准确的进行故障类型分辨。
2.2 进行一般检查
2.2.1 系统硬件安装检查
先查看电源是处于正常连接的状态,电源电压伏数是不是适用于设备使用,然后是外在部件与主机、键盘、显示器是否正常连接,接头是否完好[3]。
2.2.2 监察系统CMOS 的Setup 设置
在系统可以正常显示时进入CMOS 的Setup 对系统设置进行检查,看其是否正确,主要是对硬盘参数的检测、软盘驱动器参数和引导顺序以及软驱交换等参数。假如对硬盘参数的正确性无法做到准确判断,将硬盘参数进行重新制定,比如用CMOS 中硬盘自动检测程序进行操作。
2.2.3 对计算机病毒进行检查
在系统可以进行软盘操作时,对计算机是否存在病毒的检测,利用杀病毒软件进行,比如在遇到硬盘引导故障或者是打印机故障时,就可以采用查病毒软件进行病毒查杀[4]。
2.3 故障部件的查找
想要对故障类型作出准确的辨别,之后对计算机进行基础的检查,例如;相关组件的连接和设置问题等,进行逐一排除,排除计算机病毒的影响,并结合上述故障诊断方式找到导致故障的原因并进行排除。
2.4 进行故障处理
处理故障部件。
3 硬件的故障分析及维护方法
计算机的硬件部分经常有许多而复杂的故障出现。最常见的就是黑屏、开机没反应或者反复死机等情况,这都是由于硬件故障而造成的。涉及到主机所有组件包括主板故障,显卡故障和硬盘故障等。下面是针对主板诊断卡、硬盘等硬件的故障及诊断方法做出的分析。
3.1 主板诊断卡的故障诊断
主板诊断卡是在设备开机状态下出现无显示故障时进行,例如出现自检硬件错误,扬声器发出滴滴声,屏幕不能正常显示等。其诊断方法如表1所示。
3.2 诊断处理硬盘存在的故障
下面是对硬盘故障的分析与一般的处理步骤如表2所示。
3.3 内存故障处理方法
内存是计算机的内存组件,用来对计算机临时处理的数据和程序进行存储。内存如果出现故障会直接影响计算机运行以及程序的应用。比如不能玩大型游戏,除了显卡出现故障再就是内存出现故障的表现。下面讲了智能故障处理方法原理及实现。
3.3.1 智能处理方案的应用场景
可以根据重复出现的故障将一致的外观,规则的出现和外观转换为特定的业务或系统指标。根据这些指标,可以提供各种故障的解决方案,因此,当发生故障时,可以自动进行智能判断和处理。
3.3.2 模块说明
内存数据库错误处理解决方案主要分为五个模块:事件监视(错误监视),阈值设置,智能判断,错误管理和及时警告。
(1)事件监控。事件监控(即故障监视)将各种独立的故障现象以事件的形式进行监视,利用各种算法对业务和系统操作信息进行统计分析并将其转换为能够进行识别的指标。
(2)阈值设置。该模块主要基于从事件监视转换得到的指标信息,根据故障和过去累积的知识库以及预定义的指标阈值,为智能判断模块进行处理做出引导。并且可以根据实际情况对该阈值进行调整。
(3)智能判断。智能判断模块将从事件监控模块获得的指标信息与阈值调整模块设置的阈值进行比较,并根据比较结果选择不同的错误处理过程。
(4)故障处理。故障处理模块是利用智能对模块执行和故障处理相关的程序进行判断,并根据特定的故障和处理程序创建这些程序。
(5)实时预警。实时警报模块是实时显示和通知整个智能处理进行过程的相关信息的模块。它主要用于给相关人员发送信息,比如发送故障发生,智能处理过程信息和结果信息。便于相关处理人员监视故障处理过程。
3.3.3 智能处理方案的具体流程
以TimesTen 内存数据库执行的实时计费系统中的错误为例。这种情况是由于数据库统计信息异常而导致的错误。基于实时计费系统的业务性质,当存储器数据库中的统计信息与业务表中的实际数据量之间的差异大于30%时,会发生异常,这将导致业务系统发生故障。这种情况分为2 个事件:CPU 使用率和离线话单率。
表1:主板诊断卡的故障诊断
表2:硬盘故障的分析与处理步骤
(1)分析和总结故障现象,然后转向事件监视。
(2)预设事件发生的失败阈值,对其进行优化,然后根据后续的业务运营进行相应调整。
根据当前发生的事件,预定义的错误阈值有两种:一种是处理器利用率预设为百分之八十。业务正常运行时,CPU 利用率低于百分之八十。另一种是离线计费率预设为百分之十。在正常的业务活动过程中,离线计费率低于百分之十。
(3)根据事件错误的出现执行首次智能处理。假如CPU 使用率或脱机计费率超过预定义的阈值,在没有进行其他任何系统更改的状况下,则可以将其设定为中间临时表,对不准引发故障进行统计收集。即可对中间临时表的统计信息进行统计。中间临时表中的数据通常不高于三十万行,因此所需的运行时间相对短,通常可以将时间控制在五分钟内。
(4)进行了首次处理,在完成五分钟以后,对CPU 使用率和离线话单率进行重复统计分析。
(5)由于第一次处理仅完成中间临时表上的统计信息收集,因此不得不考虑业务突然修改其他非临时表中的许多数据。所以,即便在第一次处理没能将故障解决,此时也必须及时收集整个数据库数据以进行第二次智能处理。整个数据库的统计信息收集通常在不到30 分钟的时间就可以完成,但是对于实时计费系统讲,30 分钟的处理时间是不能接受的。因此,应立即向操作和维护人员发出警报,以同步处理并减少故障排除时间。
(6)假如即便在完成整个数据库的统计信息收集后仍未解决该故障,则可以确定该故障是由其他原因造成的,应该专业维护人员进行处理,此时,警报需要再次响起,警报级别应增加。
4 结束语
随着科学技术的不断发展与进步,计算机面临着各种各样的故障问题,只有持续的进行探索与实践,从而得到经验才可以更好的对计算机软硬件进行维护。