一卡通服务器虚拟机常见故障分析
2015-08-19李林娜孟乃杰陶庆宇华北理工大学冀唐学院河北唐山063300
李林娜,孟乃杰,陶庆宇(华北理工大学冀唐学院,河北 唐山 063300)
一卡通服务器虚拟机常见故障分析
李林娜,孟乃杰,陶庆宇
(华北理工大学冀唐学院,河北 唐山 063300)
本文从虚拟机的启动、迁移虚拟机、克隆虚拟机、镜像上传虚拟机和克隆虚拟机等方面分别分析了造成虚拟机故障的原因及解决方案,为一卡通系统的安全稳定提供重要的技术支持。
一卡通;虚拟机;故障分析
校园一卡通服务众多,服务器虚拟机又承担着重要角色,它的运行情况决定了校园一卡通服务的稳定。因此,能够快速判断虚拟机故障并且能够及时解决对于保障一卡通服务安全稳定运行至关重要。这些问题不再是日常遇到的传统问题,具体问题可以归纳为以下几个方面:
1 虚拟机启动失败
虚拟机启动失败在一卡通虚拟机日常运行中最为常见,其主要原因可以归结为以下几点:1)虚拟机存储断开,多为磁盘故障导致。2)虚拟机设置时将磁盘容量设置为存储的可用容量大小。3)虚拟机内存设置过小,无法正常启动。4)在利用镜像模板进行虚拟机安装时,服务器与镜像文件的远程存储断开也会导致启动失败。5)资源池下没有主机时,资源池下的虚拟机启动失败。6)资源池下有主机时,当创建在资源池下的虚拟机启动所需的资源大于任何一台主机所剩余的资源,虚拟机启动时失败。7)CPU兼容性错误,部分虚拟机所在的主机cpu不支持虚拟化功能;8)虚拟机网卡、磁盘等硬件更改后,再恢复到之前硬件状态的快照,导致虚拟机不能使用。9)控制节点修改安全级别,计算节点未重启,安全模式不一致时,计算节点下的虚拟机创建快照,待计算节点重启后,对虚拟机进行恢复快照,虚拟机启动失败。10)服务器的IP的网段被修改。导致虚拟机所使用的网卡“网络”不存在。
对上述的服务器虚拟化的虚拟机不能正常启动,处理方案归结如下:1)查看虚拟机磁盘所使用的存储类型,检查该数据存储的连接状态,并使之连接上。2)磁盘设置容量小于可用容量。3)虚拟机右键点击“编辑虚拟机”,配置界面调整“内存大小”,修改后重置虚拟机。4)删除启动失败的虚拟机,使镜像的存储与服务器连接上,再重新使用镜像模板安装虚拟机,成功后会自动启动。5)资源池下添加主机或移动其他资源池下的主机到该资源池下。6)释放或调整服务器的资源,以达到虚拟机所需的资源大小。7)更换可支持虚拟化的主板cpu。8)将虚拟机恢复到与现在硬件环境相同的快照。9)安全级别不一致时,请勿创建快照。10)编辑该虚拟机的网卡,重新选择一个网络。
2 迁移虚拟机失败
因一卡通服务较多,通常需要进行服务调整,这就避免不了对虚拟机进行迁移,迁移中失败原因可以归结为以下几点:1)源主机和目标主机网络中断或网络不通。2)目标主机故障或被重启。3)源主机和目标主机的cpu类型不兼容。4)源主机和目标主机的BIOS配置项配置不一致,例如“Advanced>Advanced Processor”中的cpu特性列表的配置不一致。5)虚拟机使用的虚拟交换机没有使用任何网卡。6)目标主机没有与该虚拟机所使用的物理网卡同网段的网卡。7)虚拟机磁盘使用的是本地存储。8)目标主机无法连接该虚拟机所正在使用的远端存储。9)控制节点修改安全级别,计算节点未重启,安全模式不一致时,迁移虚拟机失败。
对上述的服务器虚拟化的虚拟机不能正常迁移,处理方案归结如下:1)检查和修复网络。2)修复目标主机的故障,待目标主机启动后再尝试迁移。3)更换迁移的目标主机。4)修改配置为一致。5)更换该虚拟机所使用的虚拟交换机。6)更换该虚拟机所在虚拟交换机所使用的网卡,或者将目标主机中某一网卡设置为该虚拟机所使用的物理网卡同一网段。7)无法迁移,将该虚拟机保存为镜像后,在目标主机下新建虚拟机,使用该镜像安装8)调整网络配置,使目标主机能够连上该远端存储。9)将计算节点服务器重启,使其安全级别一致,再进行迁移。
3 克隆虚拟机失败
当一卡通系统需要增加服务时,通常会进行虚拟机克隆,在克隆的过程中,可能会出现一直显示为“正在克隆”但是进度条却并没有往下进行,造成这种现象的原因主要归为以下几点:1)网络突然中断。2)主机存储、内存、cpu等资源不够。3)虚拟机正在被克隆的磁盘断开。对上述的服务器虚拟化的虚拟机机能正常克隆,处理方案归结如下:1)强制停止被克隆虚拟机,删除失败的克隆虚拟机,再重新克隆。2)释放服务器的相关资源。3)删除未克隆成功的虚拟机,重新克隆。
4 虚拟机镜像上传失败
完成好的虚拟机镜像在上传的过程中有可能会出现失败,关于上传失败的日常现象主要归结以下几点:1)镜像存储空间不足。2)网络中断。3)镜像存储断开4)上传镜像过程中,刷新浏览器。5)由浏览器自身限制,可能因为上传文件过大或者同时上传的文件过多,导致镜像上传失败。
上述的服务器虚拟化的虚拟机镜像上传失败,处理方案归结如下:1)镜像分组下,选择未成功的镜像,右键点击“删除”;修改镜像存储库的位置或调整镜像存储的大小,重新上传。2)检查并修复网络后,重新上传。3)检查存储硬件是否完好,并且网络连接通畅,若一切调整好后,可重新上传镜像。4)重新上传。建议:上传过程中不要刷新浏览器。5)使用其它浏览器上传较大的文件或者等待其它任务完成后再进行上传。
5 虚拟机镜像保存失败
完成好的虚拟机镜像在保存的过程中有可能会出现失败,关于保存失败的日常现象主要归结以下几点:1)镜像存储空间不足;2)网络中断;3)镜像存储断开。4)镜像库空间不足。
上述的服务器虚拟化的虚拟机镜像保存失败,处理方案归结如下:1)在服务器“虚拟机”列表,强行关闭“保存为镜像”的虚拟机,镜像分组下删除“正在保存”的镜像,修改镜像存储库的位置或调整镜像存储的大小,重新保存镜像。2)检查并修复网络后,重新保存镜像。3)检查存储硬件是否完好,并且网络连接通畅,若一切调整好后,可重新保存镜像。4)更改镜像库存储,或调整镜像库空间大小。
[1]杜睿.基于IP-SAN技术的石化企业数据集中存储系统的设计与实现[D].上海:华东理工大学硕士论文,2010.
[2]姚军光.基于VMware的服务器虚拟架构设计[J].科技视界, 2012(15):174-175.
[3]罗毅.宜宾移动IT支撑系统设计研究[D].成都:电子科技大学硕士论文,2011.