APP下载

110维保过程中几种常见问题的处理方式

2017-02-06郭维靖邹积凯

软件 2016年6期
关键词:处理方式系统故障服务平台

郭维靖+邹积凯

摘要:本文总结了第三代110报警服务平台各类子系统故障,及其故障的解决办法,通过对故障的分析,对110系统的整体性能、规划调整以及升级改造提供可靠依据。旨在描述110报警服务平台维护人员处理日常故障的方式。

关键词:服务平台;系统故障;处理方式

1概述

第三代110报警服务平台紧紧依靠天津市公安局第三代110指挥系统进行建设,满足指挥中心日常处置各种突发事件对各种信息、数据、图像等资源的应急处置需要。

天津市公安局110报警服务平台主要涉及排队调度子系统、接处警子系统、网络子系统、综合布线子系统、无线调度子系统、数字录音子系统、LED显示子系统、防病毒子系统、时钟同步子系统等系统。。在后期又陆续建设了手机定位子系统、勤务报备子系统、用户资料三字段查询子系统、短信回访子系统等子系统。

应用的软件有:市局、分局接处警软件、派出所接警软件、有无线集成调度软件、坐席分配软件(Agent)、话务分配软件(CTI)、消息通信软件、通信代理服务程序、话务日志软件、综合接入服务台、综合接人分配台、数字录音软件等组成。

2研究内容及目标

维保对上线前架构、系统、网络、硬件资源规划及随后的质量、效率、成本管理方面都发挥了不可替代的作用。110维保过程中通过对第三代110报警服务平台各类子系统故障及解决办法总结,可对故障的分析,对110系统的整体性能、规划调整以及升级改造提供可靠依据。为110报警服务平台维护人员处理日常故障的方式。

总体目标是在110维保过程中,指导110报警服务平台维护人员可解决处理日常故障。满足指挥中心处理应急事件的需要,可提高指挥中心在应对相应突发事件的处置能力及快速反应能力。

3整体研究思路

运维环境,不论大小复杂度,总会有个系统架构层次。有了这个架构体系,那所有的运维事情大体都围绕着这个系统架构上的每个元素及整体进行运维保障工作。

通过总结相关文献和第三代110报警服务平台各类子系统故障,及其故障的解决办法,对110系统的整体性能、规划调整以及升级改造提供可靠依据。

4故障说明

4.1手机定位系统

4.1.1个别受理台手机定位故障

首先判断是否是大面积受理台均无法定位,如果只是个别受理台出现问题,则重启受理台,观察。

4.1.2大面积受理台手机定位故障

若是大面积受理台出现问题,则可初步判断为非受理台故障,按照如下方法排查:

1)登录“手机定位及短信后置机”服务器,若程序中返回值为空,则重启该服务,重启服务后若程序返回值,(纬度坐标/用户姓名、经度坐标/装机地址、基站地址、基站id)是否为空,如果所有电话号码上述返回值在软件中均显示为空,进行2)中的检查。

2)检查2008机房运营商前置机程序就收数据是否正常,(纬度坐标/用户姓名、经度坐标,装机地址、基站地址、基站id)是否为空,出现异常后重启服务程序。

3)检查运营商网关服务器程序是否正常,若出现无法与运营商服建立连接,则通知相关运营商,此故障为运营商服务端故障。

若1)-3)操作后还是无法定位,则查看是否更改了gis服务器ip地址或者相关链接。

4.2综合接入服务器

4.2.1分局无法接受市局派单

综合接入服务出现“滨海、保税、河北”三个分局任意一个分局无法接受市局派单的情况,问题后解决流程如下:

登录“综合接入”服务器,登陆后观察“天津市公安局指挥中心业务处理台一市局端”软件运行情况,该软件中列出了当前三个有系统分局(保税、河北、津南)连接市局接处警的状态,若软件中“单位名称”所对应的“状态”为“断开”,则该分局无法接受市局派单,解决办法是点击该软件右上角的“x”按钮,关闭该软件,然后点击桌面上的“综合接入有系统分局”重启启动该软件即可。

4.2.2交管局无法接受市局派单

综合接入服务出现“交管局”无法接受市局派单的情况,问题后解决流程如下:

登录“综合接入”服务器,登陆后观察“天津市公安局综合接人服务台”软件运行情况,若软件中“对方台号类型”为“8610”所对应的“状态”为“断开”,则该交管局无法接受市局派单,解决办法是点击该软件右上角的“x”按钮,关闭该软件,然后点击桌面上的“交消互行”重启启动该软件即可。

4.3OGG进程

4.3.1数据库迁移

GoldenGate迁移前后同步示意图如下:

其中,ORA A为原生产库,ORA B为中间库,ORA C为新生产库,新ORA A为ORA C修改IP后的新生产库,也就是业务数据库系统。

·具体实施步骤为:

·数据库准备一套单节点,一套双节点RAC

·安装GoldenGate软件,版本11.2

·配置ogg进程

·ORA B在线冲定义分区表

·数据初始化,进行ORA A到ORA B数据同步(禁用trigger,job,外键)

·验证数据同步情况

·数据初始化,进行ORA B到ORA c数据同步(禁用trigger,job,外键)

·验证数据同步情况

·下线ORA C,修改ORA C为ORA A的IP

·下线ORA B,修改ORA B的OGG配置,同步ORA B至新ORA A库

·生效新ORA A库的trigger,外键,JOB

·启动新ORA A至ORA B的OGG同步

·上线新ORA A,ORA B

·上线业务

4.3.2异常处理一般步骤

如果GoldenGate复制出现异常,可以通过以下步骤尝试解决问题:

1)通过ggsci>view report命令查找ERROR字样,确定错误原因并根据其信息进行排除;

2)通过ggsci>view ggsevt查看告警日志信息;

3)检查两端数据库是否正常运行,网络是否连通;

4)如不能确定错误原因,则可以寻求Oracle技术支持。在寻求技术支持时一般需要提供以下信息:

错误描述、进程报告,位于dirrpt下以大写进程名字开头,以rpt结尾,如进程名叫extsz,则报告名字叫EXTSZ.rpt;

GGS日志ggserr.log,位于GGS主目录下;

丢失数据报告,在复制进程的参数disardfile中定义,一般结尾为dsc;

当前队列,位于dirdat下。

4.3.3 Extract进程常见异常

对于源数据库,抽取进程extxm如果变为abended,则可以通过在ggsei中使用view report命令察看报告,可以通过搜索ERROR快速定位错误。

一般情况下,抽取异常的原因是因为其无法找到对应的归档日志,可以通过到归档日志目录命令行下执行‘ls-lt arch x XXXXX.arc察看该日志是否存在,如不存在则可能的原因是:

1)日志已经被压缩

GoldenGate无法自动解压缩,需要人工解压缩后才能读取。

2)日志已经被删除

如果日志已经被删除,需要进行恢复才能继续复制,请联系本单位DBA执行恢复归档日志操作。

一般需要定期备份归档日志,并清除旧的归档日志。需要保证归档日志在归档目录中保留足够长时间之后,才能被备份和清除。即:定期备份清除若干小时之前的归档,而不是全部归档。保留时间计算如下:某归档文件保留时间≥抽取进程处理完该文件中所有日志所需的时间。

4.3.4 Replicat进程常见异常

对于目标数据库,投递进程repXX如果变为abended,则可以通过在ggsci中使用view report命令察看报告,可以通过搜索ERROR快速定位错误。

复制进程的错误通常为目标数据库错误,比如:

1)数据库临时停机;

2)目标表空间存储空间不够;

3)目标表出现不一致。

可以根据报告查看错误原因,排除后重新启动rep进程即可。

需要注意一点:往往容易忽略UNDO表空间。如果DML语句中包含了大量的update和delete操作,则目标端undo的生成速度会很快,有可能填满UNDO表空间。因此需要经常检查UNDO表空间的大小。

5结语

本文根据维保过程中的实际工作需要,便于理顺和畅通作业流程、故障处理流程、业务流程,最大限度地发挥对天津市公安局110报警服务平台的维保处理作用,建立便于操作、利于提高工作质量和效率的高效运行机制,将维护工作面向客户,贴近客户,使维护管理和设备运行质量有了进一步提高。

猜你喜欢

处理方式系统故障服务平台
密码服务平台
某型水泵旋转系统故障分析
打造一体化汽车服务平台
论基于云的电子政务服务平台构建
基于云计算的民航公共信息服务平台
变电运行设备的维护技术探讨
电动汽车充换电业务涉税问题研究
腹腔镜阑尾切除术阑尾根部的不同处理方式
2015款奔驰R400车预防性安全系统故障
雷克萨斯ES350车空调系统故障2例