APP下载

大数据技术在医院信息系统安全中应用的可行性分析

2020-06-07卿立银季瑞齐彭洪伟孙佳雯

电脑知识与技术 2020年35期
关键词:数据源探针信息系统

卿立银 季瑞齐 彭洪伟 孙佳雯

摘要:医院信息系统由有线网络、无线网络、传统数据终端、智能数据终端、基于微型工业控制系统的精密医疗设备组成。规模仅限于医院内部,并不庞大,但成分却很复杂,符合大数据技术多数据源、多数据渠道、多数据类型的构造特点,可以作为大数据技术的实验平台,推广使用。医院信息系统安全属于新兴热点,适合作为切入层,切入大数据技术。切入分为数据选择、数据采集,数据传输和数据分析四个切入点,其中重点和难点是数据采集技术,即探针程序的开发,要根据不同的平台选择不同的开发语言。

关键词:大数据技术;医院信息系统;信息安全;数据源;数据渠道;数据类型;探针程序;数据分析

中图分类号: TP311        文献标识码:A

文章编号:1009-3044(2020)35-0025-02

开放科学(资源服务)标识码(OSID):

1 因为构造的特殊性,大数据技术理论研究多,生产实践少

大数据技术作为新兴的计算机技术,近些年来受到广泛的关注,网络安全等级保护2.0标准甚至为大数据技术订制一套安全指标。但是,该技术仅仅少量投入生产实践,至今仍然以理论研究为主。究其原因,乃是因为该项技术的特殊性。大数据技术不单强调数据量大,更多的是强调数据多样化,尤其是在海量数据基础之上的数据多样化。数据多样化和数据量庞大,是大数据技术的两个基石,缺一不可。如图1所示。

从内部构成而言,大数据技术又称“三多一分析技术”。三多指的是多数据源、多数据渠道、多数据类型,一分析指的是统一的分析模型。如图2所示。

对类似图书馆藏书管理系统这样的中小型信息系统而言,数据源、数据渠道、数据格式都相对单一,数据量较小,不能形成海量数据,缺乏构成大数据分析技术的基础条件。而对于银行核心信息系统这样的大型信息系统而言,数据源、数据渠道、数据格式多样,每日有几亿甚至更多的交易量,具备构成大数据分析的基础条件。但是其核心骨干网络利用率高达80%以上,通信压力过大,不能为大数据技术提供足够的网络带宽,需要开辟专门的通信网络。数据分析模型复杂,运算负荷重,要求配备大量高端服务器才能实现。这要求银行投入大量财力构建基础设施,并配备专业的团队。考虑到成本,银行高层管理人员容易产生抵触情绪。大数据分析技术呈现“高不成低不就”的尴尬局面。目前,除了淘宝、京东等电商平台利用大数据技术分析客户的购物心理外,在其他信息领域上,大数据技术仍然处在理论研究,未投入实践。

2 医院信息领域是大数据技术的良好推广平台之一

为了加快信息化速度,推进大数据技术投入生产实践,笔者结合十几年医院信息系统安全经验,提出在医院信息系统当中推广大数据技术的方法。强调一点,医院信息系统具备推广大数据技术的天然条件。第一,医院信息系统包含有线通信设备、无线通信设备、传统数据终端、智能数据终端、基于微型工業控制系统的精密医疗设备等各式各样的设备,具备多样的数据源。第二,医院信息系统具备无线网、有线网、内网、专网、互联网等多种通信渠道,具备丰富的数据传输网络。第三,医院信息系统存储病人基本信息、病理病例信息、医药信息、医疗设备信息、财务信息、后勤保障信息等多样的数据类型。第四,医院信息系统的覆盖面较小,仅限于医院内部,覆盖面小,则通信压力小,可以为大数据技术划分出专门的通信带宽,用以传输数据。即使通信带宽不足,也可以购买少量通信设备,紧急扩充,以满足需要。

综上所述,医院信息系统,具备推广大数据技术的天然的、相对优良的条件,是大数据技术推广的理想平台之一。

3 推广关键——探针程序的开发

根据前文陈述,或者从图3可以看到,医院信息系统的覆盖面仅限于医院内部,数据传输方面压力不大,不是实现瓶颈。实现瓶颈主要来自数据采集,数据采集又称为数据探针或者探针技术。如何在数据终端中准确无误地安插探针,采集到完整真实的数据,是大数据技术实现的关键之一。

探针是部署在硬件平台上的一段可执行程序,需要做专门的程序开发。站在探针程序开发的角度,将数据终端分为通用操作系统终端和非通用操作系统终端。PC终端、手机等智能终端、自助服务终端等数据终端,统称为通用操作系统终端。通用操作系统终端采用的是Windows、Linux等主流操作系统。这些操作系统具备公开的标准的程序开发接口,英文名称为Application Programming Interface,即API。开发人员可以通过官方API文档,在操作系统层面调用程序接口,采集数据,并通过网络传输接口将数据放置在网络中传输。高压氧舱、生化分析仪、气管镜、内窥镜等智能医疗设备,在性质上属于微型工业控制系统,称为非通用操作系统终端。非通用操作系统终端,不对外开放开发接口,没有API可以调用。但是这些终端会通过某一种方式,将数据导出到某一台PC终端。我们可以将该PC终端作为探针程序的开发对象,调用相应官方API,采集数据并传输。探针数据流向图,如图4所示。

探针程序所采用的开发语言要根据具体的情况确定。如果数据终端是浏览器,开发语言采用JavaScript;数据终端是安卓手机App,开发语言采用Java;数据终端是Windows系列终端,开发语言优先采用C#。开发语言的选择没有硬性指标,要根据实际情况选择适合的语言。

4 最终成果——基于大数据技术的医院信息系统安全管理中心

功能、性能、安全是信息系统的构成三要素。其中安全是当今热点和难点,同时又是相对空白点。将大数据技术应用到医院信息系统安全领域,符合当今形势。前文中论述数据采集即探针技术和数据渠道的实现方法,下面讨论大数据技术的另外两个方面、数据选择和数据分析模型。这两方面内容不必从头做起,因为目前有非常好的模型可以借鉴,即网络安全等级保护2.0标准(以下简称等保2.0)。数据采集的对象,完全可以全盘借鉴等保2.0的网络结构、安全计算环境、安全区域边界等测评对象,针对这些测评对象,从身份鉴别、访问控制、安全审计、入侵防范、数据备份等安全角度抽取原始安全数据,这样操作简单高效。 数据分析模型的关键是全网唯一标识符和时间戳。全网唯一标识符可以对每一个安全对象进行标识和有效定位。时间戳标记安全事件发生的时间。标识符和时间戳联合起来,就可以对安全事件进行二维锁定。因为医院信息系统本身规模较小,同时相比银行、电信、电力、航空等领域信息系统,不容易引起国家级黑客组织的注意,安全压力不大。所以数据分析模型没必要太复杂,仅将全网唯一标识符和时间戳关联起来,针对勒索病毒、DDOS进攻等主流的安全威胁分析确认一下,就足够了。

在上述论述过程中,忽视了一个细节,就是信息格式变换,采集上来的数据,可能是视频、音频、图片或其他各种各样格式的数据。要将不同格式的数据转换成统一的数字或文字格式,需要做专门的数据提取。这种提取技术属于成熟的技术,请感兴趣的读者查阅相关资料,在此不赘述。

5 理论诞生于实践,理论还要回归实践

大数据理论是非常优秀的理论,是信息技术集大成之作。但不论多么优秀的理论,如果不能付诸实践,也只是水中月,镜中花,黄粱一梦而已。广大科研人员不仅要关注理论创新,同时更要关注理论实现,要将理论融入生产实践,用理论去指导生产实践,这样才能真正促进科技发展和人类进步。

参考文献:

[1] 冯丽.大数据技术解析及其安全建设研究[J].电脑知识与技术,2019,15(25):13-14.

[2] 张杰宏.医院信息系统安全现状及缺陷[J].电脑知识与技术,2019,15(25):15-17.

[3] 冯丽,王彩学,张杰宏,等.基于大数据分析技术的商业银行信息系统安全预警实施方案[J].电脑知识与技术,2020,16(23):52-53.

【通联编辑:唐一东】

猜你喜欢

数据源探针信息系统
企业信息系统安全防护
基于区块链的通航维护信息系统研究
Web 大数据系统数据源选择*
信息系统审计中计算机审计的应用
基于不同网络数据源的期刊评价研究
多通道Taqman-探针荧光定量PCR鉴定MRSA方法的建立
基于SG-I6000的信息系统运检自动化诊断实践
BOPIM-dma作为BSA Site Ⅰ特异性探针的研究及其应用
基于真值发现的冲突数据源质量评价算法
透射电子显微镜中的扫描探针装置