联机分析处理技术在生物医学领域的发展
2019-02-28张志琪
张志琪
嘉兴市第二医院 (浙江嘉兴 314001)
联机分析处理(on-line analysis progressing, OLAP)和数据仓库(data warehouse,DW)是两种典型的决策支持技术。OLAP是最近发展的数据库系统的一种重要应用[1]。它是共享多维信息、针对特定问题的联机数据访问和分析的快速软件技术。DW是面向主题的、集成的、时变的、非易失的数据集合[2]。DW是一种数据管理技术,为决策分析提供有效的数据支持;而OLAP侧重于DW中的数据分析,为制定决策提供信息支持[3]。OLAP模型建立在DW之上,与从大量的数据中提取或者挖掘知识密不可分。这就需要应用数据挖掘(data mining,DM)技术,它是建立在DW之上,从大量的、不完全的、模糊的、随机的实际数据中提取隐含在其中的潜在有用信息和知识的技术。
OLAP包含一些基本的术语:变量、维(dimension)、维的层次(level)、维的成员(member)、指标、度量(measure)、粒度;也包括一些基本多维分析操作:切片(slice)、切块(dice)、钻取(drill-up,drill-down)、聚合和旋转(pivot)等,用以对数据进行多维多角度分析,找出数据中蕴含的价值。OLAP的特点是仿造用户的多角度思考方式,提前建立多维数据模型,它使得用户可方便快速灵活地在各个数据角度之间获取或者综合分析数据,因此该技术才得以广泛的研究。
1 OLAP技术的历史背景
20世纪60年代末,关系型数据库之父E.F.Codd提出了关系模型,促进了关系数据库与联机事务处理(on-line transaction processing,OLTP)的发展[4]。OLTP一般以快速的事务响应和频繁的数据修改为特征,每次事务仅仅对少量的记录进行操作,复杂的表连接一般不会影响系统的查询性能[5],如铁路售票系统和自动存款机。但当数据库技术逐渐广泛的应用于社会的各个层面,导致膨胀的大数据时代到来,数据量产生了巨大的飞跃,到现在的TB,甚至PB级别,出现了各种各样的数据库组织形式,人们对数据分析处理的需求已经逐渐的丰富并且变得多样化、复杂化。传统的OLTP已经不能满足终端用户、管理决策人员从如此庞大的数据量中查询、分析并提取有用知识的要求。因此人们开始试着对基于OLTP的数据库进行改革,以得到一个更好的决策支持系统。于是,E.F.Codd在1993年提出OLAP的概念,OLAP是一种分析人员、管理人员或执行人员可从多种角度提取原始数据中转化出来的、能够真正为用户所理解的、真实反映企业特性的信息,并可进行快速、一致、交互地存取,从而获得对数据的更深入了解的软件技术[6]。
2 OLAP技术在生物医学工程领域的应用与发展趋势
DM和OLAP相结合用于医疗卫生领域已经成为时下的研究热点。目前OLAP及DM技术在医院医疗管理领域主要在分析不同病种发病趋势、影响因素、治疗方法为临床专家提供决策支持以及通过对历史数据的分析找出某种规律为决策者提供决策支持这两个方面有着较为综合的应用。随着我国医疗卫生事业的不断数字化、信息化,OLAP技术将会不断地拓宽其在医疗卫生行业的应用领域。
将DW、OLAP以及DM联合起来进行数据分析,形成基于DM的OLAP,可以凸显OLAP独特的优势。目前在生物医学领域OLAP主要有以下几个应用。
2.1 医院经营管理及医院费用管理
医院的经营管理是指对医院运营过程的计划、组织、实施和控制,是帮助医院对财务、人力、物品进行的管理,在医院的运作过程中尤其重要。王萤和徐琛[7]采用SAP BW数据抽取机制采集医院财务信息数据,对DW进行建模,利用OLAP和DM技术对其进行整合并进行多维度分析,采用分组序号聚焦算法,大幅缩短了医院财务分析系统的查询时间,提高了查询效率,更好地将权威性的数据提供给领导层以供其决策。在医院的费用管理方面,曹淑真[8]讨论了单种病费用分析,提出了基于医院数据库中利用OLAP技术的基本操作,以记录较为完整的单纯性阑尾炎为例,对单病种费用进行多维度、多角度的分析和探索,并挖掘出患者社会特征、疾病特征与费用构成等因素对医疗费用的影响模式,进而为改进单病种分级付费制度提供依据,并对比了OLAP和DM在分析医院信息系统数据库中数据的异同点。得出了OLAP和DM相互补充结合,从而提供更加完善的决策支持的观点。此外,将DM技术和OLAP技术相结合,融入医院管理信息系统(hospital information system,HIS)[9],以提供高效的管理;以DW技术为主结合OLAP技术和DM技术构建的商业智能的医院决策支持系统(intelligence decision supporting system,IDSS)为医院管理层提供有效的决策支持[10]。这些都展现了OLAP技术在医院经营管理及医院费用管理领域的广泛应用。
2.2 医疗信息以及医疗耗材管理
随着医院HIS系统运作时间的积累,传统的医院数据库中累积了大量的医疗信息,而这些信息通常没有被很好地利用,因此如何利用好这些信息就显得尤为重要。李斌[11]提出了一种新型的基于C/S+B/S架构的医疗资源管理决策支持系统,该系统由医疗资源DW、DM模块、联机分析模块和规划生成系统4部分构成,可为决策部门提供充分的决策信息以及最优化方案,减少决策失误,改善城市卫生管理。
医用耗材是医院在医疗过程中所消耗的配件类材料及产品,主要包括耗材和医用器械。随着我国医疗改革的不断推进,以及高价值的医疗器械逐渐推广,传统的药品消耗量所占的比例在不断下降,而医用耗材的使用量却在逐步提升。因此医用耗材的管理、数据分析以及知识挖掘就显得更加重要。有研究利用Microsoft SQL Server Analysis Service中的OLAP与多维分析技术对医院HIS系统及物资系统进行整合集成,对医用耗材使用和患者身份之间的关系、医用耗材使用的时间趋势以及科室医用耗材使用分析等主题,实现了多维分析展现[7]。从而使得用户可以快速得到耗材的统计报表,方便从多维度观察耗材的使用情况,准确地展现耗材的使用规律以及时间趋势,科学地购置耗材。
2.3 疾病诊断
无论是在西医还是中医的病案系统,OLAP都有其应用价值。陈涛[12]开发了中医病案OLAP系统软件,其特点是针对中医病案的脉象、舌象、病证等相互关系研究的实际应用需求,采用三层B/S模式,基于互联网技术,利用OLAP工具对其所构建的当代名医舌脉诊医案进行统计分析,并对舌脉诊医案进行大样本数据分析处理,实现了涉及舌脉诊的中医病案管理系统。它将病案存档管理以供医院研究,为中医临床诊断提供参考并有助于科研教学工作,将中医医案进一步推向现代化。同样OLAP也可以用于医疗和疾病预警系统中,于彦哲[13]针对高校教育工作者和在校大学生提出了高校医院管理及疾病预警系统,对这两类人群的健康统计数据进行OLAP分析,从而统计亚健康状态人员,进而有效减少其数量。还有研究者对于腰椎神经根损害患者的临床相关数据进行OLAP分析,将大宗的腰椎神经根损伤患者的临床资料进行数据处理与分析,对于指导临床手术方案、指导治疗、准确判断预后、提高疾病治疗预防水平有着重要的意义[14],体现了OLAP在疾病诊断领域的先进性和应用价值。
3 OLAP技术在生物医学领域的发展趋势
OLAP技术在生物医学领域的发展目标主要是将联机分析和DM集中到一起,主要表现在:从OLAP到联机分析挖掘(OLAM/OLAP挖掘);将OLAP与DM以及在多维数据库中发现知识集成在一起。联机分析挖掘是在不同的数据子集和不同的抽象层上进行数据挖掘的工具,成为用户选择所期望的数据挖掘功能,为动态修改挖掘任务提供了灵活性,是超立方体计算与传统挖掘算法的结合。另外,OLAP技术的其他几个发展目标是:OLAP与Web相结合,形成基于Web的OLAP;面向对象的OLAP——03LAP(objectoriented OLAP);对象关系的OLAP——OROLAP (object relational OLAP);分布式OLAP——DOLAP (distributed OLAP);时态OLAP——TOLAP (temporal OLAP)。成熟的OLAP技术将极大地促进生物医学的发展,如利用OLAP研究基因表达数据库的数据挖掘[15]、基于Web的监测与气候相关的健康隐患的空间OLAP[16]以及保健决策和研究等。
4 总结
(1)OLAP技术在生物医学领域拥有光明的前途,其在医院经营管理及医院费用管理、医疗信息、医疗耗材管理以及疾病诊断方面等都有非常重要的应用。(2)将DW、OLAP以及DM结合形成基于DM的OLAP,是使OLAP更好地提供决策支持的必然趋势;与其他的技术联合,可以改进OLAP,最大限度实现其在生物医学领域的多维在线统计分析的作用。(3)随着DW、OLAP、DM技术的不断推广,相信OLAP技术在生物医学领域会有较好的发展。