大数据视角下医疗行业发展的新思维
2015-05-30陈惠芳徐卫国
陈惠芳 徐卫国
摘要:大数据时代的到来,给医疗行业带来了机遇和挑战。文章首先梳理了大数据的内涵和理念,在此基础上分析了现今医疗行业面临的挑战,包括大数据处理技术、决策分析、隐私安全及人才紧缺等问题。最后尝试从大数据新思维意识、数据共享、信息安全、人才团队建设等几个方面探讨大数据时代医疗行业的重点应对策略。
关键词:大数据;医疗;新思维
一、 引言
在21世纪,对海量信息的采集和分析能力将成为最重要的能力之一。世界各国已经行动起来,从政府、研究机构到企业“尝鲜”大数据技术。美国奥巴马政府宣布推出“大数据的研究和发展计划”;国际顶级学术期刊Nature和Science均出专刊来探讨大数据;国内人大经济论坛随后也推出了大数据专题讨论页面。可见大数据在经济社会各层面、各领域都开始受到重视。
与此同时,医疗行业也遇到了海量数据和非结构化数据的挑战,尤其是物联网和传感网的发展进一步推动了医疗行业数据的极大增长;而随着近年来很多国家都在积极推进医疗信息化发展,这从战略上和资金上使得很多医疗机构能够进行大数据分析和研究。医疗行业将首先迈入大数据时代,成为让大数据分析最先发扬光大的传统行业之一。
然而,究竟什么是大数据?大数据给个人患者和医疗机构带来怎样的冲击和转变?大数据时代医疗行业又将面临怎样的机遇和挑战?本文即从对大数据的内涵进行梳理入手,结合分析医疗行业面临的机遇和挑战,提出大数据视角下医疗行业发展的新思维,以促进我国医疗行业的健康发展。
二、 大数据概述
大数据是近几年被各界热议的焦点与话题,学术界与企业届纷纷发表了对大数据的理解。权威IT咨询公司Gartner认为大数据是一种信息资产,其特征是海量、高增长率和多样化,使用新的大数据处理模式才能使其具有更强的优化流程能力、决策创新能力及洞察发现力。维基百科將大数据定义为使用手头的数据库管理工具或传统的数据处理应用变得难以处理的庞大而复杂的数据集合设置。IBM公司认为大数据来自于任何地方的多维数据,并认为可以用“4V”来归纳总结,即数据体量大(Volume)、数据类型多样(Variety)、数据价值密度低(Value)及数据处理速度快(Velocity)。
虽然目前未形成对大数据一致公认的理解,对大数据的定义也存在不同的表述,但较为一致的认为大数据已不再局限于技术领域、不是简单的数量多少问题,大数据隐藏着背后变革思维、变革决策及变革组织的力量。具体而言:①从思维上改变对数据的态度(Viktor et al.,2013)——一是收集和使用大量数据,分析全部数据,而不是依靠少量的样本数据;二是不再执着于数据的精确性,接受半结构化数据和非结构化数据的混杂;三是在大数据背景下,通过相关关系将更容易快捷的分析事物,而不是通过揭示事物内部运作的因果关系。②数据驱动决策(Foster & Tom,2013)。决策的驱动因素来自于对数据的分析而不是纯粹来自直觉。决策的科学性是我们追求的目标,但科学性的追求是为了保证决策的效能和效率。数据驱动决策的益处:在其他因素得以控制的情况下,一个企业的决策越是通过数据驱动则效益和产出越好。③数据驱使组织进行变革。从大数据中发掘大洞察、发现潜在知识和机会将成组织竞争力的来源,从而推动组织结构的改变;而大数据成为组织变革的力量源于其可以变革组织的盈利模式和传统交流方式;如亚马逊拥有大数据和转换数据价值的能力使其占有行业领先地位,如各种去中心化的维基、博客等交流方式改变传统的交流方式。
综上可见,当数据和黄金一样成为一种新的经济资产,当数据和石油一样成为一种战略资源(世界经济论坛,2012),当大数据科研从第三范式(计算机模拟)中分离出来单独作为一种科研范式(Jim,2009),我们已然进入大数据时代。经济社会各个层面、各个领域都面临着如何有效利用和挖掘大数据的价值。
三、 大数据环境下医疗行业新机遇
大数据给医疗行业带来的健康意识和社会效益要超越其获取与管理的成本。如全面数据用于分析病人信息,能更好的提高医疗诊断的准确性和精确性,甚至预测疾病发展,及早提出有针对性的应对措施。因此,大数据时代的思维和态度必然给医疗行业带来新的创意。下文从大数据时代的数据特征:全面、即时、社会化三个方面探讨大数据给医疗行业带来的机遇。
1. 数据全面,有利于提高医疗决策的可靠性。信息的全面性是影响决策可靠性的主要因素。医疗决策用于分析的数据越全面,其决策分析的结果越接近真实。传统的医疗决策由于信息的不完整主要依靠自身判断作决策,存在着直觉判断、依靠经验办事等弊端。在大数据时代,医疗信息孤岛将逐步消失,同时,社交网络的普及也将增进信息的知识共享和信息的交互,医疗决策支持系统将可以获取多样性、高速性和和规模性的数据,可立足于更大、更完整的数据集,通过全面的数据分析,为医疗决策者提供全局性的决策支持。同时,伴随着数据挖掘、数据可视化、数据处理和人工智能等“大数据”处理技术的进步,医疗决策者也可以从中挖掘更多支持决策的有价值的信息。因此,基于大数据全面数据的驱动,将使医疗决策更加精确、更加科学,极大提高医疗决策的可靠性。
2. 数据传播即时,有利于加强医疗应急管理。随着互联网的重心向着移动互联转移,目前移动医疗正逐步成为医疗行业的规划重点。根据CNNIC第34次调查数据显示我国手机网民数量为5.27亿人,占总体网民比例高达83.4%,手机网民的数量第一次超过了PC网民。目前互联网上相当大一部分的数据来自平板电脑、智能手机等泛互联网设备,如能利用好大数据环境中的传播即时的数据,医疗应急管理的反应能力及实时效果将会得到极大的提高。如Google利用传播即时的大数据和疾控中心一样判断疾病来源,预测的相关性高达97%,并且判断相当及时,而不像疾控中心需要在疾病爆发一两周后才可发现。因此美国在2009年甲型HINI流感爆发时,Google成为了一个更为及时和有效的指示标。
3. 数据社会化,有利于改善医患关系。长期以来,患者和医生的矛盾主要源于患者和医生之间存在着信息的不对称,甚至由于信息孤岛的存在医疗工作者在大部分时候无法真正了解患者病情。数据的社会化趋势使每个人在互联网进入到大数据时代,都将是透明性存在着。这将逐步消除患者与医疗机构间的信息不对称,同时由于信息孤岛的消失将极大改善和提高医疗诊断的准确性和速度。而这些都将有效的改善患者健康状态、提高患者的健康理念和知识,有利于改善和缓解医患关系。
四、 大数据环境下医疗行业面临的挑战
大数据时代的理念和技术给医疗行业既带来了机遇也带来了挑战。
1. 处理医疗大数据的技术困境。医疗大数据的处理首先面临技术上的困境。医疗数据体量大,如一个社区医院累积的结构化和非结构化数据就可以达到数个TB甚至PB级别;其次是我国医疗机构信息系统建设缺少统一的规划和标准,形成众多的“信息孤岛”,甚至在单体机构部门之间都存在信息割裂。因此医疗数据的数量大、非结构化、种类多及资源的不够开放将对医疗行业的数据挖掘和信息共享造成一定的困境。有估计称企业相关数据有80%都是基于文本的非结构化数据(Grimes,2008),医疗数据的大部分也是基于文本的非结构化数据。大数据革命已成为关键因素,传统处理数据的分析技术已无法满足大数据处理,尤其是在机器学习和处理海量信息集。因此,构建良性发展的共享数据系统的大数据处理技术将成为医疗机构面临的一大难题。
2. 大数据时代医疗的决策分析问题。决策分析已经逐步从数据驱动代替传统的经验直觉决策。对于医疗行业来说,大数据的有效利用与否已经成为提高医疗服务质量、增强核心竞争力的关键策略。然而问题是医院数据的一大部分是基于文本的非结构化数据,而且非结构化数据的增长率远远大于结构化数据;因此,基于结构化数据的传统数据挖掘策略对于大量非结构化的医疗数据已显无力。数据挖掘的传统策略不仅对医疗决策的时效性造成影响,同时在处理结构化过程中丢失了半结构数据与非结构化数据的隐含关系,进而增加了医疗决策的不确定性和不准确性。而这些隐含关系实际上有可能是非常重要的信息,比如找出一些潜在疾病的相关关系。因此,如何有效地將数据存储、处理和保护成本降至最低,通过大数据挖掘把医疗大数据转换为支持临床决策需要的信息,从而达到高效的医疗数据社会效益与经济效益并行,又是医疗行业面临大数据时代的一大难题。
3. 大数据时代医疗隐私的安全问题。目前,医疗机构在隐私保护和安全风险应对方面准备明显不足,在一些医疗机构内部缺乏高层管理人员对患者信息的控制,而过时的隐私意识和数据策略、政策程序有法不依和人员培训不足等现象也十分突出。大数据时代无疑会提高医疗过程数据的透明度,医疗行业正在过渡并开始大规模广泛应用电子健康记录,而临床数据库、家庭监控和远程医疗都有很大的概率发生数据泄露、数据欺诈、身份盗窃而造成医疗欺诈和纠纷案件,从而抬高医疗总费用并产生重大负面影响。同时,由于社交媒介如Twitter、移动APP端等在医疗组织、医师和患者间的广泛应用,一旦利用不当将造成患者隐私安全泄露的风险。如何在大数据时代的数据收集上获得巨大进步的同时确保病人敏感信息和隐私安全再一次引起了人们对于隐私问题的担忧,这一问题至关重要,它很有可能使“大数据”无法实现重大突破。因此,防止泄露敏感病人的数据、提高数据安全保护、维护医疗机构的品牌价值,通过技术和法律等正当手段积极维护患者信息的安全,将是医疗行业面临大数据时代的又一难题
4. 医疗行业大数据人才落地问题。人才是企业发展的核心竞争力,医疗行业也不例外。医疗机构面对如此数据量巨大、非结构性强、数据来源庞杂的数据需要存储、处理和分析,更需要有别于传统数据分析的新人才进行管理和分析处理。然而目前,大数据人才缺口巨大,供不应求。根据麦肯锡全球研究院(MGI)2012年的预测,未来6年,仅美国本土就可能面临14万~19万的大数据能力人才的缺口。因此,如何找到应对大数据挑战和机遇所需要的人才,培养和造就一支懂管理、懂指挥、懂技术的大数据专业队伍又是医疗机构面临的一大难题。
五、 大数据视角下医疗行业发展新思维
1. 建立面向大数据的创新思维。尽管有人认为大数据其实仅仅是“信息爆炸”所带来的一种现象,是一些数据商家用来吸引眼球的一个噱头。但现实的实例也告诉我们大数据正在创造价值,新的创新模式和新的价值随着大数据的驱动不断产生。根据MGI研究预测,通过有效利用急速增长的大数据,美国医疗行业如果能够以此提高服务质量和经济效率,则可能创造每年超过三千亿美元的超额价值。“数据权”正成为各国、各领域争夺的新资源;大数据的不断渗透对经济发展模式、公共服务模式甚至国家战略规划等提出了新的要求。同时,大数据又是一种资源和工具,我们必须以认可其巨大力量的同时看到其局限的辩证观点来接纳大数据时代的新思维。因此,医疗机构应该正视大数据带来的机遇与挑战,转变思路,积极有效地将数据转换为可用的资源,从而改善医疗服务的质量、提高医疗服务的效率、提升竞争力,从最根本上实现医疗数据的最佳经济效益和社会效益。
2. 搭建智慧医疗数据共享综合平台。数据只有充分流动和共享才是有生命力的数据。而多种数据源的整合能力及新型数据源的分析能力成为搭建综合共享平台的关键能力。综合利用多种数据的全资源分析(All-source Analysis)正是从问题出发,系统化地整合所有相关信息资源来支持医疗决策与研究,利用不同数据资源来评估、揭示、解释事物的发展,最终发现新知识。同时,大数据时代随着网络应用的深入,不断涌现出各种不同的新型媒体形式,而且可以预见随着经济社会的发展和科学技术的不断进步,新型资源将不断涌现,应注重新型数据源的分析,持续加入数据共享平台,不断促进医疗决策与研究的发展。
3. 加强完善医疗信息安全制度建设。完善医疗安全不仅是技术问题,更是管理问题,应该从管理角度和技术上杜绝医疗核心数据和隐私被泄露的漏洞。下文主要从管理角度探讨安全隐私问题,核心是患者隐私(Privacy)保护和信息安全(Security)规划。①法律制度的强制。完善医疗相关的安全条例以保护信息系统的保密性、一致性和可用性:包括管理上的防护,建立和落实安全的管理策略,物理设施上的保护等。建立完善隐私条例涉及个人健康信息的内容可被组织机构所使用的信息标准,并规定个人可以了解和控制他们的信息是如何被使用和披露的。②规章制度约束。对信息系统和机房设备日常维护工作的建立。包括监控网络(内部信息平台)运行安全、信息的变更管理规定、容灾数据备份方案及各种应急方案等。③人员的遵守。对相关从业人员进行持续的安全防范意识和规范操作的培训;对内部从业人员进行安全评估和认证,并加以强化合法和非法披露意识的培训;最后核心人员应该签订相关保密协议,并完善相关的激励机制制度,防止涉密人员和高级管理人员离职后泄密。
4. 医疗大数据人才队伍的组建与培养。人才是数据价值得以体现的前提,大数据建设的各个环节都需要有专业人员才能完成。因此需要组建与培养一支懂管理、懂指挥、懂技术的大数据专业建设人才队伍。
在大数据时代下尽早开始组建具有大数据分析能力的团队,将有利于提升医疗机构的核心竞争力和品牌价值。组建具有大数据分析能力的团队应包含以下人员:①数据科学家(Data Scientist)。数据科学家是能创造新的数据服务运用,具有从海量数据中提取出简单易懂、有价值的信息并传递给决策者的人才。数据科学家大多应具有统计分析、数据挖掘等技能且拥有计算机科学背景的人才,同时具有沟通能力、创新精神和好奇心等素质。②数据专员。数据专员收集与汇总所有进入医疗行业的高质量数据,并编成目录,最终确定上游数据模型。因此,数据专员需要具备数据抽取及数据建模等技能的基本素质。③系统维护员。负责数据系统、信息平台等的常规维护工作。包括日常软件和硬件的管理与维护工作,同时需要确定软硬件的额外需求并实际落实。④开发人员。负责搭建平台、开发分析应用程序。这部分人员可以采用雇佣外包的方式给专业的大数据公司完成。
六、 结束语
“数据为王”的时代已经到来,先行者机遇与挑战共存,关键在于能否创新并找到相应的发展模式。大数据视角的思维和理念给医疗领域既带来了机遇也带来了挑战,解决大数据所带来的挑战将不是易事。医疗工作在未来的发展过程中必须要面对这些机遇和挑战,只有将大数据作为一种资源和工具来运用才能形成可持续竞争优势。本文分析了大数据视角下医疗领域的若干机遇和挑战,同时本文提到的大数据新思维意识、数据共享、信息安全、人才队伍建设等几个方面也是大數据环境中医疗领域未来的发展趋势。本文以期能为促进医院管理的理论和实践的发展添砖加瓦,使其能更全面深入地洞察行业竞争态势,做出更好的规划与决策。
参考文献:
1. Kenneth Cukier, Viktor MS.The Rise of Big Data.Foreign Affairs,2013.
2.邓仲华,李志芳.科学研究范式的演化——大数据时代的科学研究第四范式.情报资料工作,2013,(4):19-23.
3.Gantz J, Reinsel D.Digital Universe Stu- dy: Extracting Value from Chaos.IDC Go-to-Market Services,2011.
4.Travis B, Allan S.The Inevitable Appli- cation of Big Data to Health Care.JAMA,2013,309(13):1351-1352.
5.李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考.中国科学院院刊,2012,(6):647-657.
基金项目:上海市科技委员会科研计划项目(项目号:09dz1500306);上海市信息化发展专项资金项目(项目号:201302011)。
作者简介:徐卫国(1952-),男,汉族,上海市人,上海交通大学安泰经济与管理学院教授、博士生导师,研究方向为医院管理;陈惠芳(1982-),女,汉族,福建省武夷山市人,上海交通大学安泰经济与管理学院工商管理专业博士生,研究方向为医院管理。
收稿日期:2015-02-12。