大数据环境下国内外健康数据平台开放性对比分析*
2016-09-23刘华东马海群黑龙江大学信息管理学院哈尔滨50080黑龙江大学信息资源管理研究中心哈尔滨50080
刘华东,马海群(.黑龙江大学信息管理学院,哈尔滨 50080;.黑龙江大学信息资源管理研究中心,哈尔滨 50080)
大数据环境下国内外健康数据平台开放性对比分析*
刘华东1,马海群2
(1.黑龙江大学信息管理学院,哈尔滨 150080;2.黑龙江大学信息资源管理研究中心,哈尔滨 150080)
通过对比国内外代表性健康医疗数据平台的数据采集、政策环境、健康医疗数据的主题分布与开放程度,研究其开放性。本文围绕6家平台上发布的健康医疗数据的数据采集来源、主题分布、开放等级分布等情况进行研究,发现国内健康医疗数据平台开放性偏低,开放数据政策环境较差,国内的健康医疗数据利用程度仍然处在初始的阶段,健康数据平台布局基本照搬国外模式。
医疗数据;数据平台;数据采集;数据开放共享
中国正在从信息技术(Information Technology,IT)时代走向数据技术(Data Technology,DT)时代,大数据时代经济社会发展的基础设施[1],不再仅仅是铁路、公路和水电煤,更包括互联网医疗等建立在互联网基础上的各种大数据基础设施服务[2]。在很多统计学者眼中,中国医疗大数据应用比美国更有潜力。中国拥有全世界最大的医疗保障体系,超过13亿人已经被基本医保覆盖,由此生成的医疗数据量巨大。健康医疗数据平台的前景相当广阔,而大数据的采集应用则是健康医疗数据平台发展的基础,未来健康医疗行业将会更重视个体全方位的健康数据参与和整合,进入由数据驱动的时代。
目前,基因测序、精准医疗、分级诊疗等概念越来越热,“4P”医学模式:预防性(Preemptive)、预测性(Predictive)、个体化(Personalized)和参与性(Participatory)也已经进化成为5P医学:预防性(Preemptive)、预测性(Predictive)、个体化(Personalized)、参与性(Participatory)和精准医疗(Precision Medicine)。未来的医疗将完整地收集来自消费者的各项数据,不仅是电子病历,还有来自个人的基因检测数据、来自健康手环的数据、来自环境的数据等,全世界都在朝医疗数据化、数据共享化的方向发展。健康医疗数据,属于个人资源,也具有公共资源的属性。把医疗数据开放给患者,意味着把知情监督的权利还给公众,这是消除信息不对称的必经之路。数据只有流动、共享才能更好地产生价值,让患者掌握自己的健康医疗数据,才能提高患者的参与积极性,推动医患共同决策,最终促进健康医疗数据平台和医学的健康发展。
发达国家在数据医疗行业一直走在世界前列,健康医疗数据信息开放共享程度较高,医疗数据库建设较为规范,平台数据来源丰富、真实可靠,数据标准界定明确,目前已经形成一套比较完善的以大数据管理为核心的医疗福利管理体系,其发展历程对我国有重要的借鉴意义。然而,由于我国与国外的国情与市场土壤存在巨大的差别,简单移植国外的模式并不一定能成功,本文尝试通过对国内外健康数据平台的分类对比分析,找出各自优劣,借助他山之石,为国内健康数据平台优化建设提供借鉴。
1 健康医疗大数据的特性与分类
1.1 健康医疗大数据的特性
(1)大数据性。第一,数据规模巨大。CT图像、基因组序列文件、病理图等,都会占用大量的存储空间。第二,数据结构多样。医疗数据通常会包含各种结构化表、非结构化文本文档、医疗影像等多种多样的数据存储形式[3]。第三,数据增长快速。医疗信息服务中包含大量在线或实时数据分析处理,每时每刻都在产生数据[4]。第四,数据价值巨大。医疗大数据不仅与每个人的生活紧密相连,对这些数据的利用更牵扯到国家乃至全球的疾病防控、新药品研发和顽疾攻克能力[1]。
(2)情境性。健康医疗数据对情境具有依赖性,不过采集和统计数据时通常都要剥离情境,而当我们进一步分析和应用医疗数据时,又必须要结合其产生的背景和上下文关系,回到具体的情境中去。
(3)多态性。医疗大数据包括纯数据(如体检、化验结果),信号(如脑电信号、心电信号等),图像(如B超、X线等),文字(如主诉、现/往病史、过敏史、检测报告等),由此体现出多态性的特点。
(4)不完整性。首先,健康医疗数据采集具有其局限性,数据来源良莠不齐,精确性和可靠性难以保证;其次是各机构、数据平台之间缺乏有效的数据互通,数据难以成为一个整体。
(5)时效性。根据不同的需求来确认数据的时效性,过时的数据无法对决策的制定产生效用,但在获取最新数据的同时,也要保证数据能及时有效地利用[7]。
(6)冗余性。医疗机构、各大平台产生大量无效和重复的数据,增加数据的独立性和减少数据冗余是医疗数据管理获得成功的前提条件。
1.2 健康医疗大数据分类
目前国内学者对健康医疗大数据已经有了比较成熟的分类标准,王俊艳等将健康医疗大数据分为院内医疗大数据、公共卫生健康大数据和移动互联健康大数据三个部分[8]。如果按平台入口划分,健康医疗平台数据可以分成患者数据、医生数据、医院数据和医药数据。按功能类型划分,健康医疗数据可以分为寻医问诊类、社区门户类、垂直就医类、电商类、媒体类和营销类等。按服务人群,可以划分为大众类、女性类、男性类、老人类和母婴育儿类等。俞国培等按照不同的数据来源,将健康医疗大数据分成医院医疗大数据、区域卫生服务平台医疗健康大数据、基于大量人群的医学研究或疾病监测大数据、自我量化大数据、网络大数据和生物信息大数据6类[9],本文主要采用按照来源的分类方式。
2 国内外健康数据平台发展现状
健康数据关乎人类日常活动与健康发展,因而其数据平台建设与应用吸引了国内外众多机构的极大关注。从全球范围看,现代医学正步入5P医学时代,强调社会参与、早期预测、个性化与精准治疗,由此带来数字医疗和健康预防向基层社区和个人家庭方面发展,更多的健康信息采集终端融合进大众生活,健康数据在传输、处理、挖掘和展现等相对薄弱领域的研究也将受到更多的重视,从而推动健康医疗服务范围的扩大。未来,医疗机构对于云计算技术和云服务会越来越依赖。
2.1 国内健康数据代表性平台
2.1.1 阿里的大健康战略平台
阿里的大健康战略主要分为“未来医院计划”和医药O2O平台两个部分。“未来医院计划”通过支付宝对医疗机构开放自己的平台能力,包括账户体系、移动平台、支付及金融解决方案、云计算能力、大数据平台等[10]。数据显示,截至2015年年底,全国近 400 家大中型医院加入“未来医院”,覆盖全国90%的省份,用户通过支付宝,就能享受挂号、缴费以及查报告、B超取号、手机问医等全流程移动服务[11];“未来医院”已经服务超过 5 000 万人次[12],通过“未来医院”用户就诊时间缩短一半[11]。数据采集方面,阿里还成立了“数加平台”,目前加入数加平台的云康数据工作室,创办并运营“云上安心”联盟,以心电大数据为突破口,专注于医疗健康领域的数据分析。据悉,阿里将形成综合的医药数据服务平台,药品流通、功能、用药者购买、用药行为等信息将被整合,最终成为一个健康医疗数据库。阿里未来医院的核心是掌控患者就诊全过程的资金流、所有消费的渠道流,获取大量数据,并以此为依据挖掘衍生商业价值,改变当前的生态格局。
2.1.2 腾讯智慧医疗平台
腾讯在医疗领域开启智慧医疗的第一步:微信挂号。到目前为止,全国已经有超过 1 200 家医院接入以微信为平台的腾讯智慧医疗解决方案,有近 100 家医院采用微信做全流程的就诊[16],超过 120 家医院支持微信挂号,服务累积超过 300 万患者[17]。微信智慧医院以“公众号+微信支付”为基础,结合微信的移动电商入口,以及用户身份识别、数据分析、支付结算、客户关系维护、售后服务与维权等环节[18],优化医生、医院、患者以及医疗设备之间的连接能力,简化整个就医流程。健康数据方面,腾讯拥有自己的QQ健康中心和微信运动公众号,用户通过手环、血糖仪设备接入手机QQ的健康中心或微信运动后,通过开放式的健康管理社交平台,用户可以实时查看自己的健康状况[19]。
2.1.3 百度“云”医生平台
百度拥有自己的百度医生平台,迄今为止,百度医生已经成为全国最大的预约挂号平台,覆盖全国 299个城市,1 823 家医院,超过 17 万名医生入驻,所含的三甲医院约为全国的1/3[13]。百度以百度医生APP为连接点,将患者与医疗服务连接在一起[14]。医院可以为百度医患双选平台提供丰富的医院、医生信息,挂号和其他门诊资源,打造与医疗服务对接闭环[15]。
2.2 国外健康数据代表性平台
2.2.1 苹果健康医疗平台
苹果拥有自己的移动应用平台HealthKit和医疗健康应用平台ResearchKit以及2016年春季发布会新推出的医疗健康开源应用——Carekit。HealthKit可以整合iphone、ipad或者Apple Watch以及其他健康应用的数据,如血压和体重,并对这些数据进行分析和反馈。在苹果最新的iOS系统中,内置的HealthKit健康平台已经获得了许多第三方应用程序和健身追踪可穿戴设备的支持,目前加入数据整合的应用已达 900 多个。并且,苹果公司已经与美国多家顶级医院达成协议,将患者数据导入HealthKit平台。HealthKit在将多源健康相关数据整合后,配合电子病历系统,可达到在医生诊断时提供更多参考的目的,并通过全天实时追踪的方式提供报警之类的辅助功能[20]。
ResearchKit是苹果专门为医学研究者打造的一款软件基础架构,用于帮助人们诊断各种疾病,其目标是改善医疗研究。ResearchKit推出1年来,已经有不少医生和病人使用ResearchKit,获取了很多数据,来提供个性化治疗方法。
而Carekit推出的目标不仅是用于医疗研究,还将根据患者状况,辅助不同医疗诊断决策的制定[21]。
2.2.2 谷歌可穿戴医疗平台
谷歌拥有世界上应用最广泛的移动终端操作系统——Android和智能可穿戴系统Android Wear,并且发布了健康追踪应用开发平台Google Fit。Google Fit和苹果的HealthKit解决方案类似,也提供一个管理中心来检测用户的健康目标和运动数据。另外,第三方的健康监测器和应用也可以接入谷歌平台,并且输入数据。Google Fit提供了 100 多种新的健身活动供用户选择,是同类健身平台中最丰富的。除了系统,谷歌还拥有自己的可穿戴硬件,如谷歌手环等[20]。
2.2.3 微软健康医疗平台
在医疗可穿戴硬件方面,微软也做了大量开发尝试,为残障人士研发了具备特殊功能的可穿戴设备“Alice Band”,可以帮助盲人和弱视人群能够像正常人一样生活。微软还发布了自己的智能手环产品Microsoft Band,这款设备接通微软全新的健康健身追踪服务软件Microsoft Health。Microsoft Band内置10个智能传感器,可以实时监测用户的睡眠以及锻炼时的心率、卡路里燃烧等数据,并通过与知名的健身房合作,为用户提供合理的健身计划,帮助用户实现自己的健康目标[22]。
微软也有自己的云服务平台——Microsoft Health 和Health Vault个人信息管理平台。Microsoft Health面向消费者和行业存储,它可以把不同的健康和健身设备中收集的数据进行整合,并安全地存储至云端。用户可以把已经存储在微软健康平台云端的数据与自己在不同的设备中获取的数据进行对比分析。它就像一个个人信息保险箱,有开放接口,可以与第三方的设备厂商和保险公司做数据交换,用户自行决定上传信息内容以及向谁开放信息。微软计划提供选项让用户通过Microsoft Health与Health Vault的连接,将数据共享给医疗提供商[20]。
3 国内外健康数据平台数据采集对比分析
基于以上对国内外 6 个具有代表性的商业健康医疗数据平台的介绍,以下对 6 个平台的数据采集情况及各自的优势,按照数据采集来源、平台特色产品和平台优势三个指标进行对比,结果见表1。
表1 国内外健康数据平台数据采集及其优势对比
由表1所示,各平台存在一定的共同点,都有其自身的优势和固定的合作伙伴,有稳定的数据采集来源。不过从表1中也可以看出国内平台的几点劣势:第一,国内健康医疗数据平台在移动软件开发方面具有很大优势,但在系统开发和硬件开发方面比较缺乏;第二,国内平台大多处于起步阶段,不够成熟,数据采集质量相对较低;第三,国内平台都有巨大的用户量和平台流量,不过基本只局限于国内用户,数据来源不够全面。
4 国内外健康数据平台的数据开放共享对比分析
国内外的政府、医疗机构及商业机构都对健康数据的开放与共享给予了充分地关注,并分别采取了相应的措施促进数据的使用和应用。政府机构对商业机构数据开放有很大影响,因此先分析一下政府和医疗机构的数据开放情况。
4.1 国内外政府和医疗机构健康医疗数据开放对比
从表2可见,美国医疗数据的开放运动始终处于引领者的位置,政府主导在医疗开放数据的顶层设计、执行保障和开放利用等方面发挥了重要作用,并从各个层面保证医疗开放数据政策的有效执行[23]。英国政府和相关机构在推动医疗开放数据方面也投入了很大力度,通过各种政策和平台调动公众参与医疗数据的共享应用,提高数据的利用效率[24]。相比之下,中国政府和医疗机构的医疗数据开放水平低于美国和英国,医疗卫生信息等相关标准依然缺乏,相关政策制定较为滞后,极大地限制了全民健康医疗数据的开放。
4.2 国内外商业健康数据平台数据开放性对比
4.2.1 数据主题分类
从表3可见,根据健康医疗数据按来源的分类,将健康医疗数据分为7类[8]。
表3 健康医疗数据主题分类表
表2 国内外政府及医疗机构数据开放情况
4.2.2 数据开放等级
数据开放等级采用万维网和关联数据的创始人蒂姆·伯纳斯·李所推荐的五星发展模型,数据开放等级越高,发布成本越高,即对发布者的要求越高,但其使用效益也相应越高,即使用者越易于使用和从中发现有价值的知识(见表4)[27]。
表4 五星数据开放等级表
4.2.3 国内外健康数据平台数据开放性分析
从表5可以得出以下几点结论:第一,国内外各大健康医疗数据平台开放等级普遍为3星级和5星级,对于部分医院医疗数据和自我量化大数据一般都是开放等级最高的5星级,用户可以自由使用查看,对于网络大数据、疾病监测大数据等,一般为限制性开放的3星级,需要使用者拥有一定的权限。第二,国内健康医疗数据平台开放性偏低,3星级比较多,医疗数据流动性较差。第三,在数据全面性和数据质量上,苹果健康医疗平台排第一位,在数据收集和数据挖掘分析领域内更加专注。
5 结语
国内的健康医疗数据利用仍然处在初始阶段,在医疗数据、搜索引擎、数据库建设、大数据算法等方面尚未完善。国内健康数据平台布局基本照搬国外模式,并且各有侧重,腾讯的“智慧医疗”计划目的更侧重于从医生切入,连接医学专业人士、医院和用户,并以此打造“智慧医院”。百度则是凭借搜索引擎以及和国内医疗机构的深度合作,采集共享数据,提供数据服务。
表5 6种代表性健康数据平台数据开放性分析
政府应该重新思考在新形势下的定位,不仅作为标准制定和应用的管理者,更要作为标准开发与应用协同的治理者。政府的作用应该是提供平台,提供支撑,为健康医疗数据开放共享创造条件[28]。企业方面应该大力倡导健康数据开源,支持健康医疗领域的开源运动,同时,应当加强与政府医疗机构以及民间第三方联盟的数据共享合作。
[1] 吴学新.坚持转型升级 加快改革步伐 努力开创合资铁路科学发展新局面[C]//民生经济:转变经济发展方式的目标——中国生产力学会年会暨世界生产力科学院(中国籍)院士研讨会文集.中国生产力学会,北京:2011:4.
[2] 谢雁娇.基于互联网经济的产业融合研究[D].北京:北京交通大学,2013.
[3] 孙艳秋,王甜宇,曹文聪.基于云计算的医疗大数据的挖掘研究[J].计算机光盘软件与应用,2015(2):11,13.
[4] 闫茜.海量医疗数据挖掘平台的研究与设计[D].武汉:武汉理工大学,2014.
[5] 滕琪,樊小毛,何晨光,等.医疗大数据特征挖掘及重大突发疾病早期预警[J]. 网络新媒体技术,2014(1):50-54.
[6] 高汉松,桑梓勤.医疗行业大数据生命周期及治理[J].医学信息学杂志,2013(9):7-11.
[7] 中关村在线.尽信书不如无书 大数据分析要去伪存真[EB/OL].(2014-03-14) [2016-06-11].http://server.zol.com.cn/439/4395428.html.
[8] 王俊艳,张志鹏,姚振杰,等.健康医疗大数据的分析[J].互联网天地,2015(9):4-10.
[9] 俞国培,包小源,黄新霆,等.医疗健康大数据的种类、性质及有关问题[J].医学信息学杂志,2014(6):9-12.
[10] 孔维琛.互联网:重构医疗生态[J].中国经济信息,2015(15):30-33.
[11] 支付宝发布2015“互联网+”城市服务报告(图)[EB/OL].(2016-01-14)[2016-06-08]. http://caijing.bandao.cn/news_html/201601/20160114/ news_20160114_2601629.shtml.
[12] 19省124城在支付宝提供办事缴费等城市服务[EB/OL].(2016-01-15)[2016-06-08].http://www.cnbeta.com/articles/466913.htm.
[13] 百度医生亮相《焦点访谈》 技术创新帮助患者精准就医[EB/OL]. [2016-06-08].http://yi.baidu.com/pc/activity/jiaodian?zt=self&zt_ext=&p vid=1465665176910207.
[14] 马钰.移动医疗:巨头布局峥嵘乍现[J].上海信息化,2015(6):42-45.
[15] 张越.百度PK阿里,移动医疗如何圈地?[J].中国信息化,2015(5):57-59.
[16] 徐书贤.当互联网遇上医疗[J].中国医院院长,2015(5):54-59.
[17] 李克强倡导“互联网+” 超120家医院支持微信挂号[EB/OL].(2015-05-03)[2016-06-08].http://news.ifeng.com/a/20150503/43681313_0.shtml.
[18] 微信支付行业解决方案发布 对战支付宝“未来商圈”[J]. 金卡工程,2015(3):39-40.
[19] 互联网+医疗:投资的狂欢[EB/OL].(2015-05-31)[2016-06-09].http:// q.stock.sohu.com/news/cn/432/002432/4296048.shtml.
[20] 陈根.可穿戴医疗移动医疗新浪潮[M].北京:电子工业出版社,2015:69-78,85-92.
[21] 苹果发布健康应用平台CareKit 用户可自己监测病情[EB/OL]. (2016-04-29)[2016-06-11].http://news.zol.com.cn/580/5807062.html.
[22] 与国内相比, 看看国外科技巨头们是如何布局移动医疗的[EB/OL]. [2016-06-12].http://www.tmtpost.com/1428581.html.
[23] 张涵,王忠.国外政府开放数据的比较研究[J].情报杂志, 2015(8): 142-146,151.
[24] LASSINANTTI J,BERGVALL-KÅREBORN B,STÅHLBRÖST A.Shaping local open data initiatives:politics and implications[J].Journal of Theoretical and Applied Electronic Commerce Research, 2014 (2):17-33.
[25] 癌症治疗登月计划开启,美国开放首个大型数据库[EB/OL]. [2016-06-12].http://www.cnbeta.com/articles/508749.htm.
[26] 潘凌.卫生信息标准符合性测试系统的研究与设计[D].成都:电子科技大学, 2015.
[27] Lee T B.5 star deployment scheme for open data[EB/OL].[2016-06-11]. http://5stardata.info/en.
[28] 陈刚,乔婷婷,丁浩,等.Use of Chinese herbal medicine therapies in comprehensive hospitals in central China: aparallel survey in cancer patients and clinicians [J].Journal of Huazhong University of Science and Technology (Medical Sciences), 2015(6):808-814.
A Comparative Study about the Open Health Data Platform of Domestic and Abroad under Big Data Environment
LIU HuaDong1, MA HaiQun2
(1.College of Information Management, Heilongjiang University, Harbin 150080, China;2. Research Center of Information Resources Management, Heilongjiang University, Harbin150080, China)
The purpose of the study is to compare the data collection, policy environment, the subject distribution and the degree of openness of the representative health data platform in China and abroad. The research method is based on the data collected from various platforms, such as the source of the data collection, the theme distribution and the open grade distribution. The results showed that low openness of domestic health care data platform, poor open data policy environment and the use of health care data is still in the initial stage. Domestic health data platform layout basically copied foreign models.
Health Care Data; Data Platform; Data Collection; Data Open and Share
G350
10.3772/j.issn.1673-2286.2016.6.003
* 本研究得到国家社科基金重点项目“开放数据与数据安全的政策协同研究”(编号:15ATQ002)资助。
刘华东,男,1992年生,黑龙江大学信息管理学院在读研究生,研究方向:信息管理,E-mail:liuhuadongwylb@qq.com。
马海群,男,1964年生,黑龙江大学信息资源管理研究中心教授,博士生导师,研究方向:信息政策与法律,E-mail:mahaiqun@sina.com.cn。
2016-05-30)