眼健康大数据平台实践研究*
2019-06-19周云帆
周云帆 陈 娄 蒋 沁
(南京医科大学附属眼科医院 南京210029)
1 引言
眼健康大数据平台是基于移动互联网建立的、联接智能终端与学校、医疗机构的医学大数据平台,为区域内不同类型用户提供眼健康医疗保健数据和应用服务,实现眼健康数据共享和诊疗过程协同。眼健康医疗大数据是通过医院、体检机构、个人采集的眼保健、眼病相关的医疗卫生数据。随着电子信息技术的发展和普及,移动互联网智能终端已经可以参与眼科相关的保健与医疗信息的采集与反馈。通过搭建眼健康大数据平台,各机构间可以互联互通,成为数据共享的开放式交互平台,为卫生行政部门管理提供决策依据,为社会公众便捷就医实现技术保障。本文对该大数据平台的系统开发与临床应用进行简单介绍。
2 平台设计
目前各类医疗信息系统建设较为完善,如医院信息系统(Hospital Information System,HIS)、影像存储与传输系统(Pictures Archiving and Communication System,PACS)、检验信息系统(Laboratory Information System,LIS)、电子病历(Electronic Medical Records,EMR)、物资采购管理系统、药房管理系统、临床路径管理等。但医疗辅助决策系统、大数据科研分析、大数据临床预测等更高级的应用系统,即便在发达地区的重点医院应用率也是极低的。眼科由于专科影像学检查的特殊性,各医疗机构数据独立性强,诊疗信息、电子病历、健康档案、医疗影像数据格式不统一,分散存储,往往导致医疗数据孤岛。针对眼科就诊人群年龄段和疾病谱的分布特殊性,利用移动互联网智能终端作为眼健康数据信息源的采集方式,结合医院移动筛查设备与区域卫生信息系统中的眼科相关医疗信息,共同构成眼健康大数据平台中以相关眼病为核心的信息闭环。为高效采集与应用眼健康大数据,按照规范的数据交换标准和兼容的数据交换接口,依托移动互联网,基于Hadoop构建南京市眼健康大数据平台。
3 平台架构
3.1 架构图
眼健康大数据平台以Hadoop集群环境、分布式数据库、分布式计算框架为基础,智能提取原始信息中的结构化、半结构化和非结构化数据,经过清洗后形成居民眼健康电子档案库。运用人工智能神经网络与机器学习技术自动识别海量眼健康,构建眼病多因素危险模型,实现平台自动识别用户输入、计算匹配模型、深入分析用户数据,形成眼健康医学知识库,从而达到辅助医疗人员诊疗的目的。平台分为基础层、数据库层、分析层和应用展示层,见图1。
图1 眼健康大数据平台架构
3.2 具体构成
数据库层为Web Service模式,采用可扩展标记语言(Extensive Markup Language,XML)或基于JavaScript语言的对象简谱(JavaScript Object Notation,JSON)协议为移动智能终端和平台Web端提供数据管理服务。数据库层使用Spark计算框架,联接区域卫生信息系统对医疗机构间HIS,LIS,PACS,EMR等信息系统中结构化,半结构化,非结构化的原始眼科大数据进行抽取,分类,计算,存储在分布式数据库中。建立眼健康大数据平台,以实现多源异构大数据的融合,为后续大数据的高效挖掘奠定基础。分析层读取数据改动和存储层整理的数据,在某些情况下分析层直接从数据源访问数据。分析引擎具有支持并行处理的各种不同的工作流、算法和工具。根据已建立的眼健康电子数据库进行数据分类,采用卷积神经网络算法训练人工智能神经网络分析模型。应用展示层针对不同类型用户匹配相应的数据信息和功能,通过可视化技术对结构化和半结构化数据进行处理,组合到单个用户的移动应用平台界面上进行可视化展示。
4 业务流程
4.1 大数据采集
针对不同采集对象开发多模式、多端口的采集系统。为保证采集数据的有效性和唯一性,必须建立采集对象身份识别系统。每台眼健康医疗相关检查设备都配备身份识别硬件,可通过非接触式刷卡系统对手机号码、医保卡、身份证、就诊卡进行快速识别,自动生成唯一的ID编号,与大数据系统中的相同身份信息相匹配。使居民无论是在家通过智能手机APP自检还是在体检机构进行眼科体检或是在医疗机构的眼科相关仪器检查都能进行身份识别后的匹配关联,大大减少患者在不同医疗机构的重复检查以及不必要的经济花费,同时节省医疗资源,是一项多赢的举措。
4.2 大数据存储
眼健康医疗大数据存储系统采用目前最先进的Hadoop技术。Hadoop作为大数据工业中的主引擎,本身是一个分布式运行系统,是基于Java编程语言的计算架构,也是一个可扩展的数据生态系统,包括分布式文件系统(Hadoop Distributed File System,HDFS)和MapReduce两项最重要的技术,能够同时分布式处理海量数据。HDFS技术具有高度容错(即使中途出错也能继续运行)、支持多媒体和流媒体数据访问、高效率访问大型数据集合、数据保持严谨一致、部署成本较低及效率提高等特点。MapReduce是一种面向大规模数据处理的并行计算模型和方法,用于大规模数据集(>1TB)的并行运算。HBase是运行在HDFS架构上的列存储数据库,已与Pig/Hive很好地集成。通过Java应用程序接口可以接近无缝地使用HBase。
4.3 大数据分析
眼健康医疗大数据分析系统运用A/B测试、关联规则挖掘、数据聚类、数据融合和集成、遗传算法、自然语言处理、神经网络、神经分析、优化、模式识别、预测模型、回归、情绪分析、信号处理、空间分析、统计、模拟、时间序列分析等多项成熟技术进行数据过滤和整合,通过机器学习Mahout系统帮助快速达成大数据分析,其中已实现部分机器学习的逻辑。
4.4 大数据多模式交互
眼健康医疗大数据平台根据不同服务对象采取多模式的数据交互策略。针对居民,利用眼健康大数据平台的数据资源开发响应的智能手机APP,使居民方便快捷地实时掌握个人眼健康信息,实现预约挂号、在线咨询等功能;针对医疗机构,通过整合不同医疗机构和体检机构的检查检验数据,使患者不同时间段的检查资料进行关联,使电子病历数据更完善,对眼科医生系统全面地了解患者病史和病情提供帮助;针对卫生行政主管部门,实时监控眼相关的流行病学数据,通过该平台对医院进行业务指导和考核,对居民和患者进行眼保健和眼病的健康教育和促进。
5 服务项目(图2)
图2 眼健康大数据平台服务项目
5.1 居民眼健康档案自查
眼健康大数据平台的手机APP客户端面向居民开放眼病自查和眼科电子病历查询功能。居民通过软件可进行视力、视敏度、色觉自查,初步判断自身眼健康情况。居民在区域内各医疗机构就诊的既往眼科检查和电子病历通过平台整合构建成眼健康电子档案,方便随时查阅。
5.2 与其他医疗机构共享眼科数据
平台通过与南京市卫生信息中心平台的对接、与各医院眼科就诊数据互联互通,实现全市眼科影像学检查和眼科电子病历的数据共享。为确保患者隐私和数据安全,所有原始数据都经过南京市卫生信息中心平台的算法加密后进入大数据平台。
5.3 青少年近视筛查
目前开展的南京市中小学生近视筛查项目通过平台进行数据的采集和分析,将筛查结果和分析报告及时反馈给学校教师和学生家长。对近视高风险的学生,平台通过大数据风险模型预测后给予短信提醒,确保潜在的近视学生能够得到及时有效的医学矫正。
5.4 老年人白内障筛查
通过平台及时对老年人白内障的疾病进展程度给予人工智能风险评估,将智能移动眼科检查设备采集到的数据反馈给定点医院眼科,统筹安排预约复诊或手术时间,为白内障筛查提供了高效的信息系统保障。
5.5 眼健康大数据研究
青少年近视及各类眼病的临床研究依赖眼健康大数据平台采集的全方位、多维度的临床数据。眼科医师标注建立训练集,经过机器学习训练各类眼病危险度风险模型,通过筛查输入青少年眼健康大数据,构建近视眼人工智能预测模型,可对近视进展趋势进行个体化预测。结合眼科智能移动检查设备进行白内障筛查,构建白内障分期及危险度人工智能预测模型,为后期精准干预提供个性化诊疗意见。
6 应用效果
6.1 扩大眼健康服务覆盖面
南京市眼健康大数据平台投入使用后各项眼健康筛查服务群体的广度和深度都得到广泛扩展,由重点区县抽样筛查扩展至所有区县。较之前的电话随访模式,服务效率得到极大提高。居民通过移动互联网终端可以随时访问大数据平台查询个人眼健康数据,通过自行补充相关信息完善眼健康电子档案既往病史和家庭史等信息。
6.2 改善居民眼科就诊体验
南京市眼科医联体和分级诊疗体系借助眼健康大数据平台快速推进。居民可以通过移动互联网终端APP与眼科专家进行互动、预约就诊、健康咨询、术后随访等在线咨询服务。儿童、青少年和老年群体在筛查出异常后相关电子检查资料会自动分配给相关亚专科专家进行人工甄别。当需要进一步诊治时大数据平台系统会进行专家推荐和在线预约。居民从筛查到最终确诊的时间由之前的平均12.7天缩短到2.6天,眼科急重症患者得到及时诊断和对症治疗。
6.3 提升优质眼科医疗资源利用效率
三甲医院的优质眼科医疗资源通过眼健康大数据平台得到合理分配和高效利用。居民通过眼健康大数据平台进行自我教育和医患在线沟通,发挥医联体分级诊疗的优势,提升医患沟通效果,杜绝患者急病乱投医和医患沟通不良情况的发生。眼科专家通过眼健康大数据平台与日常门诊相结合,为更多居民提供优质的眼科专业医疗服务。
7 结语
大数据挖掘和人工智能技术在移动互联网眼健康大数据平台的应用将近视与眼病的防治从医院眼科关口前移到学校与社区。眼健康大数据平台提高日常近视与白内障筛查效率,实现医疗数据的互通共享和居民眼健康的自我管理。卫生行政管理部门通过眼健康大数据分析汇总情况实现医疗机构的科学管理以及卫生资源的高效配置,提升医疗卫生服务水平和效率,为形成个性化诊疗方案提供参考意见。