一种基于大数据分析的移动健康服务平台
2016-06-30盛明张勇李超邢春晓清华大学信息技术研究院计算机系清华信息科学与技术国家实验室北京100084
盛明,张勇,李超,邢春晓(清华大学信息技术研究院 计算机系,清华信息科学与技术国家实验室,北京 100084)
一种基于大数据分析的移动健康服务平台
盛明,张勇,李超,邢春晓
(清华大学信息技术研究院 计算机系,清华信息科学与技术国家实验室,北京 100084)
摘要:本文提出一种基于可穿戴传感器、移动互联网以及大数据分析的健康服务平台-飞活健康网平台。该健康服务平台整合可穿戴设备、一体机设备、智能手机应用和相关大数据处理技术,便于展示、管理与比较长期的基本健康数据和环境数据;并通过智能分类、深度学习等后台数据分析,实现提醒、建议与警告等健康增值服务。
关键词:大数据;可穿戴设备;数据分析;智慧健康
1 介绍
近些年随着物联网的和移动互联网的不断发展,可穿戴设备、移动健康服务也越来越成为研究和工业界热点[1-3]。可穿戴设备和移动互联网在健康监测领域有着天然的优势,可以随时随地的监控使用者的身体与运动状态,并提供相关服务[5-7]。随着中国社会老龄化的进程加快,人群中亚健康人群比例的增加,整个社会对可穿戴的健康监控的需求也会随之加大[8-9],产生的健康方面的数据也会激增[10-12],因此更好的管理以及分析大量的健康相关的数据并提供相关的增值服务显得尤为重要,基于上述背景,我们提出了一种基于可穿戴传感器、移动互联网与大数据分析的健康服务平台——飞活健康网平台。
飞活健康网平台为用户提供全方位、多渠道、实时且便捷的健康监控。健康数据的收集主要基于可穿戴设备、一体机以及智能手机。基于对相关健康数据的采集、组织、管理以及分析,平台能够为慢性病人群以及亚健康状态的人群提供健康增值服务。与此同时,基于云平台和物联网,飞活健康网能够提供面向智慧健康的增值服务。飞活健康网平台能够展示、对比、分析长期的健康相关的数据,这些数据都是从可穿戴设备、一体机设备、智能手机采集而来的。与此同时,本平台还能够提供面向健康的增值服务比如早期预警和健康建议等。而上述服务的实现是基于智能分类、深度学习以及相关的数据挖掘算法。
本文的组织方式如下:第二部分主要介绍相关方式方法。第三部分主要介绍数据分析和增值服务。第四部分对结果进行展示。第五部分是总结。
2 相关方法
2.1服务方式
2.1.1数据采集
平台针对个人、家庭和社区构建了健康监控网络,可以随时随地的记录用户的健康状态。
●基于蓝牙的便携式可穿戴设备:主要包括计步器和腕带。利用这些设备可以收集个人的健康相关的数据比如步数、距离、体温、心率、环境温度、环境湿度等。
●面向社区的健康一体机设备:此一体机集成了监测体重、体温、血压、脉搏和血氧血糖数据的功能。
●基于IEEE Continua标准的第三方健康数据采集设备:包括欧姆龙等厂家生产的血压、血氧、血糖以及心跳监测仪等。
2.1.2数据上传
●基于蓝牙的汇总方式:通过手机蓝牙,将通过上述途径采集到的数据进行汇总。
●基于JSON的健康检测数据的统一结构化,将来自上述多个途径的不同格式的健康数据以JSON的方式进行统一的结构化并在手机端进行汇总与存储。
●手机端将最终整理好的健康数据通过手机网络上传至后台服务器,实现长期的健康数据跟踪与分析。并为后期的健康增值服务提供数据基础。
2.1.3数据分析
将健康数据以JSON的形式存储,为后续的海量数据挖掘、分析、推荐等功能提供基础。
●基于健康数据的运动人群:根据上述采集到的海量数据,通过对每一个数据对象中的年龄、性别、营养摄入量习惯、运动习惯、体重、血压、血糖等维度分析、比对,本系统可以按照健康运动的标准将每一个对象划分至不同的群组。从健康运动的角度而言,同一人群有着相同的身体状况以及饮食和运动习惯。
●基于健康数据的慢性病人群:同样根据采集到的健康数据,本系统可以按慢性病的分类(高血压、糖尿病)以及其所处的不同阶段为标准将每一个对象划分至不同的群组。从健慢性病角度而言,同一人群有着相同的身体状况以及饮食和运动习惯。
●为特定人群提供早期预警健康指导以及相关增值服务:本平台将不断学习并优化面向特定人群的最优的饮食、运动、治疗推荐流程与计划。通过智能手机应用发布相关提示和预警。
2.2系统架构
本平台主要包括两个部分(图1):数据采集和大数据处理。数据采集主要包括对健康相关数据的采集、集成、储存和上传。大数据处理部分主要分析健康相关的数据以及健康增值服务的推送。
图1 飞活健康网平台架构
2.3服务模式的实现
2.3.1健康数据采集
本平台采用了多种数据采集方式:针对个人的采用可穿戴设备和智能手机;针对家庭的采用基于IEEE Continua标准的健康检测设备;针对社区的采用高度集成化的一体机。
a)针对个人的可穿戴设备
计步器:基于蓝牙连接,主要采集个人的运动数据。该计步器可以高效过滤噪声,提高计步算法的精度;并且通过蓝牙和智能手机的连接,随时随地管理运动数据。与此同时,该计步器还支持24小时的全天监控,包括白天的计步以及夜间的睡眠监测。
健康腕带:一种基于蓝牙连接的可穿戴设备。是一种健康体征采集设备,可随时随地记录体温、脉率、环境温度、环境湿度、大气压等信息。通过蓝牙将相关信息传送至手机端。
b)面向健康数据采集的智能手机应用
智能手机集成了诸多传感器。其中,加速度传感器可以采集计步相关的运动数据;手机摄像头可以采集指尖血氧浓度;内置的GPS传感器可以记录用户的行动轨迹。
同时,智能手机也提供饮食数据的采集。通过用户的选择,智能手机应用可以计算出用户饮食的主要能量。首先应用将食物分为主食、肉类、蔬菜等种类,接下来根据对相应种类重量的选择计算出每餐所摄入的蛋白质、脂肪、糖分和热量含量。
c)面向家庭的支持IEEE Continua标准的健康设备
IEEE Continua健康联盟制定了一整套包括基于蓝牙通讯的健康数据采集与传输标准。从家庭方面而言,飞活健康网平台支持所有符合IEEE Continua标准的数据采集设备的接入,比如温度计、血压计、血糖仪等等。因此本平台可以采集更广泛的来自于第三方设备的健康数据。
d)面向社区的一体机设备
面对社区人群,平台提供了集成多种检测和采集功能的一体机,该一体机集成了诸如身高体重、体温、血压、心率、心电图、血氧、血糖等功能。社区使用者可以直接通过身份证来使用,监控多种生理指标。采集后的健康数据将通过互联网直接上传至平台服务器。
2.3.2基于智能手机的健康数据的管理和上传
智能手机应用可以接收来自于可穿戴设备、第三方设备、一体机设备的健康数据。这些数据以JSON的形式结构化并存储。下图展示的是计步数据的存储方式,见图2:
智能手机应用可以管理本地的健康数据,并且提供历史数据浏览、数据对比以及其它功能。因此,用户可以随时随地管理并且浏览其自身的健康相关的数据。
智能手机应用通过无线网络将数据直接上传至服务器,为长期的数据管理和分析做准备。健康数据根据采集时间、种类等维度进行分类。每一个数据文件存储了一天内产生的所有健康数据。智能手机应用可以存储并上传相关健康数据。在默认的配置情况下,用户每次退出智能手机应用都会触发一次上传过程。与此同时智能手机将以时间戳的方式标记最近一次成功上传时间从而避免重复上传的发生。
图2 JSON 数据组织方式
3 数据分析和健康增值服务
数据分析和增值服务主要面向两类人群。第一类是运动人群;第二类是慢性病人群,主要包括高血压和糖尿病人群。对于健康相关数据的分析主要包括分类和最佳生活模式提取。在服务器端,健康数据以JSON形式被存放在Mongodb中,并为之后的挖掘、分析、推荐以及其他功能提供服务。
3.1运动人群
分析模型定义9个维度,分别是:年龄/100、睡眠时间/24小时、散步时间/24小时、跑步时间/24小时、日消耗热量/体重、热量摄入量/食物总摄入量、糖/食物总摄入量、脂肪/食物总摄入量、蛋白质/食物总摄入量。因此可以用9维向量来描述个体的相关体征,比如:a={0.3,0.33,0.083,0.096,0.23,0.121,0.211,0.321,0.312}。
这里我们用余弦相似度[13]来评估两个对象的相似程度:
进一步可以得出a与b两个向量所代表对象的运动生活习惯的相似程度。因此智能分类机制就可以根据对象之间的相似度进行人群的智能划分、形成相似人群的群组,保证每个群组内部对象两两之间相似度的值大于算法所设定的阀值。
在对象按照年龄、睡眠、运动、饮食习惯被划分至不同群组之后,依照该群组的人群的上述特点,系统将会自动学习并提取出属于该群组内部的推荐运动生活方式,该生活方式同样是按照上述9维向量进行表示的。该运动生活方式将会作为推荐的运动生活方式推荐给同群组的其他对象,并依照上述推荐生活方式作为模板对群组内的运动生活方式进行预警与建议,例如:减少糖量的摄入,增加睡眠时间、增加跑步时间等。
3.2慢性病人群(高血压、糖尿病)
对于慢性病人群,除了采集到的健康数据如血压、血氧、血糖等,系统还会对用户在博客、论坛、讨论中发布的相关文本进行分析。
分析模型加入了对健康数据如血压、血氧、血糖的分析,系统同时会追踪并记录用户产生的文本信息并对其分析。分析模型定义了年龄、血压、血氧、血糖、睡眠、运动、饮食等若干维度。与前文所述相同,系统仍然用N维向量来表示对象的特征,基于对象之间的相似度值的大小将对象划分至不同的群组。对于文本的分析与分类,目前主要采取两种方法。
第一种方法基于文档的相关属性,比如关键词、作者、文本长度、发布时间等。第二种方式是基于文本的内部相似度,比如采用的自组织映射方法将文本划分为不同的类别[14]。
基于上述对用户产生的健康体征数据以及文本数据的分析,每一个用户可以更加精确的被划分至不同的类别。系统会动态的自学习并在不同类别的内部根据其人群特点推荐饮食习惯。
与运动人群不同,针对慢性病人群(主要指糖尿病)系统提供了预警功能,主要包括对血氧、血糖、糖分摄入、睡眠不足等事件或生活方式的预警。因此慢性病人群(主要指糖尿病)的饮食睡眠等生活质量将被改善。系统分析方法的流程如图3所示。平台的目的就是通过对健康相关数据的采集、整合、分析、建模,最终提供面向健康的增值服务。
图3 分析过程
4 结果
4.1意义
医疗机构可以利用本平台提高照护的效果与效率,增加用户的满意度,并为医学相关的研究提供服务。平台的多种应用也可使用户采集并管理、浏览自己的健康相关的数据,同时提供基于分析的健康增值服务,为医疗机构和广大人群提供服务。
4.2设计和开发
图1展示了平台架构。飞活健康网平台是基于Android SDK、PHP 和Java开发;并且通过蓝牙、无线、互联网技术进行数据的采集和传输。图4展示了网页端的用户界面。图5展示了智能手机端的用户界面。
图4 飞活健康网平台网页端界面
图5 飞活健康网平台智能手机端界面
4.3实际用例
本平台目前已经被部署至www.fihuo.com,并且有228,499注册用户。
5 总结
本文提出了一种基于大数据分析的移动健康服务平台。结合可穿戴设备、智能手机应用和后台大数据分析的平台,给用户展示长期的基本健康数据和环境数据,并基于深度学习等分析方法用于比较、分析和分类,进而提供诸如提醒、建议、预警等健康增值服务。
致谢
本工作得到了国家重点基础研究发展计划(973计划)No.2011CB302302,国家高技术研究发展计划No.SS2015AA020102,以及清华大学自主科研项目的支持。
参考文献
[1]S.Warren,R.Craft,B.Bosma,“Designing smart health care technology into the home of the future,” Workshops on Future Medical Devices.1999,2:667.
[2]A.Lymberis,“Smart wearable systems for personalised health management:current R&D and future challenges,” Engineering in Medicine and Biology Society,2003.Proceedings of the 25th Annual International Conference of the IEEE,2003,4:3716-3719.
[3]S.Fox,L.Rainie,“Vital Decisions:How Internet Users Decide what Information to Trust when They Or Their Loved Ones are Sick:Plus a Guide from the Medical Library Association about Smart Health-search Strategies and Good Web Sites ,” Pew Internet & American Life Project,2002.
[4]M.Clancy,“Getting to ‘smart'health care,” Health Affairs,2006,25(6):w589-w592.
[5]A.Lymberis,“ Research and development of smart wearable health applications:the challenge ahead ,” Stud Health Technol Inform,2004,108:155-161.
[6]L. Irwig,“Smart health choices,” Judy Irwig,2007.
[7]H.Kao,Y.Cheng,Y.Chien,“ Develop and Evaluate the Mobile-Based Self-Management Application for Tele-Healthcare Service,”IEA/AIE,2014:460-469
[8]K.Elgazzar,M.AboElFotoh,P.Martin,H.S.Hassanein,“ Ubiquitous Health Monitoring Using Mobile Web Services,” ANT/Mobi-WIS,2012:332-339
[9]P.García-Sánchez,J.González,A.Miguel Mora,A.Prieto,“Deploying intelligent e-health services in a mobile gateway,” Expert Syst,2013,40(4):1231-1239
[10]Z.Deng,X.Mo,S.Liu,“ Comparison of the middle-aged and older users' adoption of mobile smart health services in China,” I.J.Medical Informatics,2014,83(3):210-224
[11]K.Kang,Q.Wang,J.Hur,K.Park,L.Sha ,“Medical-Grade Quality of Service for Real-Time Mobile Healthcare,” IEEE Computer,2015,48(2):41-49
[12]V.Ghini,S.Ferretti,F.M-Hippocrates,“Enabling Reliable and Interactive Mobile smart health services,”IT Professional,2012,14(3):29-35
[13]G.Salton,M.McGill,“Introduction to Modern Information Retrieval,”1986
[14]T.Kohonen,“The self-organizing map,” Proceedings of the IEEE,1990,78(9):1464-1480.
A Moblie Health Service Platform Based on Big Data Analysis
SHENG Ming,ZHANG Yong,LI Chao,XING Chun-xiao
(RIIT,Tsinghua University,Beijing 100084)
Abstract:This paper proposes a mobile smart health service platform based on big data analysis - Fihuo,which integrates wearable devices,all-in-one machines,smartphone applications and related big data processing technologies.It can present,manage and compare long-term health-related data and ambient data.Through background data analysis such as intelligent classification and deep learning,Fihuo provides value-added services such as reminders,advices and alarms.
Keywords:Big data; Wearable device; Data analysis; Smart health