APP下载

基于大数据框架的人体健康参数管理分析平台设计与实现

2021-04-04陈小宁罗文佳慕雨欣

信息记录材料 2021年2期
关键词:发病率体温可视化

陈小宁,郭 进,罗文佳,慕雨欣,刘 琼

(西南财经大学天府学院 四川 绵阳 621000)

1 引言

大数据在各个行业不断应用,健康数据因涉及到个人及社会发展而具有重要价值。特别是在老龄化和流行传染病肆虐的背景下,健康大数据不仅给社会提供了及时的数据,还展现了防控趋势。健康大数据管理平台的建立日趋重要[1]。

2 人体健康参数分析管理平台的分析与设计

本文研究工作是设计实现面向线上用户的人体健康参数数据管理平台[2],前期数据收集通过用户填写的数据以及网络获取的健康数据,借助分布式平台实现数据存储、查询、统计及可视化功能,为用户建立人体健康参数管理平台,用户可以了解疾病知识、健康咨询以及健康情况[3]。总体功能包含以下模块:数据清洗、数据存储、数据查询与统计、web前端数据可视化分析。

2.1 数据清洗模块实现

(1)导入数据——数据导入利用Python的Pandas数据包实现,Panda提供了高效地操作大型数据集所需的工具。调用pandas库中的read_csv函数,读取本机的csv文件,对数据进行初步的分析与清洗。(2)缺失值处理——运用.isnull().any()列级别的判断并且进行缺失值处理。

2.2 数据存储模块实现

(1)启动Hadoop——启动成功后输入jps命令查看节点启动情况。(2)上传数据文件,在HDFS中为hadoop创建用户目录,把本地文件平台的’/home/hadoop/data.csv’上传到HDFS的当前用户的input目录下。(3)查询数据——使用cat命令查看在导入数据过程中是否有数据缺失。

2.3 数据查询与统计模块实现

(1)启动Spark——输入:’usr/local/spark/bin/spark-shell’启动Spark,然后导入相应包。(2)读取文件——使用textFile()函数传递一个完整路径的文件名,把data.csv文件加载到RDD中。(3)SparkSQL数据分析,使用RDD中的first函数返回RDD查看文件内容,查看数据字段是否上传完整,数据去重,结果添加到Mysql数据库中。

2.4 Web前端及可视化分析

2.4.1 主页

主页包括本平台的Logo、导航、核心主题以及各个页面的链接,给予新用户对本平台一个大概的了解。

2.4.2 疾病库页

可以查看当前所有的科室,选择相应的科室查询相应的疾病信息。根据用户所选的疾病,平台可以返回该疾病的详细介绍。

2.4.3 个人档案页面

通过填写相应的表格,完善自己的健康报告,并可以即时查阅健康数据,获取相关建议。

2.4.4 数据分析化页面

根据健康数据库中的数据,展现各种统计图,用户可以查看整体的健康情况,医疗机构当前的健康趋势制定政策,早做好防治措施。目前数据分析包括:高血压及相关因素分析、身高体重分析、睡眠分析、人体温度心率及性别分析和步数分析。

2.4.5 健康前沿页面

当期的医疗健康热点、资讯的宣传,丰富网站内容。

3 数据可视化分析

高血压及相关因素分析——从年龄段来看,40~60岁都是高发期;从职业来看,工人发病率最高;从性别来看,女性发病率高于男性发病率;从区域分布来看,城市发病率高于乡村发病率;总体来说,高血压的产生会受很多因素的影响,比如男女由于体质因素、身高、年龄、血黏度、精神状态、生活节奏、个人差异、饮食习惯、遗传等等。

身高体重分析:可以看出,女性的身高分布区间大概在148 cm~184 cm,体重大概在42 kg~105 kg,平均身高为160 cm,平均体重为60.6 kg;男性的身高分布区间大概在158 cm~198 cm,体重大概在55 kg~155 kg,平均身高为180 cm,平均体重为78.14 kg。

睡眠分析:约四分之三的人认为自己没有拥有充足的睡眠,同样有四分之三的人睡觉时要把手机放在伸手可及的地方,说明手机的放置位置对睡眠有一定程度的影响;据统计,每晚睡7个小时的占比最高,其中劳累程度为3等级的人最多。

人体温度、心率及性别分析:女性的平均体温略高于男性,女性的新陈代谢比男性快,体温会高0.2℃~0.5℃左右;总体来看,人体温度约为36.8℃。

心率分析图:女性平均心率略高于男性,约为74次每分钟;男性平均心率约为73次每分钟,总体来看,女性的平均心率高于总体平均心率,患心律失常的比例会更高。

体温与心率相关性分析:心率与体温呈正相关,人体发热时,心率会加快,体温每升高1℃,心率平均增加12~18次/分;而低温麻醉时,心率会减慢。体温的高低在一定条件下会影响心率的速度。

4 结语

本论文以用户的健康参数数据作为切入点,设计并实现了基于大数据框架的人体健康参数管理分析平台,借助云平台,大数据的优势,给予用户健康数据的查询统计分析等服务,不仅让用户更便捷地了解到自身的健康状况,同时提供给了相关医疗健康部门数据,从而做到更好的防控治疗。

猜你喜欢

发病率体温可视化
体温低或许寿命长
基于CiteSpace的足三里穴研究可视化分析
思维可视化
多晒太阳或可降低结直肠癌发病率
体温小问题,引出大学问
基于CGAL和OpenGL的海底地形三维可视化
体温值为何有时会忽然升高?
ARIMA模型在肺癌发病率预测中的应用
“融评”:党媒评论的可视化创新
老年人的体温相对较低