基于大数据的中医文献数据挖掘
2017-11-27刘海涛游桂增王洁于雪玉
刘海涛+游桂增+王洁+于雪玉
摘 要:自中国药学家屠呦呦获得2015年诺贝尔生理学或医学奖之后,人们对中医药就愈加重视,本项目将中医与农产品相结合,致力于打造一个个性用户食用个性农产品,因人而异指导人们吃得更健康的基于大数据分析挖掘的平台,该系统包含三个子系统,由网站作为前端为用户提供简单、便捷的服务;以济南超算中心为后端提供数据的存储、分析、挖掘功能;由山东农业大学农业大数据中心专业网站为用户提供统计数据及建议,形成完整的服务、研究、生产一体化学科交叉型大数据挖掘体系,挖掘出农产品在历代中医文献中的相关记载,努力为国民健康做贡献。
关键词:数据挖掘;中医文献;大数据存储;健康中国
中图分类号:TP393 文獻标识码:A 文章编号:2095-1302(2017)11-00-02
0 引 言
根据第六次全国人口普查数据可知,我国农村居民为6.74亿人,看病贵问题依然突出,其症结在于医疗保障体系不够健全,大部分群众就医依然靠自费;公立医疗机构倾向于市场化,淡化了公益性质。很多人普遍存在着 “小病不用去医院”的观念,最终却因为这些观念被“小病”要了性命。
我国的中药文化博大精深,源远流长。几千年来,中国人形成了自己的用药理念和方法。与西药相比,中药的优势在于它取自动植物和矿物质,大部分属于天然产物。因此,中药的不良反应轻于西药,毒副作用较小。而且中药与自然有着密切联系,容易获取。
本文的灵感来源于屠呦呦荣获诺贝尔奖事件。通过创建基于R语言平台的数据挖掘技术,建立中药数据库,利用计算机代替人工进行精确查找,大大提高了采集数据结果的准确性、全面性、权威性,明显缩短了数据挖掘所需时间,极大限度地减少了人力资源消耗。
1 研究方法
1.1 数据挖掘
基于历朝历代中医古籍和国内外权威中医论文,挖掘出农产品在所有中医古籍中的相关记载以及某一类疾病在所有中医古籍中的相关记载。
1.2 数据库构建
利用已拥有的中医古籍和国内外权威中医论文及其他合作院校所提供的数据资料、网上发表的论文等有效研究资料可建立数据库,通过搜索查找到中医古籍对农产品的描述。同理,如果想知道不同体质的人群是否适合吃某一类农产品,也可通过搜索获得。根据这些参数,利用统计软件R,根据已建好的可靠的数据模型对数据进行分析、计算,得到最佳健康结果,实现健康生活。数据库的建立工作是长期的,因为随着时间推移,农产品性质会发生潜在变化,所以要时刻将最新数据导入数据库,及时更新。因此,应详细搜集全国各地区的农产品资料并及时更新数据,将其存入数据库中,不断完善数据库,完善的数据库会使分析结果更加准确。山东农业大学农业大数据中心已经搜集并存储了多年的数据。
1.3 大数据平台的构建
本研究将在广东超算中心(天河二号)的基础上构建大数据分析与挖掘平台。充分利用大数据平台的资源构建算法结构,实现在中医和农产品大数据方面的采集、存储、处理与分析挖掘等功能,以获得更精准的数据信息。研究Linux平台下数据库的构建及应用,用以存储农作物相关参数,实现在数据量大的情况下的快速检索。
1.4 搭建应用平台
运用数据库等知识搭建好网站后台,运用Wordpress、PHP、JSP等技术搭建网站前台页面,免费提供给人们一个便捷、交互性强的平台。所谓个性苹果网站即为个例与健康的结合。建立了异于他人的双向搜索界面,实现个性农产品和个性用户的双向个性搜索;针对个性用户、个性农产品、个性群体、个性交流(社交),平台开展了从每个个体的健康指导到相似群体的健康交流;个性苹果项目为非营利项目。其显著特点是为社会提供的服务和可供使用的功能不收取任何费用,目的在于服务社会、服务人民,为人民提供便利与健康。
2 研究过程
个性苹果网站搭建如图1所示。
3 结 语
(1)个性用户。客户可以通过输入自己独特的健康状态,查询最符合自身状况的可食用农产品排名顺序,得知自己最适合吃的食物品种,哪些农产品对自己的身体最有利,最能改善自己的身体状况,同时平台也会为用户筛选出忌食农产品,食用哪类农产品不利于自身健康,甚至会加重病情。通过食物疗法为每一位用户提供个性化的健康保障方案!对于符合自己健康状态的农产品,平台将提供最权威、最安全的电商平台的相关链接。
(2)个性农产品。客户可通过输入某一种农产品查询到忌吃某类农产品的群体,通过比对得知自身状况是否适合吃此种农产品,同时本研究利用中/西医的研究成果,为每一位用户阐明原因。
(3)个性群体。研究团队为每一类群体提供健康计划,比如小孩、老人、孕妇、生病群体等。就小孩而言,可为每一个年龄段、不同体质的孩子提供健康成长计划,从饮食、生活起居等各方面为孩子提供一个有助于其成长的方案,同时用户再根据自身状况,将自己的各项相关指标反馈给平台,研究团队可及时调整相关解决方案。
(4)个性交流(社交)平台。相同群体交流:根据用户的个性注册信息,向用户精准推荐好友,为每一位用户找到与自己“志趣”相同的小伙伴,彼此交流各自的心得,为自己的健康、成长、生活方式等找到更多的可参考方案;不同群体交流:每一位用户都可以选择自己感兴趣的群体,平台将根据用户的选择,推荐每一位用户想要交流的群体,使每一位用户的生活更加丰富多彩!(注:为保护用户隐私,社交平台不采用实名制)
(5)非营利性:个性苹果是为社会公众提供健康指导的非营利项目,其目的在于服务社会、服务人民,为大家提供便利。
参考文献
[1]王元卓,靳小龙,程学旗.网络大数据:现状与展望[J].计算机学报,2013,36(6):1125-1138.
[2]罗旭,刘友江.医疗大数据研究现状及其临床应用[J].医学信息学杂志,2015,36(5):10-14.
[3]王璐,祁兴华,虞舜.论中医文献数字化研究[J].中国中医药信息杂志,2015,10,22(10):1-3.
[4]吴桂英.中医古籍文献数字化建设的实践与思考[J].医学信息学杂志,2010,31(4):54-56.
[5]焦振廉.试论中医药文献的数字化研究[J].中医文献杂志,2004, 22(4):30-32.
[6]王嘉男,张立震,王柏林,等.基于物联网技术的运动规划系统设计与构建[J].物联网技术,2015,5(4):103-105.
[7]黄文乐.基于大数据的线上线下电商用户数据挖掘研究[J].电脑知识与技术,2015(12):10-11.
[8]邢丹,姚俊明.面向医疗行业物联网:概念、架构及关键技术研究[J].物联网技术,2014,4(11):49-52.endprint