基于大数据交汇的中医“治未病”知识服务与临床应用系统构建*
2024-04-16邝秀英李敬华李国祥李显红赵为民
邝秀英,于 琦,李敬华,李国祥,李显红,赵为民,姚 璠
(1.广州中医药大学第一附属医院 广州 510405;2.中国中医科学院中医药信息研究所 北京 100007;3.长春中医药大学附属医院 长春 130117)
中医“治未病”是早在《黄帝内经》时代就产生的疾病观念,《素问·四气调神大论》:“是故圣人不治已病,治未病,不治已乱,治未乱,此之谓也”[1]。随着我国逐渐步入人口老龄化社会[2],慢性疾病渐进加重、长期带病生存的状态已现端倪,仅注重短期诊疗即康复的医学模式已不能满足人类健康的现实需要,对于临床上一些病程漫长、病情渐进加重、难以逆转的慢性疾病的研究重心开始逐渐前移[3]。而医疗技术的提高带来寿命延长,也使预防医学观念深入人心。伴随计算机技术的蓬勃发展,大数据、云计算、芯片、传感器等领域不断创新与进步,迎来了以深度神经网络为核心的第三次人工智能浪潮[4],计算机-医疗结合大数据健康成为新兴产业。数据挖掘、深度学习以及人工智能领域飞速更新,基于现有数据进行规范处理与机器学习后获得的经验,由计算机分析案例提供医疗经验成为可能。在长期发展过程中,中医累积了大量原始诊疗数据与成功案例,遗憾的是限于学科发展特点,其规范化与系统化尚有欠缺,庞大优质的数据尚不能直接为临床提供客观标准化的养生去病建议,而临床中医师培养的供需失衡和经济制约则为患者早期医疗活动带来诸多限制。基于此,借助新兴计算机技术而为患者提供日常养生服务和早期医疗建议的思路应运而生。通过结合大数据方法与中医“治未病”经验的新兴理念来构建健康卫生数据库,成为研究探索重点、热点。
1 中医“治未病”知识库研究现状
随着经济社会的发展,国内外对有关中医方面养生知识的需求越来越大[5],中医医院通过开展“治未病”中心,提供技术适宜、形式多样、服务规范的全面、系统的中医预防、养生、保健、康复服务[6],中医药服务特色优势明显呈现,“治未病”网络逐步建立,二级以上中医医院均设立了“治未病”中心(科),开展了中医健康体检、干预和咨询等中医治未病服务[7],成为改善人民身体健康的重要手段。治未病中心是以中医治未病理论为基础,结合健康管理方法形成的中医健康管理部门[8],更强调预防和健康维护,通过调整生活方式、饮食习惯、情绪管理,在辅助指定个性化的诊疗方法、促进整体健康,甚至提升公共卫生水平,促进综合性的医疗模式,可以更好地满足患者的需求。例如:中药穴位贴敷结合十二时辰养生防治原发性高血压在证候积分、总有效率、诊室血压等方面均有积极的统计学意义[9],而中医养生理论主导护理策略引入靶向药物治疗的晚期肺癌患者有助于降低不良反应事件发生率,且能改善其严重程度[10]。陈晓燕等通过中医养生疗法防治高脂血症,发现接受辛伐他汀联合中医养生治疗的观察组患者,其临床治疗有效明显优于对照组[11],体现出中医“治未病”的思想。治未病科专科以治未病疗法为特色,开展多种治未病项目,对多种民间濒临消失的治未病疗法,进行抢救性的挖掘与保护[12],显示出了构建中医“治未病”知识库的必要性和紧迫性。
近年来,伴随着疾病谱的改变、老龄化社会的到来和健康观念的转变,中医药的优势和特色越来越受到重视,并受到国际社会越来越多的关注,仅注重疾病诊疗的医学模式已不能满足人类健康的现实需要,随着时间的推移、AI系统数据库中各相关变量数据的日益完善。20世纪90年代中期后,预防医学得到广泛关注,利用病历数据库对每个患者单独进行疾病管理成为可能,中医“治未病”以其丰富的内涵而受到健康管理者的青睐。构建卫生健康数据库成为研究探索重点、热点。
为顺应中医药信息化的发展趋势,中国中医科学院中医药信息研究所率先对中医临床知识库的构建技术与示范应用进行了相关探索。李建宇等[13]建立慢性乙型肝炎治未病循证医学数据库,用以收集、分析患者的临床资料,并探讨该系统的应用价值。崔一迪[14]对寻常型银屑病中医诊疗本体知识库的构建与应用进行了研究。针对当今疫情的发展,王斌等[15]建立了支持新型冠状病毒肺炎的中医智能处方推荐和知识库系统。陈士升[16]对中医临床疗效评价中数据库的选择和使用进行了研究。张早华等[17]对亚健康中医干预数据库数据结构进行了相关探讨。
2 “治未病”古今文献知识库的构建
中医“治未病”知识库是关系型数据库,是在中医治未病分类体系的指导下,设计合理的存储方式和关系模型,存储中医“治未病”相关知识,如“未病先防”“既病防变”“养生保健”等相关文献知识,以方便科研和临床的信息获取。通过识别和筛选与中医治未病相关的现代文献和古籍,建立面向中医治未病专题的古今中医文献知识库。录入并维护治未病古籍文献医案元数据,包括有关典籍的年代作者和内容提要、医案的医家和基本要素等,建立中医治未病相关文献医案的元数据仓库。再对文献内容进行语义分析、标注和归类,从而建立中医治未病相关文献的主题索引和分类索引,以支持知识查询功能。
大数据平台作为各系统的信息“桥梁”对信息进行集中存储处理[18]。具体疾病文献数据主要来源于中文数据库如中国知网(CNKI)、万方(Wanfang)、维普(VIP)、中国生物医学文献服务系统(SinoMed),英文数据库如EMbase、PubMed、Cochrane Library。其年份范围:自建库起至2022 年,包含符合中医“治未病”思想的1949年以前的古籍和民国中医图书文献、1949年之后的图书文献与期刊文献,并标注文献来源。共纳入《黄帝内经》《难经》《伤寒论》《金匮要略》《太平圣惠方》《圣济总录》《养老奉亲书》《素问病机气宜保命集》《遵生八法》《治未病四要》《寿世保元》《随园食单》(如图1)等包含中医养生及治未病思想的古籍。现代文献主要来自于期刊文献,通过CNKI、万方、维普等,以“治未病”为主题词进行主题检索,获得相关文献6000余篇,包括理论、临床、政策、实验等多方面的相关文献。通过数据清洗、知识获取、语义标注,逐步形成中医“治未病”古今文献知识库,同时基于文献,进一步整合中医治未病理论体系下的相关内容,包括但不限于治未病保健经验和方法、具体操作规范,包括:①各种疾病的病前状态、亚健康人群的调养方案等;②特殊人群如儿童、育龄妇女、女性孕前、男性育前等的健康调养方案等;③各种疾病的临床防治经验、常用方剂、中药、膏方、针刺、艾灸、推拿、耳穴、穴位按摩、食疗药膳、治未病功法等。并利用中医药主题词表、中医临床术语等规范性的术语系统,采用基于规则的方法进行治未病知识的实体抽取和数据标注,自动提取文献的关键信息,经过行业权威的中医文献研究团队的审核。最终形成规范而全面的“治未病”相关内容知识库,力求保证内容的专业性和实用性,为日常保养和疾病调护提供参考。
图1 中医治未病古今图书文献
3 “治未病”名医医案信息结构建立
在海量文献中,包含了大量中医治未病相关的临床实践经验,是弥足珍贵却未加整理的待挖掘传承的内容。因此本研究在中医“治未病”理论框架下,通过摘录专著、论文、报刊、病例数据等途径广泛收集名老中医治未病的临床经验,进行知识提取规范、加工整合,通过人工标注和机器标注相结合的方法,对医案中包含文章标题、作者、摘要、关键词、来源、年月、卷、期、页码、疾病名称、原文pdf 附件外,研究信息包括西医病名、中医病名、中医辨证、疗法类别、疗法名称、干预措施、全部观察指标的名称和分类、每组结果等具体信息等内容进行标注,通过基于BERT 的实体抽取的方法,将大量的医案进行抽取、存储,从而建立名老中医“治未病”医案知识库,以提供医案的知识检索、知识挖掘和辅助诊疗提供知识服务(如图2)。
图2 中医“治未病”名老中医医案知识库
4 “治未病”特色医案数据的挖掘
中医“治未病”知识服务与临床应用系统构建结合大数据计算机技术,对于蕴含在治未病医案中的临床经验、学术思想进行客观化分析。在前期建立的治未病文献知识库和名医经验知识库的基础上,采用数据挖掘算法进行经验发掘。为了实现中医治未病数据挖掘,首先需要对所录入医案进行标准化处理。在前期术语研究的基础上,引入《中医药学主题词表》[19](2008 版)、《中药大辞典(第二版)》[20]、《中医临床诊疗术语国家标准(证候部分)》[21]、《中医临床诊疗术语国家标准(治法部分)》等作为规范术语。对治未病医案中涉及到的例如临床表现、治法、穴位、中药等相关内容进行规范化处理,从而综合运用语义分析、机器学习、人工智能、知识图谱等大数据技术对海量数字资源进行分析和挖掘,探求数据之间的相关关系,发掘隐形知识和潜在价值,满足用户的知识需求[22]。
加载中医领域常用的频次统计、关联分析、复杂网络分析、聚类分析等算法。通过频次统计探究高频药味、药性,通过关联规则分析药对、角药、药-证关联,通过复杂网络分析药组配伍,通过聚类分析可分析组方思想或辨证规律等。事实上,这一数据挖掘技术已经被应用于现代科研,如在“治未病”的数据挖掘方面,戴和森等[23]采用统计分析发现周大勇医师调治亚健康中药处方中的四气五味归经等特点;采用复杂网络的方法,发现周大勇医师调治亚健康中药处方以薏苡仁、山药、甘草、陈皮、白术、白扁豆、砂仁、茯苓等为重要度较高,且相互关系较密切。对周大勇主任178例处方中药物使用频数≥35的29味中药进行聚类分析,得到聚类树状图配伍使用(如图3)。在此基础上,再根据功效进行分类,结果可分健脾补肺渗湿、解郁安神、温补元阳、益气养阴、清利湿热5类,深入发掘了名医治疗亚健康的用药规律,对临床治未病有一定的指导意义。
图3 治未病文献数据分析
“治未病”数据挖掘系统从治未病的理法方药出发,如治未病的气血理论,三因制宜方法,体质辨识辨证,膏方针灸等治疗方法等,从“病、证、方、药、效”等多个角度进行数据挖掘分析,从而形成中医治未病特色的数据挖掘系统,为治未病临床提供辨证思想、取穴特色、用药规律等方面的分析,支撑临床研究。
随着5G 时代的到来,通过互联网远程会诊、云诊断治疗可以推动医疗下乡,并帮助中国传统治疗方法走向全球[24]。互联网医疗发展具有智能辅助决策功能的“云门诊”解决方案将成为一种趋势。汇总近年来中医药智能诊疗的行业发展,包括四诊信息采集、电子病历管理、诊断决策系统和管理服务方案的探讨,发现相关的研究不胜枚举,都为云诊疗的实现做出了尝试和探索。“中医治未病特色云门诊系统”以前期建立的知识库为基础,采用知识图谱、深度学习等技术,通过门诊系统采集患者基本临床表现信息,在专业医师的监督干预下,按照习得的经验辅助医生进行病情分析、诊疗决策。通过AI 决策的功能,为治未病医疗工作者在诊疗过程中的诊断辨证、立法处方提供参考,指导疾病预防、病中疗养、愈后康复。
5 总结与展望
中医治未病理论是中医药的特色理论,具有预见性、整体把握等优点,在健康促进中优势独特,其概念明确,实践超前,且辨证识机以宏观调控为重点[25],贯穿了预防的理论、干预调摄药物或非药物疗法、病后保养的养生方法等,安全有效地挖掘学习医疗大数据中蕴含潜在巨大价值,对于提高医学研究水平和临床服务质量具有重要意义[26]。数据挖掘是复杂科学研究的热点之一,在社会、生物学、商业、通信和计算机网络等领域广泛应用[27],通过广泛获取古今治未病文献数据,在治未病理论框架下进行系统梳理、知识提取、数据挖掘,形成了可进行知识查询、知识展示、知识编辑和知识挖掘于一体的治未病知识服务平台。在此基础上,结合治未病科室的应用场景,建立治未病特色云门诊,将知识库与临床相结合,充分利用人工智能的技术,为治未病临床提供辅助诊疗支撑。完善的中医治未病知识库的构建和临床应用有其过程及规律,需要有激励机制,需要知识、经验的积累[28],在今后的工作中需要从以下4方面进行研究。
①完善提升治未病知识图谱的智能可视化。由于知识图谱的三元组目前还不能自动构建,不能完整展示整个的治未病的知识体系,需要进一步研究知识图谱的自动抽取技术,从已有的文献中,提取知识和关系,从而完善治未病知识图谱的构建。②逐步提升云门诊系统的准确性和可靠性,基于知识图谱、深度学习的相关算法,实现关联推荐、知识导航、知识问答、关系推理,从而为临床医生提供中医治未病知识推荐、文献参考和辨证处方的建议,从而辅助临床诊疗。③是完善中医治未病知识服务模式,从健康管理的角度出发,设计个人的中医健康信息病例库[29],收集用户的个人健康信息,以中医治未病知识库为基础,综合个人体质、既往病史、现代医学检验指标等进行判断,据此向用户提供个性化知识推介和服务,让基层医疗和基础保健强大起来,助力国民医疗健康水平的切实提升[30]。④由于本系统处于研发的初级阶段,尚需要大量数据支撑,并在文献自动筛选和提取方面提高系统自动化水平,提高证据的质量,使文献、知识、信息与临床需求相结合,开发具有学科特色、专业特色的治未病资源集合,体现中医“治未病”知识服务与临床应用系统构建的核心价值。