健康数据科学学科建设现状及在健康医疗领域的应用
2023-10-28范美玉
范美玉
大数据及相关技术在健康医疗领域的深度融合[1],不仅让健康医疗大数据的价值凸显,同时也为数据治理及挖掘分析带来了难题。健康医疗大数据涉及医学研究、统计学、健康信息学、卫生信息管理、数据科学、人工智能和神经网络等多个领域,需要一种科学的方法来研究与利用。结合健康医疗领域背景知识,以数据科学方法为工具,研究健康医疗大数据的应用与分析,正是打开数据“矿藏”的钥匙。
1 健康数据科学的概念
1.1 概念由来
21世纪以来,大数据浪潮席卷全球,数据密集的健康医疗行业成为大数据应用的重要领域。人类生命全周期所产生的生理、心理、疾病预防诊疗和健康管理等多领域数据的聚合形成了健康医疗大数据[2]。临床医生不仅是数据的生产者、使用者,还是数字化产品的评价者。然而,大部分临床医生却不懂得如何科学利用数据资源和技术手段来提升临床诊疗和科学研究[3],健康医疗大数据的应用也存在数据质量不高、数据利用不足、医学伦理等问题[4]。人们开始意识到需要一门围绕着如何利用健康医疗大数据开展研究及临床应用的新学科,因此,健康数据科学由此应运而生。
1.2 概念内涵
有学者认为,健康数据科学是一项以改善生命健康为目标,致力于提高个人或群体医疗数据收集、管理和分析能力的科学工作,主要聚焦于生物医学与健康领域的信息技术、数据分析及因果关系哲学等内容[5]。也有学者认为,健康数据科学将计算机科学、生物统计学、流行病学和临床医学等作为主要知识体系内容,采用跨学科的思路和方法挖掘健康医疗数据的价值,结合领域知识形成洞察力,最终赋能健康医疗实践[6]。综合各家观点来看,健康数据科学(health data science)是一门新兴的交叉性学科,可以从以下4个角度理解其内涵:①研究对象为健康医疗大数据;②理论基础涵盖数据科学、统计学、机器学习、生物信息学、卫生信息管理、医学等多学科;③研究内容涉及数据收集、存储、分析与可视化等全生命周期管理与数据产品开发;④研究工具为数据科学方法,如医学统计学方法、大数据分析处理方法、深度学习方法等[7-9]。
2 学科发展现状
2.1 国外状况
2014年,英国斯旺西大学最早开设健康数据科学学科。随后,国际上比较知名的学府都设立了健康数据科学专业的不同研修课程项目,如斯旺西大学医学院、哈佛大学陈曾熙公共卫生学院、杜克大学文理学院等开设了健康数据科学硕士课程,牛津大学大数据研究所牛津EPSRC健康数据科学博士培训中心、苏黎世联邦理工学院开设了健康数据科学博士或博士后课程。还有一些科研院校在交叉学科专业下设健康数据科学研究项目与科研团队,如关注精准癌症早期检测、治疗和预防的耶鲁大学医学院放射治疗系Deng教授团队,以及专注于数据科学理念、方法与临床工作流程融合的康奈尔大学维尔医学院公众健康科学系健康信息学部王飞副教授团队。
2.2 国内状况
2018年,北京大学健康医疗大数据国家研究院最早在“医学技术”一级学科下设“健康数据科学”二级学科,并于2020年开始“健康数据科学”专业的研究生培养工作,陆续开设“健康数据科学概论”“开放数据获取与医学知识发现”“健康数据可视化”等课程,以“Data for Better Health”为理念协办国际英文期刊Health Data Science,举办“北大医学健康数据科学学科发展研讨会”,同时与英国曼彻斯特大学(生物、医学与健康学院)开展健康数据科学学科共建合作。得益于良好的生态环境,涵盖卫生健康政策与技术、流行病学数据共享、全球健康大数据等多个领域的17个研究中心已落户于北京大学健康医疗大数据国家研究院,产出了多项成果。北京大学健康数据科学的学科建设与发展也带动了国内其他高校,如东南大学苏州联合研究生院开展了电子信息专业健康数据科学方向的专硕培养工作,厦门大学成立健康医疗大数据国家研究院创新团队、经济学院数据科学与健康医疗大数据团队。
3 健康数据科学的应用场景
3.1 卫生健康政策支持
随着云计算、大数据、物联网、人工智能等新一代信息技术的发展,数据驱动的卫生健康政策制定模式变得越来越重要。一方面,借助先进的信息技术,医疗卫生行业政府管理部门在决策前可以掌握更多更精准的信息,如基于大数据与人工智能技术的全球权威新冠病毒疫情预测模型、定量评估不同公共防控政策对新冠疫情控制效果的研究都成为政府疫情政策制定的数据智囊库;另一方面,在政策实施过程中,应用大数据和人工智能等技术,医疗卫生行业政府管理部门能够实时收集分析用户意见数据、政策实施数据,识别出潜在的关联关系,并建立预测模型,用于政策实施后的效应仿真模拟与优化[10],如利用区域医疗大数据或层次结构数据评价医疗政策实施效果[11]。
3.2 临床数据科学发展
医学影像智能诊断、疾病风险预测、临床决策支持等都是目前健康数据科学在临床医学中的应用体现。在放射肿瘤学中,临床医生可以借助数据科学方法获取高维生物标志物数据,并将其与临床结果、领域知识融合在一起挖掘分析,最终获得有价值的信息用来改善癌症患者的治疗[12]。在疾病风险预测与诊疗中,健康数据科学知识与方法的应用可以使已有的多模态数字化数据得到最大化利用,提升整体疾病诊疗效率和质量,如钟南山团队应用人工智能等健康数据科学方法构建的新冠病毒感染危重预测模型的准确率达到88%,可以快速分流就诊患者,有效提高ICU病房和呼吸机等医疗资源的分配效率,也能为临床医生提供快速诊疗和护理建议。健康数据科学在疾病监测方面也发挥了极大的作用,以肾脏疾病为例,美国、加拿大等大数据发展较早的国家最早建立全国性的CKD监测网络用于实时监测肾脏疾病数据,近年来建设的“中国肾脏疾病数据网络”推动了适合我国国情的、基于临床专科优势资源的跨学科大数据应用模式发展[13]。临床试验也迎来了数字化、智能化发展的大趋势,出现了诸如可实现一体化智能化整合管理的临床试验平台,支持同时开展队列研究、病例-对照研究和横断面研究等多种类型临床试验,涵盖方案设计、招募入组、随访、数据分析、质量控制全过程[14]。
3.3 高质量的医院管理
在医院精细化管理方面,依托医疗大数据中心,基于深度学习算法、大数据分析、知识可视化等技术,医疗机构能够整合管理数据、实时监测数据、发现知识、可视化展现,进而及时发现医院管理疏漏,科学精准改进,把临床服务者的焦点专注到满足患者诊疗和健康管理需求上,以获得更高效率、效益和更强竞争力。在医患关系方面,基于健康数据科学的智能化医疗应用不仅可以影响人们的健康信息行为,缩小医患之间的信息鸿沟,也可以减轻医生的诊断压力,提升患者参与度,从而获取更多有价值的信息,减少误诊率,最终提高患者满意度,有利于创建良好的医患关系[15]。
3.4 个体化健康管理
传感器网络、移动通信技术、可穿戴设备、大数据技术等新型信息技术,可有效帮助个人健康管理。通过不同渠道实时采集的运动、心率、睡眠、血压、心电、脂肪率等健康指标加上个体数据形成个人健康档案库,结合人工智能算法,提出并及时调整个性化健康管理方案,实现智能的个体健康管理。基于数据的预测,可输出患者发病风险评估、预测、预警,为疾病进行有效的预防控制提供建议。
4 总结与展望
借助数据科学的方法和信息化工具,健康数据科学能够有效获取、处理和分析健康医疗大数据,在卫生健康政策与卫生管理、医疗服务、医院管理、个体化健康管理等方面发挥积极作用。国内外在健康数据科学学科建设、人才培养、真实世界医疗场景应用研究等方面取得了一定的成效。目前,我国恰逢医院高质量发展的时代机遇,信息化支撑作用将得到进一步强化,新一代信息技术与医疗服务融合将更加深入,数据的采集、存储、管理与利用将更加科学合理,健康数据科学的发展方向必将得到拓展,以临床医护人员等为主的健康数据科学家更应积极主动参与其中,以更好地推动健康数据科学的可持续发展,营造良好的健康医疗数据生态。