唤醒沉睡的医疗大数据
2020-12-25张欢
张欢
大数据时代,“高精尖”临床医学研究离不开多家医疗机构数据的协同分析和有效利用。研究数据显示,目前被利用的临床数据只占医疗总数据的10~20%,如何挖掘各医疗机构中沉睡的海量数据并深度利用,有着重要的理论意义和临床实用价值。
近日,《中国信息化周报》记者采访到了之江实验室网络健康大数据研究中心主任,同时也是浙江大学博导的李劲松,就医疗大数据挖掘和利用相关问题进行了讨论。
来自之江实验室的科学家们,建立了多中心智能医学信息平台,研发了国际先进临床数据治理、超大规模电子病历知识图谱、领域最高效多中心临床数据同态加密等技术及工具,实现了一站式、跨机构、无障碍的多中心临床数据深度利用。
目前,多中心智能医学信息平台已完成浙江省内多家医院的数据清洗和接入工作,覆盖1400余万患者全诊疗数据,可对近20年的临床数据进行回顾性协同分析研究。这是国内首套最完整、可支持跨国研究的多中心临床数据协同利用平台。
之江实验室构建的超大规模完整电子病历知识图谱系统,涵盖了18个临床术语集、3500多万医学关系以及9600万医学文献知识,等等。为打破医学知识孤岛贡献了强大力量,在跨科室疾病风险早期筛查,慢性疾病个性化管理与随访等环节开展了示范应用,效果显著。
医疗大数据利用
属新兴技术领域
前文提到研究数据显示,目前被利用的临床数据只占医疗总数据的10~20%。对于医疗数据共享程度低这一问题,李劲松将原因概括为两点,一方面是考虑到数据共享有泄露患者隐私的风险,另一方面也是臨床数据利用过程中,数据拥有方、数据利用方之间利益分配模式不清晰,缺乏驱动力。
同时,李劲松也表示:“医疗大数据的利用是近年来刚刚兴起的新技术领域,目前还没有固定的模式。可以通过建立高效的数据治理体系、研发数据安全利用技术、提供高效临床数据有效利用的工具等方式,‘唤醒沉睡的医疗数据,为患者带来真正的利益。”
对于大家关心的,如何平衡临床数据需求和患者隐私两者之间的关系,李劲松说:“患者隐私及数据安全是红线,同时临床数据利用需求也是客观存在的,不利用就不能展现它的价值。两者的平衡一方面需要从技术层面解决,做好数据利用过程中安全及隐私保护,另一方面需要保障数据拥有方和利用方的利益,使得双方都能从数据利用中获利。”
医疗数据共享是世界性难题
医疗大数据共享是全世界都在关注,并且致力于解决的问题。目前,主要存在以下几个方面的阻碍。
一是临床数据安全及隐私保护十分重要,很多医疗机构是出于数据安全及隐私保护顾虑,不愿意共享。
二是医疗数据共享的获益机制尚不健全,缺乏患者、医院以及数据利用方均能有效获益的分配模式,造成数据共享及利用缺乏源动力。
三是数据共享存在技术壁垒,不同医疗机构信息系统庞杂,临床数据标准化程度低,如何实现多中心、大规模临床数据共享面临技术挑战。
李劲松表示:“解决医疗数据共享这一世界性难题,需要解决包括以上三个问题在内的技术性和政策性障碍,路阻且长。”