数智赋能人类健康管理
——中国科学技术情报学会健康信息学专业委员会2023 年年会分论坛纪要
2023-04-23整理彭雪莹张康辉汪璠
整理:彭雪莹 张康辉 汪璠
中国科学技术情报学会健康专业委员会于2023年5月在武汉大学信息管理学院举办了“中国科学技术情报学会健康信息学专业委员会2023年年会”。本次议程包括五个主旨报告和三个分论坛。三个分论坛主题分别为:在线健康社区用户信息行为、AI赋能的用户健康信息实践研究、健康信息学的理论探索和实践趋势。在分论坛中,发言专家介绍了各自团队的新近研究成果,并与参会者进行了充分的交流互动,涉及和关注到的很多问题已经突破了具体的研究本身。我们把学者们的观点和研讨结果进行了细致梳理和重新组织,精炼整理成这份非常规的纪要,希望为大家带来有益的参考和启发。
1 数据和研究模型,谁先行?
在研究中,是先获取数据还是先设计理论模型?
很多的计量研究多数是以数据为驱动,一般来讲大多数研究是先有数据再有模型。最初会有一些相关的想法,但是没有数据,所以就会被搁置。后面找到了合适的平台后,会先进行一个小型的探索性研究。数据是非常重要的,但是如果说理论梳理不够,对理论的把握不充分,故事的逻辑不够清晰,也很难发到好的期刊。理论上来讲要做一个好的研究,应该是两头走。你既要设计你的模型,又要考虑你的数据。因为往往你设计了很完美的模型,但没有数据也无法进行深入研究。有一些人可能会认为理论分析不重要,但是理论分析对于学写论文,学写基金申请书都是重中之重。
2 数据分析中的因果性
在研究领域,因果性和相关性的区分与应用成为了重要议题。一般来说,相关性描述的是两个或多个变量之间的统计关联,而因果性则涉及到一个变量如何影响另一个变量。
在许多研究方法,例如深度学习中,相关性分析往往占据主导地位。例如,大数据研究中的随机对照试验(RCT)和基于基因组的潜在肿瘤预测,都依赖于相关性分析。然而,这种依赖在医学领域中产生了问题,因为在此领域,决策需要依赖强烈的因果关系,而非简单的相关性。遗憾的是,相关性结果常被误解或夸大为因果关系,这种现象在学术界和公众领域都十分普遍。事实上,研究显示大约五分之一的研究存在相关性被夸大的情况。这种现象的根源在于混淆了相关性和因果性的概念,以及实验设计的问题,例如缺乏随机化和双盲化。
证明因果关系的关键在于保证因素在结果之前,这是我们理解因果关系的基础。因此,在科研论文和实验中,我们必须明确区分哪些是已知事实,哪些仅是可能性。
总的来说,在医学研究中需要更好地理解并应用因果性和相关性,这不仅涉及初试的研究设计,也关系到知识向政策的转化和决策过程中的不确定性的表达。
3 误导信息、网络健康谣言、健康信息可信度评价
3.1 误导信息
误导信息(misinformation)在医学研究中是一个重要而深远的问题,尤其是在大数据驱动的研究中,这个问题的严重性更为突出。首先,误导信息的主要来源在于相关性结果被夸大为因果关系。研究显示,大约五分之一的研究存在相关性被夸大的情况,具体表现为在大学官网的研究有40%的相关性结果被夸大,以及各种药物疗效的过度解读。这种夸大相关性的现象也被反映在科学媒体的报道中,首次研究的报道往往会被过度夸大,然而,很多初步的研究在后期被否定或证伪。
其次,实验设计的问题也会引发信息误导。例如,缺乏随机和双盲设计的实验可能导致相关性被误解为因果关系。对此,《自然》杂志上一篇由斯坦福大学发表的研究指出,医学领域中大约有90%至95%的研究是错误的。因此对实验的证伪对研究的意义更大,因为可以筛除掉当前研究中很多误导性的研究内容。很多研究由于人群、区域和实验方式的不同,在当时显示了阳性的结果,后期都被否定掉了。因此,在论文中需要明确指出,所描述的内容是可能的结果还是事实。
当前很多都是大数据驱动的研究,有很多“未知的未知”和“未知的已知”。因此,需要将那些确定的已知的知识和不确定的知识给区分出来,构成一个新的知识库,以减少误导信息的产生和传播。
3.2 网络健康谣言
在一般的认知中,网络谣言往往利用公众的恐惧、好奇心、情感等心理,混淆是非、颠倒黑白,使大众产生错误的印象和看法,影响公众的判断力和决策能力。通过以往研究梳理,发现当前关于网络健康谣言主要集中在三个方面:特征与检测分析、影响因素分析和谣言治理研究。基于以往研究,治理网络健康谣言需要明确三个重要问题:健康信息的知识性和科学性、健康谣言信息的溢出效应和健康谣言传播的特征。从这三个问题出发,可以设计一个从形成、发展到消退等各个阶段持续治理的整体框架从防窑、辟谣和止谣三道防线出发剖析阻断网络健康谣言的内部机制,明确在每道防线中可以采取的措施和主要任务。
谣言在学术概念上是一个中性词,从谣言的可信度出发,可以分为三大类:真的、假的和不确定。由于没有机关或媒体能够评估谣言的可信度,因此谣言暂时没有特定的定义。但在计算机领域,谣言的定义相对来说是较为具体的。计算机默认谣言是错误信息和虚假信息,因此计算机领域研究的谣言一般是虚假信息。并且在传统的认知中也是认为谣言是一个虚假信息。相比于其他谣言,健康谣言的可识别度更高。健康信息不同于其他信息的关键在于健康信息有很强的知识性和科学性,即健康信息是一个较为客观的信息。在鉴定的过程中,一般科学共同体会对健康信息有一个共同的认识。而娱乐类的谣言很难用现有的知识去证明,只能通过警方一步步去调查,等待娱乐谣言水落石出。此外,政治类的谣言具有更强的主观性。
有学者支持以上的观点,认为在当前的学术界缺乏大家都认可的谣言定义。在不考虑极端事件的情况下,目前大家较为认可的说法大致可分为两类:捏造和不存的信息、未经证实的信息。而谣言的论证是一种后验式事件。在谣言诞生之处,没有人可以证明谣言的真假。如果不研究谣言的共性就不能去研究谣言的范式和治理谣言。从后验式的视角对谣言展开研究(报告人的研究),学者们认为是有意义且有必要的。在未来的一些危机事件,破坏性最大的往往不是那种确定性的灾难,而是在当时没办法确定的谣言。
另外,一个有意思的话题是二次反辟谣,即某些人或团体为了获取舆论的热度,对已认定是虚假的信息从多方维度证实辟谣信息的错误,从而再次引发舆论风波。如何进行二次反辟谣显得尤为重要。除此之外,也有学者认为当前国内外的谣言研究是基于纯技术的角度展开的剖析,谣言问题的研究过于简化,因此,从多元的角度看待谣言问题和开展谣言研究会更有意义。
3.3 健康信息的可信度评价
对健康信息的信度进行评估是至关重要的,因为这有助于用户获得正确的健康信息。目前,健康信息信度评估主要有三种方法:检查列表、第三方认证和人工智能辅助工具。然而,每种方法都有其局限性。例如,检查列表方法虽然全面,但复杂且冗长,用户体验并不理想;第三方认证可以提供信息的保障,但用户不太可能专门去查验这些认证;人工智能辅助工具虽然能帮助识别可靠信息,但由于其缺乏透明度和可解释性,可能会引发一些问题。
为了克服这些限制,提出一种新的方法,即通过交互界面将用户与在线健康信息的信度评估工具连接起来。具体来说,通过开发一个插件,当用户打开网页时,该插件将在网页右侧显示帮助用户判断网页信度的信息。这些评价指标不是随意设定的,而是基于相关的理论依据。这种方法的优势在于它能够直观地展示信息的可信度,从而帮助用户做出更好的决策。
4 科学研究与临床实践的结合
4.1 医疗服务体系存在的问题
科学研究需要和临床实践进行结合,用户的健康实践对医疗服务具有深远影响。在医疗和人工智能结合的背景下,一些创新的健康管理工具和服务被开发出来。然而,这些新兴的工具和服务在实际的临床环境中能否得到有效应用,仍是一个待解决的问题。举例来说,人工智能在医疗领域产生了一系列新的诊断工具和治疗方法,如人工智能辅助诊断系统、人工智能导向的远程医疗服务等。然而,这些工具和服务的可用性、有效性以及对医疗服务质量的实际影响,需要在临床实践中得到验证和评估。
城乡医疗服务质量的差异是另一个重要的研究领域。科学研究可以帮助我们了解和量化城市地区和农村地区在医疗服务质量、资源配置以及疾病案例分布等方面的具体差异。例如,医联体策略试图通过整合城市和乡村的医疗资源,来缓解城乡医疗服务质量的差距。科学研究可以对这种策略的实际效果进行评估,从而指导更有效的政策和实践。
当前医疗体系主要存在数据质量、医疗知识应用和医疗教育三个方面的问题。首先,一些错误的病例或误诊案例被记录并传播,而这些信息的错误性并未被标注,这可能对医疗服务产生误导性影响。科学研究可以通过深入分析这些案例,找出错误来源并提出改进方案。其次,医疗知识与医生实践的有效结合是一个挑战。考虑到医生的工作压力,他们往往没有足够的时间去查阅人工智能提供的辅助资料,因此,我们需要提供更为精准的,能够满足医生需求的信息服务。此外,当前的医疗知识服务系统在设计上并未充分考虑医生的实际需求,导致医生需要去适应这些系统,而不是系统去服务医生。这种现象在医疗知识提供方面尤为明显,通常所提供的是通用的基础知识,对资深医生的帮助有限。人工智能技术可以帮助我们更精准地提供满足医生需求的信息服务,从而提高医疗服务的效率和质量。最后,医学教育中存在临床经验不足的问题。很多从事教学的医学老师来自生命科学等非临床背景,他们在撰写学术论文方面可能有较强的能力,但在临床经验方面可能不足。反之,临床医生虽有丰富的诊治经验,但往往缺乏撰写SCI论文的能力。因此,大学教材往往由临床医生撰写,而不是大学老师。学生在学习过程中,更偏向于学习教科书,而非临床经验。通过深化科研和临床的结合,我们可以提高医学教育的实效性,更好地为未来的医疗服务提供人才支持。
4.2 临床案例与科学文献知识的整合
在大数据医疗领域,临床案例和科学文献知识的整合是一项重要的任务。然而,这两类知识的性质差异可能在整合过程中引发一些问题。在当前医疗诊断系统中,知识源主要分为两类:通用知识和案例知识。通用知识通常由教科书和科学文献经过整理、归纳后形成,主要以查询功能形式提供。与此相反,案例知识是基于医生在诊断过程中对病情演化的具体观察和判断形成的。
案例知识在提供和转化过程中可能存在许多变化,包括但不限于疾病早期、中期和后期的诊断手段和方式的不同,这些具体细节和特点是无法仅依靠算法理解的,而需要医生的专业判断和推荐。此外,大量的诊断和案例知识并未在教科书或文献中明确记录。由于病患个体差异和疾病病程的复杂性,每个患者的具体病情往往会有所不同,这就需要结合案例知识和医生的专业判断,以实现个体化的诊断和治疗。因此,在临床案例和科学文献知识的整合过程中,应注重医生的专业参与和案例知识的细节处理,以更好地满足个体化医疗需求。
4.3 医院数据确权
目前医院数据的所有权尚未明确。尽管这些数据在医院环境中可供使用,但并不直接属于医院所有。由于缺乏明确的法律规定,这些数据也难以判定为个人所有。如果数据归个人所有,那么个人可能会要求获取这些数据,但这可能导致医院在数据管理上面临困境。同样,一些敏感的医疗数据,如艾滋病等传染性疾病的数据,一旦泄漏,可能引发公共卫生事件和社会恐慌。当前的实际情况是,全民健康数据归属于国家卫生健康委员会。
另一个重要问题是这些数据的定价。对于不同的购买者,同一份数据可能具有不同的价值。就目前而言,金融数据受到严格的法律保护,不能离开银行。相比之下,医院数据的管理则没有明确的法律规定。医院的原始数据不应离开医院,但经过抽取和分析的数据,特别是反映群体特征的数据,是可以被合理使用的。
在此情况下,保护患者的隐私成为一项重要任务。例如,如果医院原始数据直接泄漏给商业保险公司等,可能会引发社会问题。因此,可以考虑将部分不涉及用户隐私的信息处理、抽取和脱敏后提供给商业保险公司,以判断购买资格,但同时确保提供的信息最小化,既满足了相应的信息需求,又保障了患者的隐私安全。
5 人工智能赋能医疗
生成式人工智能在医疗领域具有强大的应用潜力,大家比较关注三个问题。
(1)生成式人工智能是否能够在智慧医疗系统中,有效地进行回答患者问题、回复问诊和提供诊断建议等任务,实现对医生的部分替代?
生成式人工智能在处理通用知识方面表现良好,但在处理主观问题的回答方面仍有待改进。生成式人工智能缺乏病例知识,这些知识基本上都在医院中,不在互联网上,无法获取。即使有一天患者将自己的病例上传到数据库中,生成式人工智能也无法做出详细的诊断,因为它无法获取医疗影像资料,且不能在长时间间隔内对比多次检查结果。由于病人的生理和心理状态都可能影响疾病的发展,因此在处理这些问题时需要人工非常细致和专业的判断。
在某些方向上,人工智能可以在一定程度上辅助医生进行诊断,但由于当前90%-95%的医疗信息存在不准确的情况,这会导致模型学习后产生的结果也不可靠。
人工智能和医生不应该对立。研究应该更关注使用了人工智能的医生和没有使用人工智能的医生对患者的治疗效果,以及是否能降低死亡率。人工智能在处理复杂的医疗工作方面存在困难,如诊断、手术决定、后遗症处理等,这些都使得人工智能难以完全替代医生。
(2)生成式人工智能天然具有“非真实”的属性,如何保证AI或生成式人工智能在医疗领域应用的真实性和准确性?
虽然生成式人工智能在医学基础知识方面表现较好,但在提高其在医疗领域的真实性和准确性方面,仍需依靠人类。生成式人工智能的信息抽取能力强大,但在自我纠错和对自己生成内容质量进行判断的能力上仍需进一步发展。此外,由于大部分训练数据来自开放互联网,如维基百科等,因此,如果知识库中存在误导信息,生成的内容也可能含有误导信息。
人工智能由于数据集的限制,可能会陷入局部最优解,而不是全局最优解。当处理来自不同患者的信息时,它可能在为特定患者生成解决方案时存在偏差。例如,如果输入数据大部分来自某一特定人群,那么生成的结果可能会对该人群有更好的匹配度,但可能不适用于其他人群。
(3)在使用人工智能为医疗领域进行赋能的同时需要注意哪些问题?
AI的出现引起了震惊,主要是因为它和人类展现出了一种竞争性。AI在某些领域可以超越人类,如在初步的诊断和常见病症诊断中,AI可以作为一种工具,帮助普通消费者做健康诊断,这与使用默沙东的诊疗手册是类似的,这样可以避免浪费三甲医院的资源。
AI与管理、数据、医疗的结合需要综合能力。为了实现健康信息AI,需要跨专业合作,这对于培养非常专业的学生是一个挑战。然而,管理学院可以提供一个解决方案,因为它包含了公共卫生管理、信息管理等一系列可以合作的专业。在未来的手术室里,可以使用AI来辅助医生,提供关键时刻的帮助。但当前的医院很多智能设备并未被充分利用,我们需要对智能设备进行更好的治理。
生成式人工智能最大的能力在于对信息的归纳和整理。对患者数据的深度挖掘是十分合适的,然后将这些信息整理并提供给医生,这可能是一种有效的方式。在此基础上,提出一种个体化和群体化结合的理念,即如果能够通过数据驱动的方式来为每个个体提供独特的医疗服务,而不仅仅是为大多数人提供标准化服务,那么人工智能将能够发挥巨大的潜力。
致谢:分论坛主讲嘉宾和参会者较多,纪要中未能一一列出。在此一并致谢!