数据计量方法在健康信息学领域的应用研究综述
2022-08-10徐中阳邱均平浙江理工大学经济管理学院浙江杭州3008杭州电子科技大学管理学院浙江杭州3008杭州电子科技大学中国科教评价研究院浙江杭州3008杭州电子科技大学数据科学与信息计量研究院浙江杭州3008
韩 雷 徐中阳 邱均平 .浙江理工大学经济管理学院,浙江 杭州 3008; 2.杭州电子科技大学管理学院,浙江 杭州 3008; 3.杭州电子科技大学中国科教评价研究院,浙江 杭州 3008; 4.杭州电子科技大学数据科学与信息计量研究院,浙江 杭州 3008)
摘 要:[目的/意义]在图书情报领域中,数据计量方法已被广泛应用于健康信息学研究并取得了丰富成果,文章梳理并分析了数据计量方法在国内外研究中的应用现状,旨在从数据计量学视角得出促进国内健康信息学研究发展的启示。[方法/过程]文章以近五年图书情报领域中的健康信息学研究为例,首先采用文献计量法从发文量、期刊来源、研究对象及研究主题分析了研究现状,其次采用扎根理论构建了数据计量方法体系,最后详细综述了各方法的具体应用现状。[结果/结论]数据计量方法在国内研究中的应用与国外仍存在一定差距,同时国内外研究中也存在数据规模不足、研究范式落后等共性问题。因此,国内学者应当从以下方面加以改进:广开门路,扩大研究对象;技术驱动,创新研究方法;交叉融合,拓展研究内容。
随着大数据、云计算及人工智能等技术的快速发展,数据科学(Data Science)这一以大数据为研究中心的交叉学科应运而生[1]。数据科学的出现,不仅加速了科学研究方式朝着以“大数据驱动”为核心的“第四范式”转变,同时也为身处大数据环境下的传统学科创新研究方法、重塑学科体系提供了有效路径[2]。在此背景下,作为与数据密切相关的学科,计量学充分吸收借鉴了数学、统计学、计算机科学及数据科学等多种学科的理论方法,形成了一门新兴的分支学科,即:数据计量学(Datametrics)[3]。数据计量学是一门综合运用多学科定量分析方法,以所有科学研究相关的数据,尤其是大数据为研究对象,研究其产生、运动、分布及特征等规律的交叉学科,其学科体系主要由理论、方法及应用三部分构成[3]。其中,数据计量方法是数据计量学方法的组成部分之一,是指以各类计算机可识别的文字、符号、数字、音频及视频等科研相关的数据、大数据为研究对象的各种定量研究方法的集合[4],如图1所示。与文献计量、网络计量等其他计量方法相比,数据计量方法种类更加丰富,具有较高的精确度、实用性及智能化程度,能够有效处理多源、异构及海量数据,目前已被广泛应用于医学、经济学及管理学等多个领域中。
图1 数据计量方法的概念
近年来,随着“健康中国”“互联网+医疗健康”等政策的深入推进,各类在线健康社区、移动医疗App及可穿戴健康设备得到了进一步的普及与发展,健康信息学同样引起了公共卫生、信息科学及图书情报等多个领域专家学者的广泛关注[5-6]。健康信息学(Health Informatics,HI)是一门运用多种信息技术满足用户健康需求、处理健康问题或进行医学决策的新兴交叉学科[7]。在图书情报领域,健康信息学研究已成为目前国内外的研究热点之一,大量学者应用“实证主义”“诠释主义”以及“数据驱动”等多种研究范式,针对健康信息行为、健康信息需求及健康信息学教育等研究内容进行了深入探索[8]。此外,也有部分学者分析了健康信息学的发展趋势,如闫慧等从消费者健康信息的需求、搜寻、获取、接受、利用和评价等方面梳理了国内外消费者健康信息学的研究进展[9]。徐璐璐等运用LDA主题模型和文本聚类算法分析了21世纪以来医学信息学研究走向及其健康信息学转向[10]。周晓英等基于对国内外健康信息学理论与实践的深入探讨,明确了健康信息学的含义、学科范畴以及国内健康信息学的发展背景、现状和路径[11]。
综上所述,图书情报领域中现有的健康信息学理论研究主要侧重于概念视角和内容视角,一方面,从健康信息学的概念内涵、学科范畴、研究主题等视角探讨健康信息的研究现状,并在此基础上提出健康信息学未来的发展路径,从方法视角开展的研究相对较少;另一方面,现有的健康信息学研究中已广泛应用了文献计量、知识图谱、机器学习等多种数据计量方法,其研究对象涵盖了健康相关的各类型数据,如:文献数据、问卷数据及社交媒体数据等[12-14]。随着大数据时代的到来,数据计量方法的发展与创新,健康信息学将会逐渐形成以“大数据驱动”为核心的科研范式。鉴于此,本研究以国内外图书情报领域的健康信息学研究为例(下文所有“健康信息学研究”均指代“图书情报领域内的健康信息学研究”),系统梳理数据计量方法的应用现状,尝试从数据计量方法视角挖掘大数据时代背景下国内健康信息学研究的发展启示。
1 文献数据收集
本研究选取主题为“健康信息学”且采用“数据计量方法”的图书情报类期刊论文作为研究对象,以中国知网(CNKI)作为国内文献数据来源,以Web of Science中的Science Citation Index Expanded(SCIE)、Social Sciences Citation Index(SSCI)作为国外文献数据来源。根据DIKW模型可得,“数据”是对客观世界的记录和描述,而“信息”则是加工后有逻辑的数据,主要表现为结构化的数据[15]。因此,本研究构建以下检索式收集文献数据。中文检索式为(主题=健康信息 OR 卫生信息 OR 健康数据 OR 卫生数据 OR 健康大数据 OR 卫生大数据),文献类型为CSSCI、中文核心期刊要目总览、CSCD期刊,文献分类目录选择“信息科技”下的子目录“图书情报与数字图书馆”。外文检索式为(主题=“health information”OR“health informatics”OR“health data”OR“health big data”),文献类型为Article,学科类别为Information Science & Library Science。时间跨度均为2017—2021年,检索时间为2022年1月7日,剔除非图书情报学科、主题无关等文献后,得到国内文献152篇,国外文献356篇,共508篇目标文献。
2 文献计量分析
2.1 发文量分析
分别统计2017—2021各年度的国内外发文量及发文总量如图2所示。由图2可得,发文数量上,2017—2021年间,国外各年度的发文量均高于国内,且二者在数量上始终存在一定差距,其主要原因在于,国外学者早在20世纪90年代就开始了对健康信息学的探索,因此,国外图书情报领域的学者能够较早接触并进入健康信息学领域开展研究[16];发文量变化情况上,2017—2021年间,发文总量和国内外发文量总体均呈现增长趋势。其中,发文总量由2017年的73篇增长至2021年的142篇,总增长率为94.5%,可见,数据计量方法在健康信息学研究中具有较强的实用意义。2018年以来,国内发文量已趋向稳定,维持在28~43篇之间,而国外发文量则持续增长,可见,国外研究更侧重于数据计量方法的应用。
图2 2017—2021各年度发文量
2.2 期刊来源分析
分别统计国内外研究的期刊来源,列举发文量排名前五的期刊如图3所示。由图3可得,从国内外期刊总体分布上,国外图书情报领域已经具备了以健康信息学或医学信息学为主要研究内容的专业期刊,如:《JournalofHealthCommunication》《HealthInformationandLibrariesJournal》,而国内则暂未出现。从国内文献的期刊分布上看,《现代情报》《图书情报工作》及《情报科学》的发文量位列前三,总占比高达49.3%,其余期刊的发文量则相对均匀,可见,国内学者更倾向于投稿情报学相关期刊。从国外文献的期刊分布上看,《JournaloftheAmericanMedicalInformaticsAssociation》《JournalofHealthCommunication》的发文量占比分别高达22.8%、18.3%,远超其他期刊,且分别属于Q1区、Q2区,在图书情报领域内具有一定影响力。可见,相比于传统的图书情报类期刊,国内外学者可能更倾向于投稿图书情报领域内的健康信息学专业期刊。
2.3 研究对象分析
分别统计国内外研究的数据来源如图4所示。由图4可得,问卷数据、网络数据及实验数据在国内外研究中均有较高的使用频次,可见,问卷调查、网络调查及情景实验等数据收集方法仍然是目前国内外研究中采用的主流方法;另一方面,国内研究中使用文献数据的频次较高,而国外研究则使用较少,其主要原因在于,国内健康信息学研究起步较晚,部分学者更倾向于分析文献数据以了解国内外研究现状,追踪国际研究热点,如相丽玲等运用知识图谱方法分析了国内外个人健康医疗信息保护的研究动态、主要观点及发展趋势[17]。值得注意的是,由政府的官方统计数据、企业或私人共享的数据集组成的公开数据集,以及由患者的病情诊断、药品使用及住院情况等组成的电子健康档案数据,在国外研究中已得到了一定程度的应用,而国内研究中的应用程度相对较低,其原因可能在于国外的科学数据、个人医疗数据的共享开放政策与国内存在一定差异。
图3 国内外文献期刊来源分布(前五)
2.4 研究主题分析
分别统计国内外研究的研究主题及其相关主题词,列举总频次排名前十的研究主题如表1、图5所示。由表1、图5可得,在国内外研究的主题中,“健康信息行为”的出现频次均位列第一且与其他研究主题拉开较大差距,其主要原因在于,一是健康信息行为自身内涵较为丰富,涵盖了健康信息的搜寻、规避、查询及传播等多种行为;二是行为的解释涉及了社会学、医学、心理学等多种学科的理论,多样化的理论视角能为国内外学者提供丰富的研究内容。另外,值得注意的是,在信息系统开发、健康信息交换以及电子健康档案等研究主题上,国内与国外研究存在一定差距,其主要原因在于,一方面,信息系统的开发需要依赖于各类算法,而国内研究中数据挖掘法的应用程度相对较低,且大多用于挖掘健康信息特征或健康信息需求上;另一方面,与国外相比,国内健康信息交换项目的建设和电子健康档案的应用起步较晚,因此尚未引起国内图书情报领域学者的广泛关注。
图4 国内外研究主要数据来源
表1 国内外研究的研究主题(前十)
表1(续)
3 基于扎根理论的数据计量方法体系构建
3.1 扎根理论
扎根理论(Grounded Theory,GT)是由哥伦比亚大学学者Glaser B G等提出的一种自下而上建立实质理论的定性研究方法[18]。该方法首先基于对原始资料的系统搜集与分析,进而提炼出能够反映社会现象的核心概念与范畴,接着不断对其进行修正和完善,最后根据概念之间的逻辑性和内在联系构建出相应的社会理论[19];另一方面,基于扎根理论的综述撰写范式同样也得到了广泛的应用,如夏立新等、胡泽文等结合扎根理论分别对我国文献资料保障体系研究和高价值专利评估与识别研究进行了综述[20-21]。鉴于此,本研究采用扎根理论分析508篇目标文献,以构建健康信息学研究中的数据计量方法体系。
3.2 开放式编码
范畴(Category)是指具备相同性质的结构性概念,也是将事物归类所依据的共同性质[18]。开放式编码(Open Coding)是指对原始访谈资料进行标签化、概念化以及范畴化,最终得到范畴的过程[18]。本研究于2022年1月10日组建了研究小组,成员为计量学研究方向的3名博士生和2名硕士生,并于2022年1月12日—1月29日进行了开放式编码。首先,研究小组随机选择508篇目标文献中的2/3(339篇)用于资料编码,剩余1/3的文献(169篇)用于理论饱和度检验。接着,分别逐词逐句阅读所有目标文献的标题、摘要及关键词,提炼每篇文献采用的数据计量方法并对其进行初始概念化,形成61个初始概念。最后,对初始概念进行持续比较和归纳合并,得到7个范畴,如表2所示。
表2 开放式编码过程
表2(续)
3.3 主轴编码
主轴编码(Axial Coding)是基于上一阶段开放性编码所得范畴的内在逻辑性进行更加精细化、具体化的归纳、分析,从而将范畴更进一步聚焦,形成主范畴的过程[18]。研究小组于2022年2月5日—2月8日对所得7个范畴进行主轴编码,最终得到数理统计方法、计量科学方法以及数据智能方法3个主范畴,如表3所示。
表3 主轴编码过程
3.4 选择性编码
选择性编码(Selective Coding)是指进一步比较、分析所得主范畴之间的典型关系结构,从中挖掘出具有高度概括性的核心范畴,从而形成完整的“故事脉络”,最终构建出新的理论框架[18]。研究小组于2022年2月12日对数理统计方法、计量科学方法以及数据智能方法3个主范畴进行选择性编码,经过持续地比较与分析各个主范畴之间的内在逻辑和相互作用后,最终得到“数据计量方法体系”这一核心范畴。
3.5 理论饱和度检验
当现有资料构建的理论框架中引入新的资料后没有得到新的范畴,则可判定该框架已经达到“理论饱和状态”[18]。理论饱和度检验则是通过补充新资料后,查看理论框架中是否会出现新范畴,若未出现,则证明通过检验,反之,则未通过[18]。研究小组于2022年2月15日—2月22日利用剩余169篇文献进行理论饱和度检验,结果显示,所得范畴均已包含在表2中,尚未出现新的范畴。可见,本次扎根理论构建的数据计量方法体系模型通过理论饱和度检验。
4 数据计量方法的应用研究
4.1 数理统计方法应用现状
数理统计方法是数据计量方法的基础组成部分,主要涉及数学、统计学,是目前健康信息学研究中应用程度最高的方法层次,其主要包括以下方法:①统计分析法。统计分析法内涵丰富且适用性广,涵盖了描述性统计、因子分析、方差分析以及T检验等多种二级方法,能够有效处理问卷数据、实验数据等所有结构化小规模数据[22]。因此,在健康信息学研究中,除信息系统开发等少数研究主题外,统计分析法在健康信息行为、健康信息服务等大多数研究主题中均得到了广泛应用,如宋小康等构建了健康谣言分享意愿模型,通过情景模拟实验收集数据后,采用多元线性回归模型检验了研究假设[23]。Sbaffi L等采用描述分析、主成分分析以及泊松回归分析调查了大学生选择在线健康信息的信息渠道的关键影响因素[24];②模型研究法。模型研究法能够融合多种学科理论构建数学模型,并可以通过问卷数据、网络数据、公开数据集等结构化数据检验模型,因此具有广泛的应用性和较强的解释性,能够针对不同的研究问题做出有效解释[25]。在健康信息学研究中,模型研究法主要应用于健康信息行为研究,其主要过程是整合经济学、管理学及心理学等多种学科理论构建理论模型并提出研究假设,继而采用问卷数据、公开数据集等小规模结构化数据对研究假设、模型拟合度等相关变量进行检验,如Zhang X等为调查在线健康社区成员的关系承诺和持续知识共享意愿,整合了社会交换理论和承诺—信任理论,构建了在线健康社区的持续知识共享意愿模型,并收集了519份有效问卷对其研究假设进行了检验[26]。此外,也有部分学者采用KANO模型、强化螺旋模型等其他模型针对健康信息服务、健康信息需求开展了研究,如:徐中阳等综合运用文献资料、半结构化访谈及KANO模型构造了医学院校图书馆健康信息服务需求模型,并采用问卷数据对其进行了实证分析[27]。相关代表性研究成果如表4所示。
表4 数理统计方法的应用现状及代表性成果
4.2 计量科学方法应用现状
计量科学方法是数据计量方法的重要组成部分,主要来源于以“五计学”为主要学科体系的计量学,主要包括以下方法:①内容分析法。内容分析法的优势在于能够针对文本数据、访谈数据、电子健康档案数据等小规模非结构化数据进行定量分析,进而提炼出其中的主题、需求或情感等[29]。在国内外健康信息学研究中,内容分析法均有较高的应用程度,主要应用于分析各类健康信息特征[30]、网络用户或特定年龄群体的健康信息需求[31]、健康信息行为[32]等研究中,如李月琳等设计了网络用户的跨源健康信息搜寻行为实验,并对实验数据和访谈数据进行了内容分析,揭示了跨源健康信息搜寻行为的主要动机、信息源选择的影响因素,并构建了相应的行为路径模型[33];②计量分析法。计量分析法主要针对文献数据、网络数据等小规模结构化数据,其主要用于研究现状分析中,尽管应用程度较高,但应用形式较为固定,主要有以下两种方式:一是作为主要研究方法独立使用,通常用于分析文献数量、研究热点及主题演化的变化趋势,如刘艳华等收集了Web of Science中与健康信息相关的4 023条文献题录数据,并采用关键词分析、聚类分析等方法识别了国际健康信息学研究的研究主题在不同时期的演化路径[34];二是作为次要研究方法与其他研究方法联合使用,目的在于对研究对象进行更深层次的分析,如Chen L等采用引文分析、潜在语义分析以及社会网络分析等方法深入分析了国际卫生信息系统研究中的中心研究主题、演化路径、学科带头人、知识结构以及与其他学科之间的联系等[35];③网络分析法。网络分析法能够通过算法对数据进行可视化,使其转化成具有节点、连边、拓扑等基本特征的复杂网络图,从而更加直观地展现数据之间的关联性[36]。在健康信息学研究中,网络分析法主要采用文献数据、网络数据等结构化数据。国内学者通常采用网络分析法发现特定领域的研究现状[17]、健康信息学的学科进展[16]以及挖掘特定用户的健康信息需求[37],如徐中阳等采用知识图谱方法分析了2015—2020年间国内外图书馆健康信息服务的研究现状[38]。而部分国外学者则进一步拓展了网络分析法的应用,将其用于分析社交媒体用户的健康信息行为,如Perez-Dasilva J A等采用社会网络分析法分析了COVID-19流行期间,Twitter上虚假新闻传播过程中各类用户参与行为的具体情况[39];④评价研究法。结合图5来看,评价研究法的研究对象主要为问卷数据、公开数据集等结构化数据,流程通常为“确定评价对象→明确评价目标→构建评价指标体系→代入数据→得出评价结果”[40]。在国内外健康信息学研究中的应用程度均相对较低,国内学者主要针对健康信息质量[41]、健康信息服务质量[42]、健康服务满意度[43]等健康信息特征或健康信息服务进行了评价。而国外学者的研究主题则更加广泛,能够设计开发相应的信息系统或算法模型开展评价研究,如Wu D等开发了一个评价模型,用以评价新冠肺炎中政府公开卫生数据的质量和可用性,并采用美国、欧盟及中国公开的新冠肺炎卫生数据对其进行了测试[44]。相关代表性研究成果如表5所示。
表5 计量科学方法的应用现状及代表性成果
4.3 数据智能方法应用现状
数据挖掘法是数据智能方法层次唯一的研究方法,也是具有数据计量学鲜明学科特征的研究方法。数据挖掘法主要通过设计算法或开发信息系统实现对网络数据、公开数据集以及电子健康档案数据等所有结构化、非结构化的数据或大数据的挖掘与分析,因此,相对于其他研究方法,数据挖掘法具备了更广泛的应用范围和更实际的应用价值[45]。从研究内容上看,国内健康信息学研究中,数据挖掘法的应用程度相对较低,仅存在于健康信息需求[46]或健康信息行为[47]上,如米国伟等采用K-means聚类和LDA主题模型分析了“知乎”问答平台中与心理健康相关的14 168条数据后得出了新冠疫情暴发的前、中、后3个时期公众的心理健康信息需求[48]。而在国外研究中,数据挖掘法的应用程度相对较高,不仅被应用于健康信息行为研究中,同时还能被应用于疾病诊断、术后护理等具体的临床应用上,如Chai Y等以不确定性信息为中心,开发了一个贝叶斯深度多源学习模型,用于提升青光眼自动诊断的准确性,并通过中国某眼科医院获取的真实数据验证了模型的有效性[49]。Grundmeier R W等采用正则化逻辑回归和随机森林模型构建了一个预测模型,能够根据接受门诊手术儿童的电子健康档案数据预测其手术部位的感染情况[50]。相关代表性研究成果如表6所示。
表6 数据智能方法的应用现状及代表性成果
5 启 示
本研究以图书情报领域中的健康信息学研究为例,采用文献计量法和扎根理论,构建了数据计量方法体系并系统梳理了各类数据计量方法的具体应用现状。综上所述,从整体上看,国内外图书情报学者已经应用多种数据计量方法在健康信息学研究中并取得了一定成果,但仍然存在数据规模较小、研究范式落后等问题。从局部上看,国外研究起步较早,国内研究在研究对象、研究方法以及研究内容上均与其存在一定差距。鉴于此,本研究从数据计量学视角出发,从研究对象(数据)、研究方法(数据计量方法)以及研究内容(研究主题)三方面得到国内健康信息学研究的发展启示。
5.1 广开门路,扩大研究对象
结合研究对象分析和数据计量方法的应用现状来看,在研究对象层面,国内研究主要存在以下问题:①数据来源渠道有限。目前国内研究的数据来源仍然以问卷数据、文献数据及网络数据为主,而国外研究的数据来源则更加广泛,涵盖了公开数据集、电子健康档案数据及视频数据。尤其在公开数据集的使用上,国外学者广泛采用了来自政府机关、医疗机构、科研院所及医疗企业等多个机构公开的数据集,而国内仅部分学者采用了国家卫生健康委公开的统计数据进行了研究;②样本数据的规模较小。相比于国外研究,国内研究仍然以小规模调查为主,其样本数据的规模相对较小,如:构建知识图谱所使用的文献数据通常在2 000条左右,验证结构方程模型时收集的有效问卷通常在300份以内。因此,在未来的研究中,国内学者应当从数据来源和样本数据规模两方面入手,适当借鉴国外经验进一步优化研究设计,具体而言:①拓宽数据来源渠道。国内学者一方面应当加强对咨询报告、政策文本及官方统计数据等公开数据集或视频、音频等其他非结构化数据的应用,探索针对多源、异构数据进行计量与分析的有效路径;另一方面应当积极与政府机关、医疗机构以及医疗健康行业企业等其他机构建立长期合作关系,制定双方科学数据开放共享的相关制度,从而提升数据的利用率和科研成果的产出;②扩大数据获取范围。国内学者应当强化大数据思维,在开展研究的过程中主动扩大数据的收集范围,以此降低样本数据不足造成的误差,如:在构建科学文献知识图谱时,可以扩大文献检索的主题词和时间跨度以获取更大规模的文献数据,从而实现大规模知识图谱的构建与应用。
5.2 技术驱动,创新研究方法
根据数据计量方法的应用现状来看,与国外研究相比,国内研究在研究方法层面仍然存在一定差距,具体如下:①数据挖掘法应用程度较低。目前国内研究仍然以统计分析法、内容分析法等数理统计方法和计量科学方法为主,仅部分学者在研究中应用了LDA主题模型、随机森林、K-means聚类等数据挖掘算法,可见,国内图书情报领域学者尚未在健康信息学研究中广泛应用和推广数据挖掘法;②联用多种数据计量方法开展研究较少。目前仍有大量国内研究采用“一对一”的研究模式,即采用一种方法研究单一来源的数据。而国外研究则相对注重多种方法的联合使用,如:Yao Z等采用深度学习、统计分析、社会网络分析以及内容分析等多种方法研究了在线糖尿病社区用户的信息搜寻和分享行为[36]。因此,国内学者应当加强技术创新,进一步完善研究方法。具体如下:①强化数据挖掘法的应用。国内学者应当加强对数据挖掘技术的学习,通过网络培训、参与研发项目等途径提升技术开发能力,充分掌握机器学习、深度学习及人工智能等各种前沿数据挖掘技术,并将其广泛应用于健康信息学的实际研究中;②注重方法的融合与创新。单一的研究方法必然存在一定的局限性,因此,国内学者可以尝试调整研究模式,根据研究对象、研究目标的不同,联合使用或交叉使用多种数据计量方法开展研究并对比研究结果的差异性,不仅能够提升研究的精确度,而且能够根据结果的反馈进一步优化研究设计。
5.3 交叉融合,拓展研究内容
结合研究主题分析和数据计量方法的应用现状可知,尽管国内学者应用数据计量方法开展了大量研究,但在研究内容上仍然存在一定局限性,主要体现在以下方面:①研究方向过于集中。目前国内研究主要集中于研究现状分析、健康信息需求及健康信息行为3个研究主题中。而国外研究的发展相对较快,研究内容更加多元化,不仅具备上述研究主题,而且形成了信息系统开发、健康信息交换以及电子健康档案等其他研究主题。此外,国外图书情报领域内还形成了健康信息学研究的专业期刊,如《Health Information and Libraries Journal》等;②学科交叉融合程度不足。从学科结构上看,健康信息学与数据计量学均为交叉学科,尽管各类数据计量方法已在国内外健康信息学研究中得到充分应用,但在国内外研究中均尚未发现大数据挖掘、数据引用分析、隐私数据计量等具备数据计量学的特色研究主题,可见,目前国内外研究中健康信息学与数据计量学仍尚未完全融合并形成相对成熟的交叉研究方向。对此,国内学者应当拓宽研究思路,探索更加多元化的研究内容,具体如下:①结合实践应用开展研究。国内学者应当加强理论与实践的结合,积极从实践应用角度拓展健康信息学的研究方向,如:针对新冠疫情开展突发公共卫生事件应急管理相关研究,或针对“慢病管理”开展公共图书馆健康信息服务相关研究;②构建特色交叉研究方向。国内学者应当加强学科的交叉融合与创新,构建具备数据计量学与健康信息学双重学科属性的特色研究方向,如:健康大数据的挖掘与应用、健康隐私数据的计量等,进一步发挥大数据背景下的数据计量方法在健康信息学中的应用实效。