舌象分割技术的文献计量学分析*
2019-10-24田春颖庄淑涵关媛媛王泓午
田春颖,孙 璇,庄淑涵,关媛媛,王泓午
(天津中医药大学,天津 301617)
舌诊是中医临床辨证论治的一种手段,是获取机体健康状况的一种重要途径[1]。传统舌诊的判别一般靠医生的知识水平,常常被光线、环境等条件影响,主观性很强,缺少量化指标,因此延缓了舌诊客观化的进程[2-4]。因此科学研究者研发出中医智能舌诊仪,使中医舌诊走向现代化、客观化。其中,舌象的正确分割是实现中医舌诊客观化的必要条件之一。舌象分割包括两方面内容:一是舌体提取,二是苔质分离[5]。舌象分割的效果将对进一步的舌象分析产生直接影响,所以保证舌象分割的准确率是相当重要的[6]。随着图像分割技术的发展,舌象研究中的图像分割也经历了从人工分割逐渐走向半自动、自动分割的过渡,但目前舌体分割的结果还不是很令人满意。
所以利用Note Express对中国知网、维普、万方以及Pubmed数据库进行检索、筛选,最终对纳入的文献进行计量学分析,即采用数学和统计学方法对文献进行统计学分析和描述[7],找出文献分布规律,据此探讨舌象分割技术的研究现状及发展趋势,为舌象分割技术准确率的提高提供参考,具有重要的理论和实际意义。
1 资料与方法
1.1 数据来源 本研究的文献来源为中国知网(CNKI)、维普(VIP)、万方(WanFangdata)、Pubmed数据库公开发表的文献。
1.2 检索策略 对四大数据库进行主题检索,中文检索词为“舌”“分割”,英文检索词为“segmentation”“tongue”。检索时限为建库至2018年12月。
1.3 纳入与排除标准 纳入标准:研究舌象分割技术的期刊论文、会议论文和学位论文;如内容雷同并经判断是同一研究,选择资料最完整的文献。
排除标准:综述类文献,科普类文献,文摘类文献;无法获取全文者;主要研究未涉及舌象分割技术的文章(如纹理识别与分析、舌色识别与分析、舌象采集及舌象仪研制等)。
1.4 文献筛选与资料提取 由两位研究员严格按照文献纳排标准进行独立筛选,并交叉核对,如遇分歧,与通讯作者讨论后决定。对筛选后的文献进行提取,数据提取表用Excel 2016进行,提取内容包括论文标题、论文作者、发表年度、发表期刊、第一作者单位、发表类型、基金资助、舌体分割方法、苔质分离方法、分割准确率及是否提及相应的分割评价标准等,以进行文献计量学分析。1.5 统计分析 应用Note Express 3.20软件进行文献管理,根据“题录类型”“作者”“年份”“标题”字段进行系统查重,并结合人工查重后,以人工审阅的方式进行文献筛选与资料提取。应用Excel 2016软件录入以上提取信息并对其进行描述分析。SATI 3.2[8]文献题录信息统计分析工具进行词频分析,形成共词矩阵,利用UCINET 6.0软件NetDraw版块对共词矩阵绘成高频关键词可视化网络分析图,分析舌象分割技术研究的热点及趋势。
根据普赖斯定律[9],核心作者的最低发文量为m=0.749√nmax,其中nmax指统计年度内最高产的作者的发文量。发文量达到m及以上的所有作者发表的文献量之和应占纳入文献总量的50%。并分析论文作者、文献量及作者所在单位等指标[10]。
2 结果
初检经查重后,共检索文献219篇,经过逐层筛选,最终纳入文献140篇,文献筛选流程与结果见图1。
2.1 文献基本特征分析 文献年度分布1999—2018年,国内外共刊载舌象分割技术文献140篇,平均每年发表7篇。舌象分割技术文献最早的1篇发表于1999年,在2008年之前发文量基本呈上升趋势,2008—2013年发文量有所下降,2013—2018年相发文量保持不稳定的增长,但从整体上呈上升趋势,见图2。
发表文献类型分析截至2018年12月,纳入的140篇舌象分割技术文献中,期刊论文最多,共计73篇,占52.14%;其次是学位论文,共计64篇,占45.71%;会议论文只有3篇,占2.14%,见图3。
图1 文献筛选流程与结果
图2 文献年度分布
图3 舌象分割研究发表文献类型分析
论文来源期刊分析舌象分割技术文献中,期刊论文分布期刊58种73篇,每种期刊均载文1.26篇,论文分布呈较高的离散程度。大多数期刊(46种)仅载文1篇,载文2篇的期刊9种,载文3篇的期刊3种。《电脑知识与技术》《计算机应用研究》《中国图象图形学报》载文量最多,为3篇。载文2篇(含2篇)以上的期刊共12种,占期刊总数的20.69%,共载文27篇,占期刊论文总数的36.99%。12种期刊中,影响因子1.0以下的期刊有4种,共载文9篇;影响因子在1.0~2.0之间的期刊有8种,共载文18篇。12种期刊中,10种期刊(83.33%)为核心期刊。载文2篇以上(含2篇)的期刊载文情况、期刊影响因子(2018)以及是否为核心期刊情况,见表1。
基金资助情况分析140篇文献中有53篇(37.86%)文献研究受科研基金的支持,其中国家级科研基金赞助者31篇(58.49%),受省部级科研基金资助者12篇(22.64%),受市级科研基金资助者7篇(13.21%),受院校级科研基金资助者3篇(5.66%)。基金资助文献年度发表情况,见图4。
核心作者分析本研究纳入的140篇文献,共有211名作者参与发表。其中发文量最多的作者是来自厦门大学的周昌乐和江西中医药大学的杜建强,各累计发表6篇文章,各占纳入文献研究总量的4.29%。根据普赖斯定律[9],本研究核心作者最低文献量m=1.83,取整为2,发文量为2篇及2篇以上的作者共59名,占全部作者的27.96%,这些作者共发表文献163篇,占文献总量的77.25%>50%,符合普赖斯定律的要求,即舌象仪图像分割技术研究已形成“核心作者群”。舌象分割技术研究“核心作者群”,见表 2。
表1 舌象分割技术论文来源期刊分布
图4 舌象分割技术受基金资助文献年度发表情况
第一作者所在研究机构分布共有58个研究机构发表舌象分割技术文献,发文量前3名的研究机构分别为北京工业大学11篇(7.86%)、上海交通大学10篇(7.14%)、哈尔滨工业大学9篇(6.43%)。140篇有效文献中由研究机构独立发表109篇(77.86%),多机构合作发表31篇(22.14%),发文量前10位的研究机构如表3所示。
表2 舌象分割技术研究核心作者
2.1.7 舌象分割技术研究的共词分析 高频关键词分析出现频次排名前5的关键词依次为图像分割、舌诊、舌体分割、中医舌诊、舌诊客观化,见表4。
通过对高频关键词的分析,可显示舌象分割技术领域的关注重点,但仅对词频分析还不能说明此领域的内部联系,因此对其进一步分析,以揭示研究热点全貌。
构建共词矩阵确定舌象分割技术研究的关键词数量为15个,生成共词矩阵,见表5。同时为构建高频关键词共现网络知识图谱提供数据支撑,为后续分析奠定基础。
表3 舌象分割技术发文量前10位的研究机构
表4 舌象分割技术研究高频关键词分析
表5 舌象分割技术研究共词矩阵(部分)
高频关键词共现网络知识图谱分析分析结果显示图像分割处于舌象分割技术高频关键词共词网络的中心位置,是最重要的结点,说明图像分割在舌象分割技术领域研究中占举足轻重的地位。中医舌诊和图像分割两个结点间的线段最粗,说明中医舌诊与图像分割虽为两个独立的不同研究领域,但两者关联性最强。见图5。
图5 舌象分割技术高频关键词共现网络知识图谱
2.2 舌象分割技术分析 舌象分割方法分析纳入的140篇文献中,111篇文献研究内容为舌体提取技术,13篇文献研究内容为苔质分离技术,16篇文献内容既研究舌体提取技术又研究苔质分离技术。总观,舌体提取技术中,主要使用的前三类技术是Snake模型(29.13%)、基于阈值的分割技术(18.90%)及基于图论的分割技术(7.09%),Snake模型中主要使用经典Snake模型(21.62%)和GVF Snake模型(21.62%),基于阈值的分割技术中主要使用最大类间方差法(33.33%),基于图论的分割技术中主要使用Grab Cut算法(44.44%)。苔质分离技术中,主要使用的前三类技术是基于阈值的分割技术(34.48%)、基于聚类的分割技术(24.14%)及基于区域的分割技术(10.34%),基于阈值的分割技术中主要使用多通道动态阈值法(30%),基于聚类的分割技术中主要使用K-均值聚类法(85.71%),基于区域的分割技术中主要使用分裂-合并法(66.67%)。排名前3的舌象分割技术如下表6所示。
表6 排名前三的舌象分割技术
舌象分割准确率及其评价标准分析纳入的140篇文献中,仅22篇文献提及舌象分割的准确率,11篇提及舌象分割准确率的评价标准。舌象分割准确率及其评价标准皆提及的文献均为研究舌体提取技术的文献,如下表7所示。
3 讨论
3.1 舌象分割技术研究的重视程度仍需提高 文献数量在一定程度上能反映出该领域的发展程度及国家、社会的重视程度[11]。舌象分割是舌象采集和分析的中枢环节,是舌诊信息化和客观化的基础[12-13]。本次研究结果显示,近20年舌象分割技术方法文献整体上呈上升趋势,发文量不稳定且发展较慢,仅37.86%的的文献获得基金资助,提示舌象分割技术研究的基金支持力度较低,推断可能是导致该领域不稳定性发展,发展速度较慢的原因,尚需该领域科研人员提高重视程度,国家政府加大基金支持力度。
表7 舌象分割准确率及其评价标准皆提及的文献
3.2 文献各研究机构间发展不均衡 从作者的研究机构来看,140篇文献来源于58所研究机构。发文前10位的研究机构均为高校。原因可能是高校科研人员有更多的机会参加培训学习,有较强的科研团队和学术氛围。纳入的140篇文献研究中,77.86%的文献由研究机构独立完成发表,仅22.14%的文献由多机构合作完成发表。今后应加强合作力度,开展不同研究机构间的多点合作,互相交流合作,加强队伍建设,同时也对改善不均衡局面起到一定的作用[14]。
3.3 主要期刊阵地初具雏形,“核心作者群”已形成学术期刊是共享和展示科研成果的重要平台,通过对收录舌象分割技术文献的期刊进行分析,确定舌象分割技术文献分布的主要期刊阵地,有助于快速了解该领域的科研成果。《电脑知识与技术》《计算机应用研究》《中国图象图形学报》等期刊发表的此类文献较多。提示中国舌象分割技术的研究成果可以优先考虑投稿至这些刊物[15-16]。
根据普赖斯定律[9],通过“核心作者”分析,“核心作者群”已形成,杜建强、周昌乐等研究人员发表的文献相对较多,提示以上研究者在该领域具有重要贡献,研究人员可以争取与其进行合作研究。
3.4 舌象分割技术当前研究热点 舌象分割技术高频关键词共现网络知识图谱显示:当前舌象分割技术研究的最终目的是舌诊客观化,主要研究内容为舌体分割技术,以图像分割技术为基础,将其应用于中医舌诊领域,Snake模型结合数学形态学原理常被科研人员应用并加以研究。
舌象分割技术分析显示:舌象分割中主要应用改进的Snake模型和基于阈值的分割技术。传统Snake模型定义了一条能量曲线,该曲线是针对特征目标的初始轮廓[17-19],因其鲁棒性、实用性等优点被广泛应用于舌象分割[20]。但是传统Snake模型的缺点是:初始轮廓曲线必须靠近真实边界且难以收敛到凹部边界[21-22]。因此Snake模型在舌体提取中被科研人员所改进,常改进成梯度向量流(GVF)Snake模型来克服传统Snake模型的缺点。基于阈值的分割技术是利用像素的灰度值,通过特定的准则选取最佳阈值进行图像分割的一种技术[23]。苔质分离时,主要应用最佳阈值迭代算法,减轻或消除噪声对阈值的影响。虽然舌象分割技术研究在不断发展,但仍存在一些问题:对分割方法的准确率评价尚未形成统一标准,准确率多由中医专家定性评判,由判定的一致率来确定,一致率越高说明该方法分割效果越好[5]。但这种方法主观性较强,有较多不确定性,因此,业内应当积极建立统一的评价标准,以促进舌象分割标准化,舌象客观化。
3.5 本研究存在的局限性 首先,此研究是基于中国知网、万方、维普及Pubmed数据库检索的文献进行分析,可能存在文献纳入不全的偏倚。其次,此研究仅对高频关键词进行分析,不能排除低频词在将来成为研究主流的可能性。最后,今后类似研究需扩大文献检索面,并综合其他文献分析方法,以全面深入挖掘和分析文献信息。
综上所述,此研究采用文献计量学的方法从文献基本特征及舌象分割技术多角度分析了近20年国内国外关于舌象分割技术的研究现状,合理客观地揭示其发展趋势,为未来开展舌象分割技术研究提供理论参考依据。