APP下载

重大突发疫情事件中的谣言识别

2021-02-05刘勘黄哲英

关键词:集上谣言准确率

刘勘 黄哲英

(1.中南财经政法大学 信息与安全工程学院,湖北 武汉 430073;2.南开大学 商学院,天津 300071)

2020年1月中下旬开始,新型冠状病毒肺炎疫情逐渐严峻,该重大突发事件来临时,民众本就处于一个相对紧张的状态,此时一些造谣者却在网上大肆发布疫情相关的谣言信息,不断加剧民众焦虑,对疫情的有效治理、国家政策实施及社会稳定带来极为不利的影响。相关辟谣平台虽然会及时更新辟谣信息,但辟谣过程需要向相关专家及政府部门求证,辟谣结果虽准确,但耗时较长,难以满足突发的重大疫情背景下对谣言更快速地进行判别的要求。因此,建立一个及时准确的疫情谣言鉴别模型就显得尤为紧迫和重要。

针对现阶段疫情形势和网络谣言研究现状,本文以提供可靠的疫情谣言鉴别模型为最终目的,以实现对重大突发疫情事件中相关信息的真伪鉴别。其中的核心问题在于,与历史谣言数据相比,疫情谣言的数据量相对较少,且疫情谣言有其独特特征,难以利用现有的判别模型进行鉴别。对此,本文从文本增强和生成对抗两个方面构建疫情谣言判别模型。首先基于疫情谣言的文本特征构建疫情谣言词库,以便对历史谣言进行符合疫情谣言特征的文本增强;再建立基于生成对抗网络(GAN)的疫情谣言生成模型,以扩充疫情谣言的数据量,实现更加精准的疫情谣言鉴别效果。

1 相关研究

早在2002年,网络谣言就引起学者们的关注,但多属于新闻与传媒领域范畴,聚焦于谣言的传播及监管举措。随着互联网与数据挖掘技术的发展进步,越来越多的计算机技术应用于网络谣言研究,并呈现出较为明显的几个发展阶段。

以特征提取为中心是研究早期的整体趋势。造谣者往往会使用一些情感丰富、表述新颖的语言来吸引大众眼球,因此谣言信息在语言表述、词语使用、标点符号等方面都有一定的相似性。如Takahashi等[1]选择信息转发率、爆发点以及词汇分布为主要特征,研究Twitter上关于“日本地震引发海啸”事件的数据,发现词汇分布这一特征在谣言与非谣言之间有着显著的差别。Castillo等[2]同样以Twitter数据为研究样本,通过对情感词汇的数目、类别以及发布者的年龄、关注与被关注的数量等特征信息进行分析,人工抽取得到一组可以较好预测信息可信度的特征组合。但这些特征往往是研究者精心设计所得的,时间消耗过多,而且某一数据集上表现良好的特征组合在另外的数据集上效果并不理想,应用局限性较强。因此,近年来以深度学习为核心的谣言鉴别方法应运而生。

深度神经网络在语义挖掘方面成果显著,可巧妙避开早期特征提取的繁琐过程。深度神经网络(DNN)、卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆(LSTM)等神经网络模型,在研究文本的潜在含义方面具有较高的价值。如Ma[3- 4]等利用RNN模型分析某一话题相关帖子的上下文联系,有效减弱了无价值帖子对谣言鉴别结果的影响。刘政等[5]提出了使用CNN挖掘文本深层特征的方法,与传统算法相比优势更明显。针对RNN模型需要分析所有上下文的不足,Chen等[6]提出了使用LSTM获取文本语义特征的方法,进一步提高了模型检测准确率。Li等[7]提出了将注意力机制与多任务学习相结合,使用LSTM为基础算法的谣言检测方法,其检测效果明显优于主流方法。针对早期谣言检测过程中评论短缺的问题,Qian等[8]提出了带有评论生成器的卷积神经网络模型,将产生的评论与原文结合后进行谣言检测。Bian等[9]对谣言的散布结构加以考虑,通过自上而下以及自下而上得到双向信息,其检测效果超过多种前沿方法。

由于缺少对领域特征的提取,以上模型主要针对普通的谣言识别,对于突发事件中网络谣言的研究,仍然停留在传播学、心理学和法学的角度。陈堂发[10]从法律角度出发,提出了追责新思路;韩海峰[11]从医疗角度出发,探讨了公共卫生突发事件中的救治模式;文献[12- 13]从政府角度出发寻找了舆论引导的新方法;王雅琪[14]以合肥市 2016 年重大突发事件为例,分析了次生舆情的影响;吴明等[15]研究新媒体在舆情引导中的重要作用。相比之下,针对突发事件谣言鉴别方面的文献较少。张鹏等[16]针对突发事件,结合遗传算法和 BP 神经网络构建出最终的突发事件预警模型。王芳等[17]以新冠疫情谣言为研究对象,建立了疫情相关谣言的真实度评价体系,并构建了信息真实度计算模型,进一步挖掘了谣言真实度与辟谣信息之间的相关关系。

深度神经网络技术是谣言鉴别问题的有效手段,其高效率、高准确率的特点使其得到广泛的应用,但这类模型只能实现基于大量历史数据的谣言预测。新冠疫情从爆发到现在只有几个月时间,虽然期间产生了不少谣言,但相对于数以万计的历史数据而言,疫情谣言数据量仍显不足,如何在此基础上训练出好的判别模型正是本文研究的重点。

2 疫情谣言特征

2.1 数据来源

本文收集新型冠状病毒肺炎疫情爆发以来,从2020年1月1日到4月30日161天内的疫情谣言数据共计730条,全部来自于微博社区管理中心且都已经被证实为谣言。作为对比,本文还采集了部分历史谣言数据,共计39 570条,为微博社区管理中心不实信息板块2012—2019年所记载的谣言信息,作为疫情谣言生成模型中的历史谣言数据。同时,选取新华网、人民网、央视网新闻和凤凰资讯4大新闻官方网站获取历史非谣言数据。为保证数据涵盖社会生活的各个方面,采集时政、国际、社会、财经、生活、文化、体育、科普、健康、养生、医药、明星、人物、公益、救助共15个板块的内容,共计90 337条非谣言数据,从中随机抽取4万条作为历史非谣言数据集。

数据采集使用Selenium模拟浏览器获取网页信息,通过 BeautifulSoup解析网页内容,最后用正则表达式与Find函数匹配所需字段。爬取的数据分为疫情谣言、历史谣言和历史非谣言3部分。由于一些数据存在数据缺失、数据异常等现象,将此类数据去除后,选用Jieba分词器与哈尔滨工业大学的停用词表完成分词、去除停用词的步骤。使用Word2Vec对文本信息进行向量化转化,将每个词语转化为一个固定长度的向量,对应于固定维度的特征空间。

2.2 疫情谣言的主题特征

通过对疫情谣言的分析,最终将其划分为5个主题,分别为疾病防治、民生保障、政策解读、人物聚焦和灾害救助,其分布比例分别为33.8%、29.2%、12.1%、19.0%和5.9%。

疾病防治类的谣言信息占到总数的三分之一,其次是民生保障类。在每一类主题下,使用TF-IDF找出疫情相关的5个主题词,可真实反映出疫情谣言的主题特征(见表1)。

表1 疫情谣言主题词汇表

2.3 疫情谣言文本特征

根据刘知远等[18]的研究,谣言在语义方面有一定的特点,不同类型的谣言间又有一定的差异。由于历史谣言数据中不包含疫情谣言特征,因此本文通过对疫情谣言情感、词频和权重等方面的分析,获得疫情谣言的文本特征。

(1)疫情谣言情感词

使用知网情感分析用词语集(beta版)[19]对谣言语句的情感进行分析,得到疫情谣言情感词云图,如图1所示。可以发现疫情谣言的情感具有以下几方面的特点:①情绪化现象严重,“可怕”“恐怖”“不幸”等词语在谣言文本中多次出现,带有

图1 疫情谣言情感词云图

较深程度的恐惧、愤怒、同情等情感倾向;②用词消极,夸大现象明显,“允悲”“严峻”“野蛮”等词语出现的次数极多,对国家政策实施及社会稳定带来了不良的影响。

(2)疫情谣言高频词

疫情谣言文本在词语使用方面也呈现一定的规律,表现在:①有关“极”“非常”的词语(如“细思极恐”“非常多”等)、有关“重”的词语(如包含“重大新闻”“重要”等)以及“一定”“千万”等程度词语出现的频率较高,这类词语会吸引大众眼球,且使得谣言看起来更加可信;②有关“防治”的词语(如“病毒防治”“治疗”“预防”等)、有关医学的词语(如“医院”“专家”“药”“酒精”“消毒”等专业词语)频繁出现,这类词语含有疫情的独有特征,试图让民众将其视为正常的医学救治、防治内容来混淆视听。各词语在730条微博疫情谣言中的出现频次如表2所示。

表2 疫情谣言词语的频数

(3)疫情谣言关键词

疫情谣言在其主题上具有高度一致性。使用TF-IDF进行词汇分析后,选取在所有文本上结果之和最大的500个词汇,得到疫情谣言关键词表,如表3所示。其中关于中国、美国、武汉、封城、医疗、医院、疫情、肺炎等内容的谣言最为突出。

表3 疫情谣言关键词表

2.4 谣言文本增强

在计算机视觉领域,对图像数据的增强可提高图像处理的效果[20]。在自然语言处理领域,也尝试了一些文本增强的方法[21- 22],主要使用词库或向量进行词汇替换、反向翻译、噪声注入等,如Zhang等[23]使用基于词典替换的文本增强技术来提高文本分类的效果;Wei等[24]通过对词语进行删除、插入、替换等操作,在数据量较少时,也能实现分类效果的提升。

由于历史谣言数据在文本内容、情感倾向等方面,与疫情谣言有较大的差别,故本文利用疫情谣言的文本特征对历史谣言进行文本增强。利用2.3节的疫情谣言文本的词频、关键词及倒排文档方法构建基于TF-IDF的疫情谣言词库,包含程度词(53条)、情绪词(35条)、领域词(48条)和主题词(25条)4个部分,对历史谣言文本内容按照全词匹配进行词汇转换,这些词语总的转换次数分别为:程度词(3 304次)、情绪词(2 986次)、领域词(2 603次)、主题词(4 663次),部分转换关系如表4所示。从表4可知:

(1)程度词转换 由于疫情谣言中夸大现象明显,在相应事件的表述中,程度副词使用较多,且多为深度副词;通过程度词表,可将历史谣言中程度表述较浅的词语转化为深度程度副词。

(2)情绪词转换 疫情谣言中情绪消极与极端化现象明显,通过构建情绪词表,可将历史谣言数据中情绪不太明显以及情绪较轻的词语,转化为情感极性相同但程度较重的词语。

(3)领域词转换 疫情谣言包含较多的医疗救助领域词语,因此构建疫情领域词表,可将历史谣言中带有明确疾病疾控方面的词,转化为相近的疫情词汇。

表4 疫情谣言词库表

3 基于GAN的疫情谣言识别模型

3.1 生成对抗学习

近十年来,国内没有爆发过大规模的疫情,历史数据中与疫情相关的信息较少,而此次新冠疫情爆发以来,相关数据量也不足以训练出较好的鉴别模型。因此,本研究基于GAN的思想,使用GAN对此次新冠疫情的少量谣言进行特征提取,建立疫情谣言生成模型,将普通谣言转化为具有疫情谣言独有特征的生成谣言,从而补充疫情谣言判别模型的训练数据集,其主要流程图如图2所示。

图2 基于GAN的谣言识别框架

GAN是Goodfellow[25]提出的一种具有对抗机制的生成模型。GAN由生成器G与判别器D组成。生成器G接收随机数据作为输入,输出与真实数据相似的伪样本;判别器D则预测输入样本的真伪,并据此产生预测误差,根据误差依次对生成器G与判别器D进行更新。

Goodfellow[25]已经证明,GAN在训练生成器的过程中,通过改变随机数据的分布,可生成趋向于真实数据的新数据。因此,如果将GAN的这种特性应用于疫情谣言的生成,将经过文本增强处理的历史谣言数据作为原始模型中的随机数据,再通过对抗网络改变历史谣言的数据分布,使其转化为具有疫情谣言特征的生成谣言,从而获得大量与此次新冠疫情相关联的谣言数据,就可以弥补数据集中疫情谣言数据量过少的不足。

3.2 模型框架

根据生成对抗的思想,本文从两个方面展开研究:①建立疫情谣言生成模型,将历史谣言转换成一定数量的生成谣言,扩充疫情谣言数据;②构建疫情谣言鉴别模型,将原有的历史谣言、非谣言数据与生成的疫情相关谣言合并后展开训练,扩充数据集,实现鉴别谣言的功能。整体流程如图3所示。

图3 基于GAN的疫情谣言识别流程图

这里的对抗是历史谣言与疫情谣言的对抗,谣言的数据分布在两者间有一定的差异,因此生成模型的任务就是将历史谣言迁移到疫情谣言的空间,产生新的生成谣言来扩充标注数据集。在生成更多的疫情谣言样本后,疫情谣言鉴别模型利用已有数据与生成数据,进行随后的鉴别过程,得到谣言与非谣言的鉴别结果。

3.3 疫情谣言生成模型

根据图2的生成对抗原理构建图4所示的疫情谣言生成模型,生成器将历史谣言Z′r转变成带有疫情谣言特征的生成谣言G(Z′r),判别器区分真实的疫情谣言和生成器生成的谣言。在模型迭代足够的次数后,判别器的准确率趋近于50%,疫情谣言和生成谣言具有较高的相似性,判别器无法辨别数据来源。此时生成谣言G(Z′r)便可以用来扩充训练数据集,作为标注数据展开模型训练。

生成器G对历史谣言Z′r进行重编码,通过与判别器D的博弈,生成器生成与真实样本分布相似的假样本,使历史谣言的数据分布不断趋向于疫情谣言Xrt。

图4 疫情谣言生成模型

Hi=σ(w1fi+b1)

(1)

Os,i=σ(wsHi+bs)

(2)

疫情谣言生成模型的全局损失函数由判别器判别样本来源的损失与生成器的损失两部分构成。模型首先训练判别器的参数。设Xrt的标签为1,表示疫情谣言;G(Z′r)的标签为0,表示生成谣言,判别器以尽可能识别疫情谣言和生成谣言为目标,更新模型参数。判别器更新完成后,固定判别器的参数,更新生成器参数。设历史谣言Z′r的标签为1(其实Z′r并非疫情谣言),希望判别器将生成数据判别为1,生成器的参数更新后,可以更好地生成迷惑判别器的数据集。损失函数如下:

E[log2(1-D(G(Z′r)))]}

(3)

式(3)中首先最大化右侧的两项内容,此时生成器参数固定,对于疫情谣言Xrt,D(Xrt)趋向于1,第一项趋向于最大值;对于生成谣言G(Z′r),判别器准确率越高,D(G(Z′r))越趋向于0,第二项也就越大。两项相加,得到的即为最大值,判别器参数得到更新。

然后最小化右侧的两项内容,此时固定判别器参数,D(Xrt)即为固定值,第二项中G(Z′r)跟随生成器的变化而变化。为更好地迷惑判别器,D(G(Z′r))越趋于1越好,即第二项内容越小越好,两项相加后,得到的即为最小值,此时生成器参数得到更新。

两步更新完成后,判别器和生成器的参数都得到更新,反复迭代直至判别器无法辨别数据真假为止,至此谣言生成模型构建结束,生成的数据即可在谣言鉴别模型中加以应用。

3.4 疫情谣言鉴别模型

生成大量疫情谣言之后,就可以构建分类器实现疫情谣言鉴别。本文使用基于BiLSTM网络的分类器模型,其具体结构如图5所示。

图5 疫情谣言鉴别模型的结构

分类器由BiLSTM网络、全连接层及输出层组成。模型接收历史谣言、非谣言数据(Z′r与Zu)及生成谣言Xrf作为输入,经过BiLSTM层进行特征抽取,将正反两个方向的序列化输出相加,再送入全连接层与输出层,对样本是否为谣言进行预测。

H′i=σ[w′1(Lf,i+Rf,i)+b′1]

(4)

Oc,i=σ(wcH′i+bc)

(5)

4 实验与结果分析

4.1 实验设计

根据本研究的最终目标,将疫情谣言鉴别实验设计为以下4种:

实验1(与传统的机器学习和深度学习方法的对比实验):分别使用传统机器学习算法(NB、SVM、DT、集成学习算法XGBoost、BP神经网络算法)、深度学习算法(CNN、RNN、LSTM和BiLSTM)与本文算法(GAN+BiLSTM/LSTM+BiLSTM)进行比较,其中:GAN+BiLSTM表示使用BiLSTM作为分类器;LSTM+BiLSTM表示GAN模型中,生成器使用LSTM,判别器使用BiLSTM算法。

实验2(文本增强前后效果对比实验):对文本进行增强处理后,使用实验1中的算法进行实验,检验文本增强处理在此研究中的应用效果。

实验3(GAN的生成器与判别器使用不同算法进行对比实验):分别使用GAN、VAE与LSTM、BiLSTM算法作为生成器与判别器的核心算法进行对比,选择最优的生成模型。

实验4(GAN训练完成后,连接不同分类器的对比分析实验):分别使用GAN+CNN、RNN、LSTM、BiLSTM进行对比,选择最优的鉴别模型。

在实验过程中,采用五折交叉验证评估各模型性能。此外,为确保模型验证的可靠性,对疫情谣言数据按照8:2进行划分,80%的数据用于疫情谣言生成模型的训练,剩下20%的数据不参与整个训练过程,而是用于最终的模型效果检验。

4.2 结果分析

4.2.1 实验1

首先,使用历史谣言数据集Zr与历史非谣言数据集Zu,采用NB、SVM、DT、XGBoost、BP、CNN、RNN、LSTM和BiLSTM进行实验。然后,将Zr作为生成器的输入信息,从730条疫情谣言数据中抽取584条谣言,组成Xrt数据集,训练谣言生成模型。多次迭代后,判别器的准确率在50%上下波动,利用此时的生成模型,得到1万条生成数据。最后,将生成数据与Zu、Zr输入谣言鉴别模型,得到本文算法的实验结果(设生成数据与Zr的标签为1,表示谣言数据;Zu为0,表示非谣言数据),如表5所示。其中Atrain表示在训练集上的预测准确率,Atest表示使用训练数据集的20%作为测试集的预测准确率,An表示模型在疫情谣言验证集上的预测准确率。从表5可以发现:

(1)在传统的机器学习算法中,NB、SVM、BP神经网络算法在历史数据的测试集上的预测准确率达到95%以上,XGBoost的为91.36%,而DT算法在测试集上的预测准确率只有76.44%,分析其原因,可能是由于此研究过程中涉及到的数据量较大,且各数据之间没有明确的特征区分,使得DT算法无法进行节点划分,导致最终的预测准确率较低。在疫情谣言验证数据集上,这5种算法的预测准确率都在25%~55%之间,疫情谣言鉴别结果不理想,一方面是由于训练数据集中没有疫情相关数据,另一方面这类算法较为简单,无法充分学习谣言与非谣言之间的区别,使得算法对此类信息的鉴别能力较弱。

(2)4种深度学习算法在历史数据的训练集上都有95%以上的预测准确率,CNN的预测准确率甚至达到98.78%;算法在测试集上的预测准确率也稳定在97%左右,模型训练效果较优;在疫情谣言验证数据集上的预测准确率在72%~82%之间,与前面5种传统的机器学习算法相比,模型识别效果明显提升,说明在大量的历史数据条件下,深度学习算法更有利于模型的学习。

表5 实验1的结果对比

(3)GAN与BiLSTM结合的模型在训练集与测试集上的预测准确率与其他几个模型相比并不理想,但在疫情谣言验证集上的实验结果表明,在历史数据的基础上,加上生成数据后,本文模型在疫情谣言上得到的预测效果比未使用生成数据时提高了1.3个百分点。可见,生成模型经过训练,得到的生成数据被赋予疫情谣言的特征,可以在疫情谣言的鉴别中定向提高模型的预测准确率。

部分GAN生成的数据如图6所示,可以发现,生成的数据与疫情、疾病、公益、卫生等内容密切相关,抽象的、情感丰富的词语也较多,符合谣言的特点。

图6 利用GAN模型生成的谣言数据

4.2.2 实验2

为了验证本文提出的文本增强方法,对历史谣言进行文本增强处理后,得到历史谣言Z′r,再使用实验1中的10种算法进行实验,结果如表6所示。从表6可知:

(1)文本增强处理后,10种算法在测试集上的预测准确率都有所提高。

(2)文本增强处理后,SVM与XGBoost算法在疫情谣言验证集上的预测效果较文本增强前有所下降,其余8种算法的预测准确率都有所提高,说明本文提出的文本增强方法,对于疫情谣言的鉴别有很好的辅助作用。

表6 实验2的结果对比

4.2.3 实验3

为了使疫情谣言鉴别模型拥有最优的性能,对生成器、判别器的算法进行调整,展开对比实验,结果如表7所示。对比1与2、3与4号实验(这两组实验是在判别器固定的情况下改变生成器的算法)可以发现,在疫情谣言验证数据集的实验结果上,生成器算法的选择并不能独立影响模型的效果。对比1与3、2与4号实验(这两组实验是在生成器固定的情况下改变判别器的算法)可以发现,判别器算法的选择也不能独立影响模型的效果。对比1-4号实验可以发现,当生成器使用LSTM、判别器使用BiLSTM时,模型的预测准确率最高,达到84.93%。对比5-8号实验可以发现,使用VAE作为生成器时,疫情谣言的鉴别准确率维持在76%~85%,整体效果与GAN差不多,但最优准确率为84.25%,与GAN下的最优情况84.93%相比,降低了近0.7个百分点。

表7 实验3的结果对比

4.2.4 实验4

完成GAN的训练后,利用分类器进行谣言判别,不同分类器得到的结果如表8所示,从表8可以发现:

(1)对比1-4号实验(这4组实验的生成器均为LSTM,判别器均为BiLSTM,采用不同的分类模型)结果,在训练集和测试集上,LSTM与BiLSTM的鉴别效果优于CNN与RNN;在疫情谣言验证数据集上,BiLSTM也为最优模型,鉴别准确率达84.93%,而CNN、RNN与LSTM的分别只有71.23%、70.55%与80.82%,BiLSTM的优势明显。

(2)对比5-8号实验(这4组实验的生成器使用BiLSTM,判别器使用LSTM,改变谣言鉴别模型的算法)结果,CNN、RNN、LSTM与BiLSTM在训练集与测试集上的鉴别准确率均在94%以上,是一个比较理想的结果;而在疫情谣言验证数据集上,BiLSTM的鉴别准确率为82.19%,而CNN、RNN与LSTM的只达到77.40%、79.45%与76.03%,可见,CNN只能前向传播、RNN无法解决长时依赖、LSTM无法获取逆向信息的问题,使得在同样的数据集上与BiLSTM产生较大的差异。

(3)对比4、8号实验,在使用LSTM、BiLSTM为生成器与判别器算法,以BiLSTM为鉴别模型算法的情况下,模型预测效果是所有实验中最优的,达到84.93%,为本文研究所得的最终谣言鉴别模型,与文本增强处理前的最佳准确率81.51%相比,提高了3个百分点。

表8 实验4的结果对比

5 结语

新冠疫情当前,为了使谣言对社会的危害降到最低,就要争取及早准确地鉴别疫情相关谣言。为了弥补疫情数据的不足,实现更加精准的疫情谣言鉴别,本文首先构建疫情谣言词库,利用其进行文本增强;然后使用GAN对此次疫情的相关谣言进行特征提取,将历史谣言转化为具有疫情谣言特征的生成谣言,获得大量与此次疫情相关联的谣言数据;最后使用增强后的训练数据集进行判别模型训练,以提高谣言判别的准确率。实验结果表明,使用GAN扩充训练集后,识别效果提高了3个百分点,明显优于传统的机器学习和深度学习算法。随着时间的推移,获得证实的疫情谣言数量越来越多,此时可以对疫情谣言数据集进行补充更新,使谣言生成模型更加准确地学习疫情谣言的特征,不断提高生成数据与真实疫情谣言之间的相似度,获得更高质量的生成谣言,进而达到更加精准的谣言鉴别效果。

本文的研究方法是针对新冠疫情数据提出的,不论是此次疫情还是未来可能会出现的疫情,本文构建的模型都可以对重大突发疫情的谣言治理起到辅助作用,为普通网民提供相应的判别依据。但疫情毕竟是极少发生的,对疫情谣言及传播者的特征提炼仍有难度,如果加入更多的特征,如谣言传播主体的行为特征,有可能继续提高谣言判别的效果。此外,现实中谣言与非谣言的数据不平衡现象明显,如何在研究中加入对现实情况的考量,也需要展开进一步的研究。

猜你喜欢

集上谣言准确率
基于双空间模糊邻域相似关系的多标记特征选择
中国使馆驳斥荒谬谣言
关于短文本匹配的泛化性和迁移性的研究分析
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
不信谣言 科学防“疫”
你被养生谣言忽悠过吗?
谣言π=4!