APP下载

一种新闻事件演化建模方法研究

2015-09-16彭冰

科技传播 2015年12期
关键词:演化

彭冰

摘 要 事件演化关系模型是一个科学的新闻事件演化建模方法,它有利于准确发掘新闻话题中各子事件之间存在的潜在关系。其具体方法是利用事件的内容相似性、时间关系、命名实体以及关联信息构建新闻演化关系模型。本文通过具体的建模实验,对该方法的可行性进行了探析。

关键词 新闻事件;演化;建模方法

中图分类号G2 文献标识码 A 文章编号 1674-6708(2015)141-0013-02

新闻报道中,一个新闻话题不仅仅是单一事件的报道,它还具有一个完整的时间演化结构。而从新闻话题中掌握各个子事件的演化脉络也并不是一件容易的事情。构建事件演化关系模型,基于新闻事件的多层次特性,通过计算机技术发掘事件之间存在的演化关系,是本文对新闻事件演化建模的研究方向。

1 新闻事件演化

一个完整的新闻事件演化方式可以是由一个事件分裂成多个事件,也可能是多个事件相融合并合成一个事件,还可能是由单一的一个事件演变发展成另一个单一事件。确定新闻事件之间存在演化关系,应满足两个条件:事件发生的时间具有先后关系;事件内容之间相互关联,其中,事件发生的时间所构成的先后关系,表示该事件的演化方向。

2 新闻事件收集

在对新闻事件演化进行研究前,应该收集新闻话题,并生成新闻事件集,事件集中统一新闻话题的报道应为两篇以上篇。本文主要对事件演化关系建模方法进行研究,基于避免出现报道聚类误差的原因,新闻话题的收集采取人工方式进行,最终生成事件集。

事件内容向量采用TF·IEF 模型创建,用T={,,…, }表示新闻话题的事件集合,用表示第i个事件中第j个特征的权重值,用{(,) |j =1,2,…,k}表示Ei的k个特征及其权重值,具体TF·IEF模型下,特征权重计算公式如下:

其中,表示特征在事件出现的频次,表示出现特征的事件总数,表示T中总事件数。

3 事件演化关系建模

就计算目标来说,文本中的特征关联度和互信息相似度较高,模糊匹配策略可以用于计算事件命名实体间的关联度,当相同的命名实体都在一个事件中有出现,则称之为一次关联。因此,本文把在一个文本中共同出现两个不同特征的概率进行替换,替换对象是它们在一个完整事件集中共同出现的事件个数,对特征在事件中的权重值进行计算,具体公式为:

其中,表示特征在事件A中权重;表示事件A中特征与事件B中特征的关联度;表示特征与共同出现的事件个数;表示特征出 现的事件数;表示特征单独出现的事件数。

4 新闻事件演化建模实例分析

4.1 实验资料

实验资料是利用网络从中国新闻网中采集的2009年2月22日至4月22日关于山西2009年“2·22屯兰矿难”的相关报道,共计682篇。本研究对这一新闻话题所涉及的各个事件进行汇总,共158篇报道,构成8个事件,见表1。

以表1中的事件发生的时间为基础,由相关专家小组,分析并构建出具体的事件演化关系,同时对演化关系的正确性和完整性进行验证。

4.2 实验结果分析

本文中演化关系模型的主要对象是新闻事件的相似性、新闻事件命名实体特征关联度(CS*FA),参与比较的关系模型有:CS模型、CS*DF模型以及事件内容相似性模型。计算演化关系模型中不同阈值λ下的召回率、准确率,事件演化关系模型的系统性能随着实体特征关联度、新闻报道接近度的增加而增加,CS*FA关系模型表现最为明显,具体如图1所示。

本文提出的事件关系建模方法中,在进行自动的演化关系探测时,当λ为0.04时,分别有正确演化关系线10条,错误演化关系线3条,丢失的演化关系线6条,如图2所示。

5 结论

现代社会中,网络上的新闻事件报道数量巨大,为了能够及时、准确地了解新闻事件的来由与发展历程,本文基于事件的内容相似性、时间关系、命名实体以及关联信息构建新闻演化关系模型。本文所研究的事件演化关系建模方法,可以将同一新闻话题中各事件之间的潜在演化发展脉络良好呈现出来。

参考文献

[1]张辉,李国辉,徐新文,等.词网络的新闻事件关联建模[J].国防科技大学学报,2014,4:169-176.

[2]张凯.新闻演化规律的动力学与可视化——以三个典型新闻事件为例[J].新闻与传播研究,2014,02:80-99,128.

[3]蒋华.演化优化与演化建模方法及其应用研究[D].武汉大学,2013.

[4]王伟,赵东岩.中文新闻事件本体建模与自动扩充[J].计算机工程与科学,2012,4:171-176.

猜你喜欢

演化
文化创意产业集群演化自组织过程研究
文化创意产业集群演化自组织过程研究
《演化》
论科技、社会快速发展下的“受众”概念演化
区域创新系统演化与区域经济发展互馈机制研究