面向应急响应需求的博客自适应评价模型
2016-08-01闪四清侯银丰刘孟妮
闪四清,侯银丰,刘孟妮
(1.北京航空航天大学 经济管理学院,北京 100191; 2.城市运行应急保障模拟技术北京市重点实验室,北京 100191)
面向应急响应需求的博客自适应评价模型
闪四清1,2,侯银丰1,2,刘孟妮1,2
(1.北京航空航天大学 经济管理学院,北京 100191; 2.城市运行应急保障模拟技术北京市重点实验室,北京 100191)
摘要:以合理利用博客资源,协助政府应急响应决策为目标,提出一套面向需求的博客自适应评价模型。采用LDA主题模型挖掘博客的主题分布,将主题视为信息需求单元,将决策工作对信息的需求倾向看作需求单元信息的优先度影响因子,面向应急响应决策工作对博客进行评价,并以实际使用的博客信息量统计分布更新需求单元信息的优先度影响因子,实现自适应学习反馈机制。最后,选取“天津港爆炸”事件的新浪博客数据作为案例,对模型的有效性予以验证。结果表明,面向应急响应决策需求的博客自适应评价模型,能够更好地满足应急管理和决策者需求。
关键词:应急管理;应急决策;用户生成内容;博客;自适应评估
Web 2.0时代包括博客在内的用户生成内容(user-generated content,UGC)蓬勃发展。WANG等认为在数据挖掘、舆情分析、信息索取及热点探究等众多领域中,针对UGC的研究工作都占有比较重要的位置,合理有效地分析UGC可以得到有价值的成果[1]。但是,网络信息资源质量参差不齐,这严重影响了博客对用户的使用价值。因此,合理筛选、评价博客资源,具有较高的研究价值。用户根据自身的需求,传播、使用着不同的博客资源,UGC这一新兴信息传播模式的出现,为突发事件应急管理提供了一条崭新的思路。应急管理包含多个阶段的工作,不同工作阶段和任务的信息需求不同,只有充分考虑用户的需求,才能有效利用博客资源,从而协助政府应急响应决策。
笔者打破以往研究对网络信息资源大而全的整体评价思维局限,提出以主题挖掘为手段,面向需求,分类对博客进行评价。同时,以利用博客等网络信息资源协助政府应急响应决策为目的,通过对博客评价的研究,提出一种有效利用网络信息资源协助应急决策和管理工作的新思路。
1文献综述
1.1应急响应决策信息需求研究现状
应急管理是一门多学科交融频繁的复杂性系统科学,一般包括应急预防、应急准备、应急反应、灾后恢复与重建4方面内容[2];胡代平等[3]提出政府危机管理中的5种应急信息需求:预警信息、预防信息、控制信息、恢复信息及学习需要的信息;LEE等[4]认为网络信息资源在应急响应决策过程中具有重要的作用,可以有效地帮助决策人员分析事件特征,合理进行决策;操学诚等[5]通过对突发事件发生后网民在相关网络平台上的行为进行研究,认为突发事件发生后,民众会在网络平台上发布许多对应急救援有用的信息。
1.2博客等用户生成内容的评价研究现状
博客等网络信息资源质量参差不齐[6],利用这些资源协助应急响应决策,首先需要对其进行合理的评价。MATTHEW[7]提出了一整套网络信息资源评价的指标体系;PESSEMIER等[8]研究了YouTube用户的评价内容与推荐内容,提出依据用户评价内容和推荐内容的网上视频评价模型;陶青[9]采用层次分析法对UGC进行了评价;WANG等提出了一种应用句法结构分析方法评估UGC质量的评价模型;ONG等[10]研究了亚马逊网站上的商品评论信息,提出了虚假评论在信息内容性、可读性和主观性3方面的特征;RANSBOTHAM等[11]提出UGC内容贡献者数量、信息资源之间网络特性、UGC资源年龄3方面都对协作式UGC的经济价值产生影响。
刘继等[12]提出了网络信息存在多个主题;张晨逸等[13-14]探究在大规模微博数据上应用潜在狄利克雷分布模型(latent dirichlet allocation,LDA)挖掘文本话题;童薇等[15]提出一种基于LDA的微博文本话题抽取方法;VILLIERS等[16]采用K-Means方法测量信息距离,经过AP算法进行文本聚类,结合LDA主题生成模型,生成针对用户个性微博主题推荐列表。
综上所述,博客等UGC资源在应急响应决策中极具应用价值。博客信息存在多种话题,应急响应工作的信息需求也多种多样,对博客依据主题进行分类,开展面向应急响应决策需求的博客评价研究具有重要意义。目前,国内外学者对于博客等UGC的评价研究较为匮乏,评价过于粗糙,实用性较差。因此,笔者的研究弥补了上述不足,具有一定的理论与现实意义。
2评价模型
2.1博客主题挖掘
笔者提出对博客进行面向主题的分类评价,需要对博客进行主题挖掘。以往学者在网络信息资源主题挖掘方面多采用LDA概率主题模型[17],具有较好的主题挖掘效果。首先LDA模型是一种基于语料的生成概率模型,LDA应用马尔科夫链作为数据状态分布的先验概率测量方法,以Gibbs Sampling方法获取先验状态信息,得到两个超参数期望值和词分布的主题分布,最终得到文档的主题分布。
将博客主题视为应急响应决策信息需求单元(Di,设有i个主题),通过LDA主题模型可以得到每篇博客的对应主题概率,笔者将其视为文本对应需求单元的内容相关度(R)。突发类应急事件的信息要素包含共有信息要素和专项信息要素,其中共有信息要素根据人员、时间、空间又分为突发类应急事件基本要素、事件发生单位或区域相关要素、人员伤亡信息要素和事件跟踪信息要素[18]。笔者在以往研究基础上添加事后安抚信息和民众情感表达信息这两个信息单元。整体而言,笔者提出的应急响应决策信息单元结构如图1所示。
图1 应急响应决策信息需求单元结构
2.2面向应急响应决策需求的博客筛选
笔者将博客的筛选视为一个文本二分类问题,将文本归属到“有用”和“无用”两类中。笔者结合以往学者在网络信息资源评价方面的研究,对博客文本的有用性影响指标进行分析,提出了用户可靠性、内容可靠性、内容相关性和内容可用性4个博客质量影响指标,应急响应类博客筛选性评价指标体系如图2所示。
图2 应急响应类博客筛选性评价指标体系
用户可靠性是指用户的可信任程度 。一般而言,影响力较高的人产生的言论更为可靠,权威人士发布的内容相对更有价值。笔者认为用户的影响力主要体现在网民用户的博客访问量和粉丝数量上,而权威性则主要体现在发文量和博主等级上。因此,对于博客用户可靠性指标,提出用博客发文量、访问量、粉丝数、博客积分4个网页标签对其进行量化。
内容可靠性是指博文内容的准确性、客观性,主要体现在该博文的讨论热度上。具体而言,博文的阅读量和评论数在一定程度上代表着该博文的认知度,体现了博客的权威性。此外,信息量充足的博文包含的有用信息相对较多。综上,对于博文的内容可靠性,笔者采用博客阅读量、博客访问量及博客信息量进行测度。
内容相关性是指博客在某一主题下的归属程度,主题即为应急响应信息需求单元。笔者研究的博客筛选针对某一需求而进行,目的是过滤出与该需求不相关的博客。通过LDA主题模型对博文进行主题抽取,在分析博文主题及其关键词的同时,可以得到每篇博文在该主题下的相关性指标值,因此,博客的内容相关性指标值可以通过LDA主题模型获取。
内容可用性代表博客内容能够被使用者所理解的程度,代表博客可以产生多少实际的效能。应急响应决策者在利用博客资源的时候需要考虑信息内容的可用程度,内容的可用性被广泛应用在网络商品评论分析中[19-20],博客的可用性包含以下两个方面:博客的语义完整性和博客的内容一致性。
笔者采用HanLP(汉语言处理包)对每个句子进行分词处理和词性标注,首先找出每个句子的核心动词,继而在核心动词的基础上判断整句是否具有完整的句子结构,以此计算该句语义的完整性。
(1)
由于博客信息表达具有多样性,且随意性较强,博文内容的语义一致性直接关系到该信息的传播效果。笔者采用FudanNLP工具包获取正文每个句子的核心词,然后计算正文句子之间核心词对应于树状词库中的“距离”(由所属类别定义),而得到的所有句子之间的“距离”平均值即可作为该段信息语义一致性的度量值。
(2)
笔者采用广义回归神经网络(general regression neural network,GRNN)[21]对每个需求单元下的博客集合分别进行筛选,筛选出对于特定需求单元无用的博客文本,将这些文本的内容相关度赋值为0,面向应急响应决策需求的博客筛选过程如图3所示。
图3 面向应急响应决策需求的博客筛选过程
2.3面向应急响应决策需求的博客自适应评价
通过主题挖掘和博客筛选后,每个信息需求单元下都汇集了若干份博客文本,这些文本都具有明确的、面向该需求的内容相关性指标值。决策者对某一需求单元信息的需求倾向就是该需求单元对应目前工作阶段的权重,即目前阶段的工作信息需求由各个信息需求单元加权汇总得到。
针对一次决策而言,决策者会使用大量的博客信息协助自身开展决策性工作,这些真实使用的信息代表了决策者目前的信息需求倾向。因此,笔者使用决策者实际决策后的信息需求分布作为信息单元和阶段工作之间的需求倾向。具体而言,对决策者使用的博客信息进行信息量统计,依据每篇博客在每个需求单元(Di)下的内容相关度指标值,得到该阶段工作(Sj)的需求单元信息量统计分布,进而得到每一个需求单元信息量在该阶段工作使用信息总量的比例(aij),将其作为该阶段对于某一需求单元的信息需求倾向。从而,所有博客文本使用的可能性就会产生差异。
(3)
式中:i为需求单元编号;j为阶段工作编号;ISeth代表包含第h篇文档的需求单元的集合;Phj为第h篇博客在第j个阶段工作中的优先使用度;aij为第j个阶段工作对第i个需求单元的信息需求倾向;Rhi为第h篇文档对于第i个需求单元的内容相关度。
针对多次决策而言,每次决策使用的博客都将更新信息需求倾向,依据新的需求倾向对博客进行排序,方便决策者快速有效地利用博客,从而实现博客自适应评价,具体过程如图4所示。
图4 依据需求倾向的博客自适应评价过程
3实证研究
3.1实验分析过程
(1)应用GooSeeker(集搜客)网页爬虫软件对新浪博客进行抓取,抓取内容包含用户姓名、用户积分、用户粉丝量、用户发文量、发文时间、博文标题、博文内容、博文评论量及博文阅读量。笔者以“8·12天津港爆炸”事件为案例,共抓取1 275篇新浪博客并进行数据分析,以验证笔者所提出模型的有效性和可用性。
(2)应用Python自然语言处理包对1 275篇博客进行分析,得到每一篇博文的主题概率分布,将主题作为信息需求单元(Di),博文在每个需求单元(Di)下的概率为该博客在该需求单元下的内容相关度指标值(Wi)。
(3)组织应急管理领域专家对1 275篇博客进行有用性分析,赋予无用博客0标签,赋予有用博客1标签,得到所有文档的类型标签。
(4)应用Java程序对博客评价指标进行测量,采用Max-Min标准化方法对每个测量指标进行标准化,针对每种需求单元,随机抽取75篇博客作为测试集,剩余1 200篇博客作为训练集,采用Matlab神经网路工具箱,生成博文的可用性筛选器。
(5)测量博客的优先度,对博客进行排序。笔者设定初始状态决策工作对于需求单元没有需求倾向(即均为1/7)。选取爆炸发生后的3个时间段,代表事件反应、事件处理及事后安抚3个应急响应工作阶段,对各阶段的博客进行3次抽取,每次抽取后都对博文进行信息量使用统计,得出该次抽取信息的信息需求单元的比重,调整需求倾向权重值aij。最后,比较每个阶段之后抽取的博文内容和工作需求的匹配程度,验证模型的有效性。具体实验流程如图5所示。
图5 “天津港爆炸”事件的博客自适应评价模型应用实验流程
3.2实验结果
首先,笔者应用LDA主题模型将“天津港爆炸”相关博客分为7个需求单元,并列出每个需求单元的主题关键词,如表1所示,可以明显看出,需求单元(主题)之间的关键词差异较大,说明主题挖掘效果良好。
其次,针对每个需求单元进行了GRNN筛选器的准确性测量,同时又训练了忽略内容相关度指标后的博客有用性筛选器,并测量了其准确性,如表2所示。7个需求单元的博文筛选准确率都在80.00%以上,其中事后安抚信息需求单元筛选器的准确率高达89.33%,而忽略了内容相关度指标后建立的筛选器准确率只有62.45%。结果表明笔者实验所得到筛选器准确有效,所提出的博客有用性评价指标客观有效,同时,也意味着对博客按照信息需求进行主题划分是科学合理的。
表1 “天津港爆炸”需求单元主题关键词
表2 针对需求单元的博客筛选器准确性统计表
最后,笔者选取3个工作阶段对博文进行抽取,每个阶段抽取2~3次,对每次抽取后的博客信息量按需求单元分类统计,如图6所示,得到本次需求单元信息量的使用比例,依据比例对博客的优先度进行计算,从而实现对博客的评价。
图6 各阶段使用不同需求单元(Di)统计分布
实验结果表明,笔者所提出的博客需求单元信息使用倾向参数,可按使用情况进行自适应性调整,并能够充分体现决策使用者的真实信息需求倾向,可以很好地通过该反馈学习机制调整博客选取顺序,提高了应急响应决策者的信息查询和信息使用效率,有助于科学、准确、快速地展开应急决策与管理工作。综上所述,笔者提出的面向应急响应决策需求的博客自适应评价模型是科学、有效的。
4结论
应用LDA主题模型挖掘博客信息的主题分布,继而面向应急响应决策需求,依据工作的信息需求倾向对博客进行排序,并依据实际的使用情况反馈调节信息需求倾向,从而实现对博客面向应急响应决策需求的自适应评价。笔者的研究弥补了以往学术界对UGC评价研究的不足,以主题挖掘为着手点,分类对博客进行评价,打破了以往信息资源整体性评价的局限;以实际数据为支撑,构建依据实际应用数据的合理反馈机制,通过自动学习适应不断变化的信息需求,避免了评价的主观性;此外,笔者从应急响应决策需求的角度出发,对博客资源进行了评价研究,为应急响应决策者提供了一种合理应用博客资源协助政府开展应急决策和管理工作的新思路。
参考文献:
[1]WANG B, LI L, LIN X. Evaluating quality of Web 2.0 UGC based on user authority and topic distribution[C]∥16th International Symposium on IEEE.[S.l.]:[s.n.],2013:1-6.
[2]TUFEKCI S. An integrated emergency management decision support system for hurricane emergencies[J]. Safety Science, 1995,20(1):39-48.
[3]胡代平,雷爱中,王琪,等.政府危机管理的信息需求及获取[J].科学技术与工程,2007,7(9):2177-2181.
[4]LEE W B, WANG Y, WANG W M, et al. An unstructured information management system(UIMS) for emergency management[J]. Expert Systems with Applications, 2012,39(17):12743-12758.
[5]操学诚,牛凯,赵曙光,等.热点事件的网民浏览、搜索、发帖与网民行为引导研究[J].预防青少年犯罪研究,2012,6(1):14-25.
[6]蓝勤华.用户创造内容(UGC)动机研究[D].南京:南京大学,2011.
[7]MATTHEW W B. Information quality: a conceptual framework and empirical validation[D]. Kansas:The University of Kansas, 2004.
[8]PESSEMIER T D, DERYCKERE T, MARTENS L. Context aware recommendations for user-generated content on a social network site[M]. Leuven:[s.n.], 2009:133-136.
[9]陶青.基于信息构建(IA)的Web 2.0网站研究[D].上海:华东师范大学,2007.
[10]ONG T, MANNINO M, GREGG D. Linguistic characteristics of shill reviews[J]. Electronic Commerce Research and Applications, 2014,13(2):69-78.
[11]RANSBOTHAM S, KANE G C, LURIE N H. Network characteristics and the value of collaborative user-generated content[J]. Marketing Science, 2012,31(3):387-405.
[12]刘继,李磊.面向舆情主题的微博用户网络影响力挖掘分析[J].情报杂志,2014,10(1):21-24.
[13]张晨逸,孙建伶,丁轶群.基于MB-LDA模型的微博主题挖掘[J].计算机研究与发展,2011,10(10):1795-1802.
[14]路荣,项亮,刘明荣,等.基于隐主题分析和文本聚类的微博客中新闻话题的发现[J].模式识别与人工智能,2012,3(3):382-387.
[15]童薇,陈威,孟小峰.EDM:高效的微博事件检测算法[J].计算机科学与探索,2012,12(1):1076-1086.
[16]VILLIERS F D, HOFFMANN M, KROON S. Unsupervised construction of topic-based twitter lists[C]∥2012 IEEE International Conference on Privacy, Security, Risk and Trust and 2012 IEEE International Conference on Social Computing. Amsterdam :IEEE Computer Society, 2012:283-292.
[17]BLEI D M, NG A Y, JORDAN M I. Latent Dirichlet Allocation[J]. Journal of Machine Learning Research, 2003(3):993-1022.
[18]王延章,叶鑫,裘江南,等.应急管理信息系统[M].北京:科学出版社, 2010: 27-36.
[19]NIKOLAOS K. Evaluating content quality and usefulness of online product reviews[J]. SSRN Electronic Journal, 2008,7(3):95-99.
[20]OMAHONY M P, SMYTH B. Using readability tests to predict helpful product reviews[J]. Riao Adaptivity Personalization & Fusion of Heterogeneous Information, 2010,5(4):164-167.
[21]SPECHT D F. A general regression neural network[J]. IEEE Transactions on Neural Networks, 1991,2(6):568-576.
SHAN Siqing:Prof.; School of Economics and Management, Beihang University, Beijing 100191,China.
文章编号:2095-3852(2016)02-0144-06
文献标志码:A
收稿日期:2015-12-26.
作者简介:闪四清(1965-),男,北京人,北京航空航天大学经济管理学院教授;博士生导师.
基金项目:国家自然科学基金项目(71471008);国家自然科学基金项目(91224007).
中图分类号:X913
DOI:10.3963/j.issn.2095-3852.2016.02.002
Blog Adaptive Evaluation Model for Demand on Emergency Response Decision
SHANSiqing,HOUYinfeng,LIUMengni
Abstract:With the development of information technology, blog and other UGC resources which play the role in emergency management is growing. How to make effective use of blog resources, to adapt emergency response decision-making needs is an urgent problem to be solved.In this paper, the purpose is to take full advantage of blogs to assist the Government make decisions during the emergency response process and it proposes a model for adaptive blog evaluation model for decision demand. This paper applies the LDA model to mine themes from many blogs. This research gets a themes' distribution, which are regarded as the information demand units. This research regards the favorite of information in some demand unit as the priority needs of the cell information factor to achieve the evaluation work. Eventually, this paper analyzes the blog data about Tianjin Port Explosion in Sina Blog to verify the effectiveness of this model. The results of the theoretical analysis and empirical research show that this model which bases on the information demand of emergency management decisions makers is scientific and effective.
Key words:emergency management; emergency decision; UGC; blog; adaptive evaluation