大数据时代网络文学多维度评价方法及应用
2016-01-19介晶
介晶
近年来,网络文学迅速发展,已成为我国数字出版产业的重要组成部分。易观智库数据显示,2013年网络文学市场规模达到了46.3亿,较2012年环比增长66.7%,预计2015年将突破70亿。然而,网络文学在内容质量、经济效益、社会价值等方面,良莠不齐,鱼龙混杂。通过对网络文学多维度的综合评价,可以提高网络文学内容质量,提升数字出版产品质量和服务水平,推动网络文学健康有序发展,培育出版产业新的增长点,满足人民群众精神文化需求。本文将分析大数据时代对网络文学评价方法可能产生的影响,试图用新的思路和评价方法来为网络文学内容进行综合评价,以期为读者、文学创作者、出版机构、平台运营商等相关机构和个人提供更好的内容和支持。
网络时代,传统文学作品评价机制引争议
文学评价和艺术鉴赏一样,从来都是主观感受和作品客观价值的综合体现,两者缺一不可。正所谓“有一千个读者就有一千个哈姆雷特”。对文学作品的评价一直都没有所谓统一的、客观的方法和标准。所以,目前文学奖项的评选都依旧采用的是专家审读和投票机制来确定最后的获奖作品,其权威性依赖于评审专家的专业性,而投票的方式平抑了专家个人喜好带来的主观性。我们国家在文学评价的价值导向上,一直尊重人民群众的喜好和评价,但传统的文学出版和评价模式对读者的意见反馈没有办法很好地收集和分析。一定程度上,可以说,在文学作品的评价上,不能充分体现读者群体的主观评价。
实践中,因为评价机制问题,在相关文学作品评奖中,也引发了大量争议。例如,2011年8月,第八届茅盾文学奖获奖结果公布后,票数最高的450万字长篇小说《你在高原》引发了最大的争议。在新浪微博随后启动的“在五部获奖作品中,你最喜欢哪一部”投票活动中,截至发稿(距离投票结束尚有一周时间)时,有560多人参与投票,原本在茅奖评奖委员会获奖最低的刘震云的《一句顶一万句》以360多票遥遥领先。2014年8月,第六届鲁迅文学奖同样惹来一片争议,作家阿来的报告文学《瞻对》意外遇冷,甚至以0张选票落选;周啸天作品获得了诗歌奖,却被网友炮轰其水准只是“打油诗”,等等。
大数据时代网络文学评价迎来全面变化
随着互联网普及、网络文学繁荣,及大数据时代到来,前文提到传统文学的评价方式,正在迎来变化。全球知名咨询机构MGI(麦肯锡全球研究院)在名为《大数据:下一个竞争、创新和生产力前沿领域》的研究报告中提出:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”大数据时代的到来,将会为网络文学内容评价带来哪些思路的变化,及相应的方法上的更新?笔者认为可归纳为如下几点:
1.读者评价的权重增加
原来以单向传播为主,读者反馈手段匮乏,加之响应不及时,总体上互动很少,而互联网时代,读者可通过评论直接将意见和建议反馈给作者,使得读者反馈手段更为高效和直接,同时由于社区及社交效果,交互更为直接和多样化。
2.读者特征画像更全面
读者的特征与喜好,之前界定方式粗放,随着大数据时代的来临,用户的文化消费行为记录越来越多,比如会记录读者的有效阅读时间、阅读轨迹、阅读习惯,有利于抽象、分析、总结用户的兴趣和喜好,反过来指导网络文学的创作,繁荣网络文学市场发展。
3.全流程数据的整合为各方提供支撑
随着网络文学各环节数据的收集、分析更为精细,产业链各方都将从中受益。传统的选材和出版过程也会发生相应的变化,更容易把握时代和读者需求,识别受欢迎作品也更为高效。
多维度、多指标、多权重组合进行评价
虽然对文学内容的本身评价存在着一定的困难,但网络环境和数据时代还是给评价提供了一些可能。好的内容是网络文学的核心竞争力,网络文学的体征之一是网络在线连载发表,如果内容足够吸引人,则可以得到更多的关注和点击量等,这些外围的、可量化的指标,可从一个侧面或不同角度反应出文学内容的优劣。
1.主要维度
在多维度方面,可考虑使用以下几个主要维度来建立评价模型:
(1)用户维度:从消费能力、年龄、知识背景、地域、性别、职业等来细致地刻画用户属性。比如“我是歌手”节目,将观众群体进行年龄分类,使得评价更为客观和全面;
(2)内容维度:从作品题材、体裁、风格、年代、目标群体及分级情况等来区分和描述不同的作品,区别对待不同的作品;
(3)舆情维度:从是否主旋律、热点及敏感信息等相关维度来细化;
(4)运营维度:从消费情况、渠道、消费方式等来细化运营类相关维度。
简言之,多维度模型是为了使各个评价指标和模型更为细致和准确,也可更为灵活地应用在不同的应用场景下。
2.主要指标
在指标体系建设上,可从以下几个大方面来建立评价模型:
畅销程度指标:如点击量、下载量、订阅量、搜索量等具体指标来准确量化作品的影响力;
文学价值指标:借鉴传统文学评价方法,比如作品语法规范程度、词汇丰富程度、读者打分等方式来综合反映作品的文学价值;
专业评价指标:比如书评人、媒体评价、编辑推荐等各个指标来量化专业人士的评价。
概言之,多个细化指标是为了更为准确地量化评价,从而能准确给出相对客观的评价。
对网络文学尝试进行相关应用研究
从对网络文学内容多维度的评价中,我们可挖掘出一定时期内,不同用户(如读者、作者、平台运营商、出版机构、监管方等)所关注的焦点是什么,通过数据整合和评价分析,可为各方带来哪些服务和应用。下面笔者尝试列举几种可为不同的用户进行服务的应用研究,供业者参考。
为读者带来高质量的推荐:通过对作品的分析和多维度评价,更利于与读者兴趣进行匹配,进而提升推荐内容的转化率;
为作者创作提供指导建议:通过内容评价可看出作者创作作品的目标读者群体的关注点、喜好等,从而有的放矢地进行内容创作;
为平台运营商提供运营支持:根据多维度模型可灵活生成榜单,提升推荐的丰富程度;通过对作品更为细致的评价,便于进行广告匹配,从而提高广告的点击率;根据作者和其作品的影响力及号召力,进行鼓励或奖励机制的稿酬核算等;
为出版机构提供精准选题策划:现阶段,出版物内容的策划多是凭借策划编辑的经验和对热点事件的敏感度来进行的,通过对网络文学内容评价分析可获取各个领域,不同人群的兴趣点从而对目标人群做到精准选题策划;根据评价结果可提高网络文学作品进行纸质出版的成功率;
为监管方提供舆论倾向分析:可提供不同类型、题材的作品,在不同渠道、不同地域、不同人群中的关注度。
综上所述,多维度、多指标、多权重的组合可以建立较为全面的网络文学量化评价基础模型,不同的应用场景可根据具体需求和侧重来调整相应的权重,或者规则,并形成特定的评价模型,为不同环节的用户提供支撑。本文更多的是来阐述一种网络文学内容评价的思路,其中借鉴和参考了目前互联网行业数据分析及数据建设的方法。本文涉及的各个指标和维度的建设,在技术上都已具备了可实施性,其中部分指标,笔者在文章形成阶段进行了具体的统计和分析。总之,大数据时代已然到来,如何利用大数据技术使其为网络文学内容评价服务,并将评价结果应用到各个环节,是我们需要认真思考的议题。
(作者单位系中国新闻出版研究院)