出版行业对大数据的应用思路探析
2018-01-09徐曼
【摘 要】 “互联网+”时代,大数据发展浪潮带来了新一波的产业变革,出版行业也面临着优化与转型升级的机遇和挑战。文章归纳了现阶段出版行业的数据类型,提出这些数据在内容生产、营销推广以及出版评价环节的应用思路,总结其给出版行业带来的机遇和挑战,以促进大数据与出版行业未来的联动发展。
【关 键 词】大数据;出版行业;生产流程;营销推广
【作者单位】徐曼,齐齐哈尔大学教育与传媒学院。
【基金项目】黑龙江省教育厅基本业务专项人文青年骨干项目(项目编号:135109604); 齐齐哈尔市哲学社会科学规划项目(项目编号:QSX2016-13JL);黑龙江省哲学社会科学研究规划项目(项目编号:15XWB03)。
【中图分类号】 G230.7 【文献标识码】A
20世纪80年代,“大数据”(Big Data)的概念在美国首次被提出,麦肯锡全球研究院将其定义为“由于规模巨大,以至于难以通过传统数据库软件工具在合理时间内实施获取、存储、管理、分析的数据集合”,其具有数据规模大、输入和处理速度快、多样性、价值密度低的特点。自社交媒体出现后,移动互联网、物联网、云计算等一系列新兴信息技术也迅速发展,大数据时代自此到来。2009年,大数据业务在我国率先被互联网企业应用,随之受到各行各业的普遍关注。2012年以后,大数据应用的市场规模不断扩大,资本关注度也逐渐提高,大数据技术作为新兴信息科技手段,在教育、交通、医疗、金融、电信等专业领域得到广泛应用。2015年,我国制订了“互联网+”行动计划以及大数据产业“十三五”发展规划,并正式印发《促进大数据发展行动纲要》,大数据政策从顶层设计到细化落地,现已从全面、总体性规划逐渐向各行各业、各细分领域拓展延伸,大数据发展也随之告别概念普及、理论研究阶段,开始步入实际应用之路[1]。
如今,大数据凭借其精准性、预测性和智能性,正在为各行各业的规划、治理、管理、决策、营销等提供有力的支持,其巨大的商业价值正在成为信息产业变革的新驱动力。在这一背景下,作为信息和数据密集产业的出版行业,也已顺势展开对大数据的各类探索。与其他国家相比,我国出版行业拥有可追溯的、历史悠久的数据,因此得以搭乘大数据的快车,对信息和知识的搜集、储存、传播方式,甚至整个出版产业体系重构进行革新。本文归纳了现阶段出版行业的数据类型,提出这些数据在内容生产、营销推广以及出版评价环节的应用思路,总结其给出版行业带来的机遇和挑战,以促进大数据与出版行业未来的联动发展。
一、出版行业的数据类型
网络宽带的提升、社交网络的成熟、移动终端以及可穿戴设备的普及,使这个时代所产生的数据量比以往的更多,传播速度也更快。出版行为作为一种把信息筛选、加工、复制后并使之传播的过程,其生产和传播出版产品的过程也包含了大量数据。近年来,传统出版业由于媒介融合而具备更多挖掘数据的能力,因此,更加便于获取出版机构与其上下游合作单位(如出版物销售渠道商、印装企业等)、作者和读者在各项出版活动中所产生的各类结构化数据,以及文本、图片、音频、视频、关系网络、空间轨迹、时间序列等非结构化数据。这些出版大数据具体可分为两种类型:一是属于出版行业核心资源的生产内容数据,二是在长期生产经营活动中积淀下来的业务数据。内容数据和业务数据相互关联,为出版行业乃至其他学科领域发展提供了大数据分析的基础。
1.内容数据
内容数据即出版机构具有传播权的文字、图片、音频、视频等信息,它们大多来自出版社的出版物。据百衲传媒相关数据显示,仅2014年我国范围内传统出版业(主要指书刊报,含复本数)的内容数据量合计为7452.6万亿多汉字,14905.2万亿多字节,13.24 PB。一直以来,出版行业的内容生产机制都是“精英生产内容”,内容数据结构完整统一,加之出版行业拥有“三审三校制”等严格的内容评价与筛选机制,相较于互联网上由敏感词过滤软件来实现筛选的内容,其内容质量更高,知识属性也更为集中。近年来,经过出版机构数字化转型工作的持续开展,大多数出版机构已经对出版内容进行数字化加工,有的甚至进行更有深度的数据挖掘,以便能够为用户提供狭义数据服务、信息文献服务、资源数据库服务、知识服务等不同层级、不同种类的内容数据服务。
2.业务数据
业务数据即出版机构在业务工作中产生的数据,主要包括选题数据、作者信息、生产流程数据、图书信息数据、经销商销售数据、用户消费(包括消费反馈)数据等。这些数据为出版社独有,难以从其他渠道获得,在其自身经营纵向发展过程中起到重要作用。例如,全球领先的学术科技期刊和专著出版商施普林格基于对销售大数据的分析,发现全球学术、科研、政府、企业机构对期刊形式的需求发生了重大变化,88%的机构只需要数字期刊,只有12%的机构需要纸质期刊。于是,施普林格察觉到了从纸质出版向数字出版发展的巨大变化,据此加快了整个公司数字化出版的进度。又如,国内的京东商城与新世界出版社联手打造的“京东出版”系列图书,也是基于对1700万京东用户的消费(反馈)数据分析,继而产生相应选题,实现产销一体化,该系列图书符合大众品味,广受读者欢迎[2]。可见,这些业务大数据是指导出版机构日常经营活动,提升出版决策效率的有力工具。
二、出版行业对大数据的应用思路
如表1所示,出版是一个搜集、筛选、加工、传播信息与知识以供用户使用的过程。大数据时代,无论是出版机构自行应用大数据技术作为分析工具,还是聘请专业大数据技术公司提供相关大数据服务辅助其出版工作,出版行业对大数据的应用都是以数据采集为起点,通过在各个出版环节對海量数据进行连接和预测性分析,得到优于传统模式的内容生产、营销推广、出版评价等环节的新演变。
1.内容生产环节:数据驱动生产模式转变
大数据技术通过不断参与甚至主导出版社和编辑的核心工作领域,改变了传统出版业单一、静态、封闭、固定的生产流程,使以业务和技术为驱动的传统生产模式向数据驱动型生产模式转变。例如,在选题环节,出版机构可以通过征集读者所构想的人物角色和情节线索等信息进行数据过滤,选择完整、真实、干净的数据分析出读者的阅读倾向,并据此筛选出具有巨大潜在市场空间的选题进入生产环节,以及把权威学者或畅销作家列入备选作者名列。与此同时,随着SoLoMo(社交+本地化+移动)模式成为移动互联网时代的趋势,可通过合法授权的移动APP收集用户基本信息、社交关系信息,以及基于LBS技术的地理位置信息,描绘本土化消费者画像,据此准确锁定目标读者群体,测量市场容量,搭建作者创作与读者需求的信息桥梁,实现个性化定制内容和按需出版。
2.营销推广环节:精准营销成为可能
在传统的文化产品营销活动中,由于营销资源有限,出版商往往先选定产品进行资源的重点分配,通过广告宣传和联系评论人(如书评人、影评人、乐评人)等造势手段,开展对新产品的营销活动。但由于近年来文化产品过量生产,营销资源难以平均分配到所有产品中,导致部分产品乏人问津;而另一部分投入大量资源重点推广的产品,也可能由于不符合市场需求而导致营销失败。
大数据时代,出版行业可以基于对用户信息的大数据分析,进行产品广告和试用体验的精准投放,从而使精准营销成为可能[3]。具体而言,从图书产品的提印、入库、发货、退货、结算、库存等关键环节的核心业务数据,可以估算出各图书产品的市场规模以及生产周期,再结合海量在线数据(如图书门户网站、社交平台、运营平台上用户消费行为数据和圈子数据等),进一步分析出不同读者群体的需求和喜好。据此,出版行业一方面可以将电子书章节等数字资源,通过社交媒体或电商网站精准推送给对其内容感兴趣的群体,增加用户黏性;另一方面,还可以将用戶群体使用这些数字资源的行为记录(如浏览足迹、订单信息)、意愿偏好(如点赞、评论)等过程数据记载下来,用于二次分析,实现数据“增值”,从而真正做到“以最小化的营销成本,获得最大化的营销效果”。
3.出版评价环节:构建出版业评价新体系
质量是出版行业保持生命力的关键,因此,出版评价作为评价出版内容质量、鼓励出版优秀出版物、提升出版机构社会效益的重要环节,不应被出版行业所忽视[4]。在传统出版评价模式下,政府主导的各级各类评奖活动构成我国出版业评价的主导力量,虽然权威但不够完善,因此,基于大数据技术开发更为科学完整的出版评价新体系显得尤为重要。具体而言,大数据技术可以帮助出版机构监测和搜集用户购买、评价记录等数据,并基于对数据的分析,实现用户阅读体验和满意度调查研究,重构定性与定量、主观与客观评价结合,专家意见与民间反响、用户满意度并重,实践经验与相关数据互参的出版业评价新体系。解构原先由政府主导的单一评价系统,从而较为全面客观地评价出版行业。此外,这种基于出版大数据的出版评价方式,评价主体多元化,评价方式合理,所得到的评价结果对出版机构调整出版品种结构具有重要的指导意义。
三、大数据给出版行业带来的机遇与挑战
现阶段,我国出版行业正处于转型升级的重要时期,正确理解、科学应用出版大数据,有助于及时抓住战略机遇,突破转型障碍,为出版行业重塑商业模式、预测市场风险等提供新契机。事实上,大数据对出版行业的价值不在于大数据技术本身,而在于为出版行业提供新的思维方式和思考模式:大数据注重从事物的相关关系中观察总体现象和趋势,以创造更多价值[5]。因此,随着出版行业实现对出版大数据的广泛应用,以前无法被集成和参与计算的数字出版内容不再是“信息孤岛”,而是将被连接起来,作为一个可被挖掘、有意义的大数据库,以待更专业化的分析和处理。可以说,大数据浪潮与出版行业的数字化进程息息相关,对大数据的合理应用将有利于出版行业深度定位市场需求、创新营销策略,实现从低层次传播到高层次服务的价值功能转型升级。
虽然出版行业拥有诸多内容与业务数据,能够在一定程度上解决出版机构选题策划、出版营销等问题,但正如微软研究院首席研究员Kate Crawford所说的,“对大数据的过度解读,会导致分析结论的不切实际”[6]。如果过于依赖这些出版大数据,将限制出版人的灵感,更会在一定程度上削弱出版行业的文化传承功能。因此,虽然大数据给出版行业的内容生产流程、营销模式、评价体系等带来变革契机,但出版机构的内容把关人角色未变,即数据的参考价值始终要与出版人对出版市场形势的敏感度、预判力相结合。这就需要加强专业出版人的大数据相关技术能力,培养以大数据为核心的编辑思维和理念。比如,出版机构与学校联合办学,共同制订人才培养方案,合作开放课程和教学内容,以及设置实践项目等方式,培养既懂得数据分析技术,又精通出版业务的专业人才,使他们能够理性客观地研判出版市场的状况,做出更加准确、高效的决策。
|参考文献|
[1]闫翔. 浅谈大数据在出版社的应用思路[J]. 科技与出版,2017(6):80-82.
[2]张月萍. 出版生产、学术研究与出版业评价的“反转模式”——试论大数据时代出版业的新演变[J]. 出版发行研究,2015(3):38-41.
[3]刘鲲翔,杜丽娟,丁雪. 大数据技术在数字出版中的应用前景展望[J]. 出版发行研究, 2013(4): 9-11.
[4]吴赟. 产业重构时代的出版与阅读——大数据背景下出版业应深度思考的五个关键命题[J].出版广角,2013(23):32-36.
[5]李彪,陈璐瑶. 大数据时代传统出版业的对策和路径选择研究[J].出版广角,2013(23): 43-46.
[6] 涂恬. 被“过度解读”的大数据[EB/OL].中国日报网. http://caijing.chinadaily.com.cn/2014-06/11/content_17580
103.htm,2014-06-11.