大数据分析:出版业转型升级的新助力
2015-07-01刘茂林张小强
◎ 刘茂林 张小强
大数据分析:出版业转型升级的新助力
◎ 刘茂林 张小强
大数据分析正在改变出版企业的运营方式,出版业对内容的搜集、储存与传播方式也将因大数据分析的出现而发生深刻变化,大数据分析将促进出版业深度信息化。
大数据;出版;数字出版
一、大数据分析的价值在于预测
大数据(big data),又称巨量资料,一般指的是所涉及的资料信息量巨大到无法通过目前主流软件工具在合理时间内实施抓取、管理和处理的数据集合。大数据环境下,一批世界级的互联网公司如亚马逊等在大数据应用上不断推陈出新,电商、社交网站及智能搜索、网络广告等网络服务也纷纷借助大数据分析提升应用和服务能力。
大数据分析的核心技术是数据挖掘算法,最重要的应用领域是预测性分析,从大数据中挖掘出特点并建立模型,再通过模型带入新的数据,从而预测未来的数据。近年来,大数据分析已经渗透到诸多行业,逐渐成为重要的生产因素。出版实质上是一个搜集、选择、加工、发布信息与知识供用户使用的过程,大数据的出现,对出版的各个环节都产生了重要影响。大数据分析的价值在于预测,通过海量数据的分析,提取有价值的数据关系,从而对选题分析、复制数量、销售渠道和销售行为提供帮助。大数据环境下,出版业是否转型和如何转型值得业界同仁深入思考。
二、大数据分析给出版业带来新机遇
1.出版业的大数据
大数据的构成基础是“小”数据。单个出版社的数据信息,一般可分成两类。一类包含出版社历年的经营数据即品种、出书码洋、销售码洋、销售实洋、回款、利润等,以及作者数据、读者数据、经销商数据等。这类数据一般是结构化数据,可以用数字或统一的结构加以表示。另一类数据信息是出版内容,包含以各种介质发布的数字化出版内容。这类数据是非结构化数据,无法用数字或统一的结构表示。单个出版社的数据信息量,一般在TB级别,很少能到PB级别(1TB=1024GB,1PB=1024TB)。这些数据信息可以用企业ERP管理系统和内容管理系统CMS加以管理,因而笔者称其为“小”数据。
就整个出版行业而言,除了包含行业经营数据和出版物内容数据这种结果数据外,还包含交易数据、专家推荐和读者评论信息这种过程数据。整个出版行业的数据信息量已经非常巨大,达到EB甚至ZB级别(1EB=1024PB,1ZB=1024EB)。同时,据有关机构分析,这些数据80%以上为非结构化数据,并且是快速增加的。整个出版行业的数据很难用一个或几个软件系统加以管理和分析,因而属于典型的大数据。
2.大数据分析创新出版模式
大数据分析有利于提高出版经营活动的绩效,创新出版模式,促进出版业的转型升级,加快数字出版的发展。通过数字阅读与交易平台以及内容数据库、用户信息数据库和销售信息数据库,出版机构能收集大量的用户数据,能够更方便、更精准地分析用户内容偏好和用户购买行为,从而做出产品开发与销售方面的合理预测和判断。
在传媒文化产业中,大数据分析带来新的生产机制早有先例。比如出品方兼播放平台Netflix的一部《纸牌屋》,让全世界的文化产业界都意识到了大数据的力量。据统计,2013年《纸牌屋》的数据库包含了约3000万用户的收视选择、400万条评论、300万次主题搜索。最终,拍什么、谁来拍、谁来演、怎么播,都由数千万观众的喜好统计决定,每一步都由精准的数据引导,从而获得了极高的收视率。可以说,这是部用大数据“算”出来的电视剧,实现了由用户需求决定生产。
与此相似,出版业也产生了名为“粗剪”的出版模式。粗剪是出版商提供的一种服务,这种服务让读者在图书正式出版前就可以看到书稿的内容。只要读者购买了某一本书的粗剪服务,他就可以获取编辑正在编辑加工或作者正在修改的书稿,可以通过在线阅读,或下载书稿的PDF文件,或按需打印书稿。通过对正在编撰或校对的书稿的阅读,读者可以提出对书稿的建议、评论或指出书稿中的错误。这样读者可以直接影响书稿正式出版后的内容。出版商根据读者反馈的数据,不断调整内容,从而使得正式出版的产品获得更广泛的市场认同。
出版机构利用大数据分析进行定制出版的例子还有美国Coliloquy公司。Coliloquy公司专注于亚马逊Kindle平台产品研发,该公司推出了“动态小说”,读者可以对小说人物和故事主线进行选择,编辑或作者再根据大量读者对人物或情节的选择数据调整小说的人物或情节发展,从而实现动态定制出版,定制内容主要集中在爱情小说、科幻小说等类别,被称为大数据背景下的“快销书”。
三、大数据分析急需出版信息化
大数据分析最为重要的基础是数据,最重要的作用是预测。出版企业要通过大数据实现对选题的分析、媒体形态的选择和实现精准营销,首先需要有企业自身的数据和整个行业的数据。换句话说,大数据分析要求出版企业和出版行业必须进行深度的信息化。
1. 大数据分析要求出版企业深度信息化
首先出版企业内部的管理数据、生产数据、销售数据、作者数据、客商数据要有一套完整的管理信息系统进行管理。目前一部分出版企业实施了ERP管理,把选题论证、库房物流、营销、财务等全部整合在一个平台上,数据信息互通、共享。但仍有相当多的出版企业在用多个系统管理各个生产环节和数据,存在信息孤岛,信息不能共享互通。
其次是出版企业要建立基于数字出版的软硬件系统。新闻出版广电总局、财政部《关于推动新闻出版业数字化转型升级的指导意见》(新广出发〔2014〕52号)明确支持传统出版企业构建和完善内容资源数字化、版权资产管理等软硬件系统。但目前只有极少数的出版企业具有完整的从数字内容采集、加工、存储管理到发布的平台。
最后,还需要出版企业把管理流程和数字出版流程相结合,以数字环境下出版业务流程再造实现多形态出版业务流程的协同管理。当然,由于出版企业财、物所限,需要逐步实施和完善上述系统来实现深度信息化。
2. 大数据分析要求出版行业深度信息化
出版业作为信息内容产业,目前已经普遍利用信息处理技术、计算机技术、网络技术来进行生产加工、行政管理和提供服务。但新闻出版行业的信息化还落后于金融、电信甚至制造业,目前还没有达到应该具有的应用水平。出版行业实现深度信息化当前需做好以下工作。
首先是需要尽快推进行业信息标准化建设。目前,我国新闻出版行业的信息化标准工作大大滞后于行业信息化建设的实践,特别是在行业宏观方面、产业链条之间信息交换方面、同一产业链条内不同单位之间的互联互通方面,所需的基础性、共性的信息化标准的严重不足已成为行业信息化建设的主要瓶颈。在大数据强势来袭影响各行各业的当下,管理部门与行业协会、生产企业应形成合力,推动出版行业标准制订和标准执行工作。2014年10月正式出台的《深化新闻出版体制改革实施方案》中的一大措施就是“建立全国统一的出版产品信息交换平台,着力推动出版信息标准化建设”。
其次,出版行业链条上的各环节,特别是出版与销售两个环节,需要尽快加强信息互通。首先要做好企业自身内部的信息化管理,然后在推行行业信息标准的基础上,以开放、合作、共赢的姿态,促进行业信息互通。长时间以来,出版社与实体店商之间由于数据不能有效及时沟通,出版社不能掌握社外在销库存的数据,屡屡造成追加印数决策失误。近几年图书电商渠道崛起,不少出版社电商销售量占销售总额的一半以上,而出版社可以实时查看自己的品种在各大电商的销售情况和库存情况,这对于出版社的选题决策和印数追加都能起到重要的参考作用。
最后,出版行业行政管理部门的工作也需要随之转型。管理部门若不尽快使用网络技术等手段加强对出版行业的管理,将越来越难以起到及时有效的指导、管理监督和服务作用。
四、大数据分析有待出版企业转变思维
1. 因果关系向相关关系转变
大数据时代最大的转变就是放弃对因果关系的探究,取而代之关注相关关系,即只要知道“是什么”,而不需要知道“为什么”。比如,我们通过各个专业网站或数据库的数据分析,得出某一类选题的出版物销售呈快速上升趋势,那么就可以跟进出版这一类选题,而不用去探究为什么这一类选题会受到追捧。又比如电商网站往往能够在顾客买书的时候,推荐顾客刚好喜欢的其他书籍,网站可能不知道顾客“为什么”喜好那些书,其实网站也不在乎“为什么”。
2. 经验判断向数据驱动转变
数据驱动,即出版企业以即时的方式获取、处理和使用数据(内部数据、外部数据),并以此来驱动企业的管理和运营。企业一切的预测、判断、决策依靠数据说话,有别于“拍脑袋”和“经验式”的主观判断,相对客观、科学。特别需要注意的是,数据驱动的出版企业的业务流程应是闭环,即“选题策划-内容生产-营销-服务-互动平台-客户需求-选题策划”式的闭环营运,各个环节之间有数据传递,相互间提供数据支撑。
3.产品生产向信息加工转变
传统出版企业一般重点关注产品生产流程与生产周期。事实上出版企业是传播知识、观念和思想的企业,本质上说也是在传递信息。因此,我们的关注点需要转移到信息把关、信息加工、信息呈现方式和信息传递的快慢上来。这样的好处在于数据分析可以贯穿在出版全过程之中,并能不断优化企业的生产与运营。
4. 客户关系向用户关系转变
客户关系于企业的重要性不言而喻,不少出版企业都有自己的CRM系统。于出版企业而言,一般重点关注的客户就是经销商、书店和各大电商,客户关系的维护往往需要较高的成本投入。然而,在目前图书市场饱和、产品同质化严重的当下,只注重客户关系是完全不够的,我们更需要了解终端用户即读者的需求、意见和建议。这要通过搭建读者与出版社之间沟通的平台来获取用户信息。出版社通过对获取的用户信息及行业数据进行分析,可以提供更高的内容质量,以更适合读者接受的载体形式来传递读者最需要的内容。
大数据分析既是一种技术,也是一种思维方式。大数据将考验出版业的数据采集、分析与整合能力。大数据时代,出版企业必须具有大数据思维,不断积累、沉淀数据,打通获取行业数据的通道,培养数据分析的习惯,主动开展数字化转型升级,以实现跨越与发展。
(刘茂林,重庆大学出版社有限公司副社长,副编审;张小强,重庆大学新闻学院副教授,硕士生导师,法学博士)
[1] 吴赟.产业重构时代的出版与阅读——大数据背景下出版业应深度思考的五个关键命题[J].出版广角,2013(12)上:32-36.
[2] 李薇.大数据时代,数字出版需要关注什么[J].出版参考,2013(11)上:17.
[3] 孙玉玲.大数据时代数字出版产业的发展趋势[J].出版发行研究,2013(4):5-8.
[4] 宋永刚.大数据时代加快出版业转型升级的思考[J].中国编辑,2013(5):13-17.
[5] 石佳靓.大数据:出版产业的机遇与实践[J].中国出版,2014(6)上:44-47.
[6] 刘茂林.粗剪——一种开放的数字出版模式[J].编辑之友,2010(11): 65-66.