大数据时代出版业的演进与变革
2014-02-04邓佳佳
文/ 邓佳佳
在互联网、物联网、云计算等一系列新技术背景下,全球数据信息呈现出前所未有的爆炸式增长,大数据的概念应运而生,大数据蕴含的价值日益显现,《大数据时代》一书的作者、牛津大学教授维克托·迈尔-舍恩伯格开篇直陈:大数据开启了一次重大的时代转型,大数据正带来一场生活、工作和思维的大变革。全球著名咨询公司麦肯锡发布报告指出:数据已经渗透到当今每一行业和业务领域,逐渐成为重要的生产要素。人们对于海量数据的运用,预示着新一波生产率增长和消费者盈余浪潮的到来。[1]大数据与以知识和信息为核心的出版业有着天然的联系,将重塑出版业的生产模式、商业模式,无疑会对整个出版业的变革产生深刻影响。大数据究竟会给出版业带来什么?出版业如何迎接大数据时代的机遇和挑战,实现转型创新和跨越发展?这是出版业和这个时代值得思考的问题。
一、大数据时代出版业的新思维
从起源来看,大数据是指需要处理的信息量过大,已经超出一般电脑在处理数据时所能使用的内存量。海量数据信息的极速扩张催生了人类思维的革命,大数据时代信息分析和思维方式的三个重要转变也必将深刻影响出版业。
第一个转变是,在大数据时代,我们可以分析更多的数据乃至所有的数据,而不再依赖随机采样分析。与局限在小数据范围相比,使用一切数据让我们更清楚地看到了样本无法揭示的细节信息。[2]在传统出版时代,图书出版的前期调研往往采用随机抽样问卷调查、座谈会等小数据分析方式,成本高、效率低,容易造成决策和判断上的偏差。而大数据时代,出版社可以更实时、准确地分析行业整体情况、市场供求等信息,从而更好地获知潜在需求,赢得发展机会。
第二个转变是,在大数据时代,我们要接受混乱和不确定性,而不再热衷于追求精确性。执迷于精确性是信息缺乏时代的产物,拥有了大数据,不再需要对一个现象刨根究底,只要掌握大体的发展方向即可。相比依赖于小数据和精确性的时代,大数据因为更强调数据的完整性和混杂性,所以更进一步接近事实的真相。[3]这样的思维方式对于今天激烈竞争的出版业是一个重要启示。传统出版业迫切需要改变“精耕细作”的传统方式,但如果不能退一步看清整个出版业发展的大方向,如果不能利用大数据快速作出整体决策判断、把握机会,就可能面临被淘汰的命运。
第三个转变是,在大数据时代,我们无须再紧盯事物之间的因果关系,而应该寻找事物之间的相关关系。[4]在海量信息中寻求因果联系,无疑是大海捞针,只要寻找出相关性即可。相关关系的探索在图书出版销售领域已经得到应用。亚马逊基于数据的图书推荐系统大幅提高了图书销售量,该推荐系统梳理出了有趣的相关关系,但不知道也无须知道其背后的因果关系。
二、大数据时代出版业的发展演进
美国学乐(Scholastic)出版社通过在线游戏追踪最吸引人的线索和角色,以此为基础创作了全球畅销书《39条线索》(The 39 Clues)系列小说;美国克雷克(Coliloquy)出版公司的电子书允许读者参与设计人物角色和情节线索,通过数据分析调整内容,迎合大众口味。[5]大数据无疑已经带来了出版业的发展和变革,而且这场变革影响必然是深远的,涉及需求调查、出版生产服务、出版销售等方方面面。
1.需求预测的科学化
大数据的核心是预测,大数据在许多行业中的一个主要诉求就是洞悉、预测消费者需求。一直以来,传统出版业被认为是一个专业性和感性的行业,很多时候依靠经验甚至直觉对图书出版作出判断和决策。从实际来看,在洞悉消费者需求方面表现欠佳。2013年,我国图书出版品种达到44.4万种,而我国18~70周岁国民图书阅读率却仅有57.8%,人均纸质图书阅读量也仅为4.77本,比2012年下降了0.02本,52.8%的国民都认为自己的阅读数量很少或比较少。人均纸质图书阅读量的下降一方面是受数字化阅读方式日益流行的影响,另一方面,也有很多读者表示尽管市场上销售的图书品种很多,但是能够引起阅读兴趣的书却非常少。产生图书供给与需求结构性矛盾的最直接原因是读者需求预测失效。[6]
在大数据环境下,这一状况将得到根本改变,大数据技术通过数据搜集、分析,出版业对于市场需求、消费者偏好将有更为精准的把握和科学的预测。2012年,美国一家视频网站奈飞(Netflix)基于大量北美用户观看视频时留下的行为数据,分析发现一部影片如果同时满足英国广播公司(BBC)出品、导演是大卫·芬奇、演员为凯文·史派西等组合元素就可能成功,于是推出自制剧《纸牌屋》,果然大受欢迎,在第65届艾美奖评选中获得了9项提名。这一成功是大数据时代海量用户数据积累和分析的结果,依靠大数据精准预测市场需求。2014年3月,电商京东基于对1700万用户的销售数据分析,发布其新品牌“京东出版”的首部图书《大卫·贝克汉姆》,引起广泛关注,这是国内运用大数据科学分析预测图书市场需求的一次重要尝试。
2.出版生产的智能化
在科学预判消费者需求的基础上,大数据支持出版企业以理性工具和方法确定出版选题和策划方案,以数据整合分析指导图书出版生产,提高图书出版的质量、效率和智能化程度。大数据时代,图书内容生产的主体将拓展和延伸,图书出版更多地以读者为中心,编辑可以以读者评论数据、读者对类似书籍和作者的评价等为基础向作者提出修改建议,读者对作品篇幅、文字风格、情节发展等方面作出的评价可以形成内容生产的储备资源。在编排制作方面,可以通过编纂交互平台中留下的修改记录、交流记录、时间记录等数据,发掘编纂过程中的关键环节、效率控制、专业经验和技巧等,从而进一步优化编排制作过程。在确定图书印数方面,可以通过收集、分析相关内容图书的销量、库存、读者分布、读者评论等数据,判断市场需求的基本规模,从而更准确地确定图书印数,避免图书库存和资源浪费。
3.出版服务的个性化
随着现代生活节奏的加快、移动互联网以及各种移动终端的兴起,阅读内容和时间的“碎片化”成为一种社会发展趋势。顺应这一趋势,出版企业可以利用大数据分析技术,深入挖掘个性化的阅读需求,为用户提供个性化的产品、信息定制服务。个性化定制服务尤其适用于现代数字出版和数字阅读,数字内容个性化定制平台可实现与手机、平板电脑、智能电视等各种终端和微博、微信、腾讯通信(QQ)等社交媒体的无障碍连接,提升阅读体验和方便分享消费体验。同时,随着出版大数据的深度开发和利用,出版企业的服务不再局限于提供图书内容,还为用户提供所需要的关联数据、交互信息等服务。例如,谷歌(Google)推出的图书数据库包括从1500年到2008年间出版的各类图书的5000亿个单词,用户可通过输入特定单词查看这些单词历年来的使用频率,满足用户对相关数据的个性化需求和交互式服务。
4.出版营销的精准化
“在大众销售的历史中,我们第一次可以看到每个消费者的头脑的内部。得到关于消费者的全景视图一直是销售和营销团队长久以来的愿望,但是今天,如果我们智能地连接数据,深刻理解个体消费者就能变成现实”。[7]出版营销的核心同样是掌握、激发并满足消费者深层次需求。长期以来,出版企业通过经验、直觉或抽样数据来预判图书消费需求和偏好,很容易出现偏差。今天,大数据技术可以使我们更清楚地了解用户特征、用户行为、阅读偏好、生活范围乃至情绪好恶等,我们可以通过系统的数据挖掘和分析,洞悉目标用户的阅读喜好和习惯,让产品和服务真正做到“投读者所好”,极大地提升出版营销的精准性。出版企业可以根据用户消费水平、选择偏好、常用支付方式等数据选择合适价位和类型的图书以合适的渠道进行推送;根据用户阅读偏好、职业信息和专业领域等数据进行图书的按需推送;根据用户阅读时间、场所、强度、终端等阅读行为数据确定推送图书的篇幅、类别、载体以及推送时间等。此外,通过对社交网站用户间关系进行分析,可以辨别出有着不同兴趣爱好和消费能力的“小圈子”,按“小圈子”进行市场细分和精准营销。借助大数据的网络销售精准营销早已开始,前面谈到的美国在线销售书商亚马逊公司基于大数据分析建立起有效的购书推荐系统,实现精准推荐和营销。该推荐系统的创立者格雷格·林登说,如果系统运作良好,亚马逊应该只推荐你一本书,而这本书就是你将要买的下一本书。[8]受到网络图书销售的巨大冲击,实体书店也依托大数据进行市场重新细分和精准营销,分析哪些读者群到网上去,哪些继续留在实体书店。可以说,直觉的时代已经走到了尽头,“捣弄数据”将成为提升出版营销精准性最重要的基础。
三、出版业应对大数据时代的现实困境与出路
2012年,国际商业机器有限公司(IBM)对64个国家及地区从事19个行业的1700名首席营销官开展的调查显示,71%的被调查者表示,他们的企业还没有做好充分准备来应对大数据的挑战。[9]对于历史悠久的出版业而言,“大数据”这一概念还比较新鲜,传统出版业正处在向数字化转型的关键时期,唯有提前布局、主动应变、创新突破,才能在新一轮变革中立于不败之地。
1.数据资源的整合与利用
应对大数据时代的第一步是收集、占有可能的数据。对于出版企业内部来说,数据资源主要包括经营管理数据、出版物数据、交互数据。经营管理数据可以依托企业ERP(企业资源计划)系统积累和挖掘生产数据、财务数据、管理数据、资源统计数据等,深入把握企业的内部管理和市场表现;出版物数据可以通过对出版物的数据化与数据库建设,形成原数据,提供数据服务;交互数据是基于出版企业互动网络平台获取的用户注册信息、用户行为记录、用户需求信息、用户交易记录、用户评价信息等。对于出版企业外部来说,还可以与专业数据公司、社交网站、电商等合作,获取第三方数据信息。
但目前大多数出版企业的数据信息平台构建远未成熟,不少企业处于“数字化”转型探索阶段,自身内部的数据收集、存储不足,而且利用第三方数据面临高昂的成本问题。因此,出版企业必须首先完善自身的数据资源平台,收集和整合数据资源,打造大数据的基础能力。当然,并非所有的出版企业都有足够的资源、能力打造自身的数据系统。行业联动进行数据资源整合也是一个路径,2013年6月,《中国出版物在线信息交换》行业标准(CNONIX标准)正式发布,以出版系统、发行系统、网店系统、图书馆系统为基础搭建数据交换平台,行业大数据信息平台的建设可以消减信息孤岛现象,实现数据资源共享,从而提高协同效率。
当然,大数据技术的战略意义不在于是否掌握庞大的数据信息,而在于如何对这些信息进行再利用。收集信息固然至关重要,但还远远不够,因为大部分数据价值在于它的使用,而不是占有本身。[10]大数据时代更加注重通过信息数据的筛选、过滤、分析、加工实现信息数据的增值,这对于当今的出版业来说尤其重要。
2.数据人才的发掘与培养
在大数据时代,出版企业必须依靠专业数据人才,在数据的纷繁复杂中发现本质、价值和细微差别,将无价值的信息和真实有用的信息区分开来、利用起来。专业数据人才既要对运营处理本企业积累、收集、搭建的数据库,又要实现企业网络运营平台和社交网站、数据公司等方面的合作对接。他们不仅要善于收集、整理、分析数据,更要能够结合本企业自身的发展,找出数据背后隐藏的挑战和机遇。这样的数据人才相对匮乏,而数据技术企业的数据人才并不懂出版。因此,发掘和培养具有较高的数据素养、熟悉出版业务的专业数据人才成为出版业应对大数据时代的一项紧迫任务。
183****8081:黄昏里,古巷中,老树下。老人机,发短信,求上墙。期中考,心好慌,求小意,上个墙。
3.数据安全的管理与保障
大数据也是一把双刃剑,在改善我们生活、工作的同时,也极易引发数据滥用、侵犯隐私等违反法律与道德的行为。大数据的精细、精准、丰富及其广泛应用极有可能导致个人隐私泄露的风险,甚至危及个人人身财产安全。在法治思想深入人心的今天,我国应当借鉴美英等发达国家经验,制定《隐私保护法》《数据保护法》等法律,严格约束和惩罚侵犯个人隐私和数据安全的行为。大数据的倡导者维克托·迈尔-舍恩伯格在《大数据时代》一书中提出,在大数据时代,我们需要设立一个不一样的隐私保护模式,即从个人许可是否允许以及由谁来处理他们的信息到数据使用者为其行为承担责任。在这种模式下,监管部门可以决定不同种类的个人数据必须删除的时间,公司可以利用数据的时间更长,但数据使用者也要为敷衍了事和不达标准的保护措施承担法律责任。此外,也需要发明并推行新技术方式来促进隐私保护,一个创新途径就是“差别隐私”:故意将数据模糊处理,促使对大数据库的查询不能显示精确的结果,而只有相近的结果。这就使得特定个人与特定数据的联系难以实现并且耗费巨大。[11]
4.决策惯性的调整与变革
面对大数据的汹涌浪潮,我国的大部分出版企业在数据应用方面仍处于起步阶段,大数据在出版业还停留在概念层面上,少有出版社对此下大功夫,在决策的思维上仍然是传统而保守的。大多数出版企业的经营管理决策建立在经验基础或传统粗糙的数据统计分析基础之上。要让出版业界适应大数据时代“样本=总体”、不固守精确判断而接受模糊和不确定性、注重相关关系而放弃对因果关系的执著探索,摒弃“拍脑袋”的直觉传统,运用大数据思维和方法进行决策和管理,这是一个不小的转弯,决策惯性的调整与变革尚需要很长的时间。
四、余论
大数据给出版业带来前所未有的机遇,数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下。但大数据是一种资源和工具,它指导人们去理解,但有时也会引起误解,这取决于是否被正确使用。大数据的力量是那么耀眼,我们必须避免被它的光芒诱惑,并善于发现它固有的瑕疵。[12]比如大数据不能颠覆出版的知识属性、文化风格和思想深度,出版业应保持对大数据分析可靠性和真实性的审慎怀疑。
注释:
[1]James Manyika,Michael Chui,Brad Brown,etc.,Big data:The next frontier for innovation,competition,and productivity [R/OL].[2011-05],http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation
[2][英]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013 :17
[4][英]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013 :18
[5]杨鑫倢.终有一天 大数据会“颠覆”出版业[N].IT时报,2013-08-19
[6]刘银娣.数据驱动出版:基于大数据的传统出版模式变革研究[J].中国出版,2014(8)
[7][德]比约·布劳卿,拉斯·拉克,托马斯·拉姆什.大数据变革——让客户数据驱动利润奔跑[M].沈浩,译.北京:机械工业出版社,2014:XV
[8][英]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013 :69
[9]耿秋,孟剑.大数据时代 机遇?挑战?[J].中国新时代,2012(6)
[10][英]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013 :156
[11][英]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013 :220-222
[12][英]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013 :247