APP下载

运用大数据进行出版服务转型升级

2016-07-26□文│刘

中国出版 2016年8期
关键词:数字阅读数据挖掘大数据

□文│刘 硕



运用大数据进行出版服务转型升级

□文│刘 硕

[摘 要]分析了当前读者阅读特点和大数据分析在读者阅读、出版服务决策优化领域的应用可行性、适用性和具体流程。研究表明,数字阅读正逐渐成为人们主流的阅读方式,我国文化传媒和出版服务企业已经具备了利用大数据分析读者阅读规律进行服务优化的基本条件,企业经营模式转型升级势在必行。

[关键词]大数据 数字阅读 数据挖掘

随着数字技术和信息技术的高速发展,人们的阅读习惯已经产生了重大变革。鉴于网络阅读资源的丰富、检索的便利以及数字阅读设备的便捷性等优势,数字化阅读逐渐受到人们的追捧。与此同时,随着互联网应用的深化和数据分析技术的发展,大数据已成为时下的一个热门话题。大数据时代,人们日常的行为和网络应用都会被互联网记录并有效保存,即人们的日常行为规律均隐含在大数据背后。热衷于数字阅读的读者的阅读规律和文化需求同样会蕴含在大数据中,探索读者阅读规律、迎合读者阅读及文化消费需求,将会为传统文化传媒和出版服务企业的发展带来新机遇。

一、大数据时代读者阅读现状

数字技术的发展和人们生活节奏的加快,使得时下人们的阅读方式产生了重大变革,以印刷型媒介为主要载体的传统阅读比重正在逐渐减少,具有资源丰富、检索便利、携带方便等优势的数字阅读正为越来越多的读者追捧。所谓数字阅读即阅读的数字化,包括阅读内容的数字化,如网络小说、电子书、电子地图、博客、数码照片、网页等;还包括阅读终端或阅读载体的数字化,如MP3、MP4、阅读器、手机、电脑、数字电视等。[1]鉴于数字阅读的资源丰富性和便捷性,我们可以随时随地地看到利用手机、便携式平板电脑、电子书阅读器如Kindle等移动终端阅读的人们,以及利用音频进行“听书”的“读者”,甚至对数字设备使用并不熟练的中老年人也正加入到数字阅读人群当中,数字化阅读已经遍及各个人群、遍布人们社会生活轨迹的各个角落,可以说,数字阅读促进了全民阅读事业的发展。

在数字阅读为读者带来资源和便利的同时,数字阅读的相关应用同时记录下了人们的阅读习惯,这为文化传媒企业和出版企业的传统阅读服务和出版服务转型升级提供了新的机遇,文化产业的大数据时代业已到来。大数据革命是当今信息技术的又一次重大变革,计算机、互联网、数字技术的高速发展推动了大数据时代的到来。2013年被国内外许多媒体称为“大数据元年”,大数据记录了人们社会生活的轨迹和规律,这其中当然也包含利用数字终端进行数字阅读的读者行为规律,探索大数据隐藏的规律、迎合人们的需求已成为各行业企业必须慎重考虑的议题,不难想象,大数据将会对传统产业的经营模式产生巨大冲击,基于经验的传统文化服务模式亟须向基于大数据与用户需求的全新服务模式转型。

二、基于大数据分析的读者阅读、出版服务可行性与适用性分析

大数据是指无法通过现有主流(常规)技术和工具软件在可接受的时间内管理、处理和分析的数据集合。[2]因此,应用大数据进行服务决策优化,至少需具备“组织数据集合”和“技术工具软件”两个基本条件。基于我国文化传媒和出版业的整体信息化水平,其中的绝大部分企业都已经基本具备了这两个条件,可以尝试利用大数据分析进行读者阅读和出版服务的优化升级。

1. 应用大数据分析的基本条件

对于读者大数据,联机分析处理和关联分析、序列分析等数据分析与数据挖掘技术可以很好地探索其中隐含的阅读规律和服务需求,进而了解不同群体的阅读特点与偏好,据此进行有针对性的出版发行、推介等阅读出版服务,提高读者用户的满意度,创造基于大数据和读者需求的商业价值。

联机分析处理(Online Analytical Process, OLAP)是使数据分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解并真实反映企业特性的信息,进行快速、一致、交互的存取,从而获得对数据的更深入了解的一类软件技术。[3]关联分析是最常用的数据挖掘方法,其最早用于分析大量消费者交易记录中隐藏的购物模式,主要目的是从数据中寻找商品之间的关联性,以制定商品组合营销策略。[4]序列分析是通过用户浏览网页或网络应用的数据进行的路径、轨迹分析,可以有效了解用户遍历网页和使用网络应用的顺序和习惯。

从目前大数据的主流分析和挖掘技术的概念中不难看出,应用这些大数据分析与数据挖掘技术至少需要读者阅读和出版服务提供者满足两个基本条件。一是服务提供者具备收集、组织读者阅读行为特征数据的能力;另一个是能够对这些读者阅读大数据进行分析、挖掘的算法和软件工具,阅读和出版服务提供者需要配置专业的大数据分析或挖掘工具,或者至少需要具备利用常规工具软件进行高端数据分析应用、实现大数据分析算法的能力。

2. 基于大数据分析的可行性分析

时下文化传媒和出版服务企业多已实现了管理信息化和业务网络化,也因此在为读者提供服务的同时,正在记录着读者各种类型的需求数据,只不过单独企业所存储的数据量更小,而且这部分数据大都处于支持企业日常工作的形态,并未被有效地组织形成支持大数据分析的分析型数据。也就是说,目前文化传媒和出版服务企业已经具备了收集、储存、管理应用于大数据分析的初始业务数据的能力,对这部分业务数据进行适当扩充和有效组织即可生成专门针对联机分析处理和数据挖掘等大数据分析技术的分析型数据集合。从这个角度分析,文化传媒和出版服务企业已经具备了应用大数据分析进行读者阅读和出版服务升级的数据条件。

对于大数据分析所需的复杂算法应用软件和硬件设施,文化传媒和出版服务企业可以通过购置专业的软硬件实现大数据分析和应用,当然这需要企业投入较大的资金成本,同时会带来管理流程的较大变革,会对企业的经营稳定性带来一定影响,而且短期内的经济效益可能并不明显。对于那些没有意愿或无法承担软硬件升级成本的企业而言,利用当前现有的软硬件技术条件或借助第三方网络平台的部分应用,同样可以实现大数据分析的部分技术,以解决企业最为迫切的服务决策升级问题。实际上,目前文化传媒和出版服务企业日常的数据库和数据处理软件如Microsoft Access、SQL Server甚至办公软件Excel就可以实现初始业务数据向大数据分析用数据的组织;对于实现大数据分析算法的应用软件,可以利用日常办公软件和国内外研究机构开发的免费大数据分析软件实现,如应用最为广泛的Office办公软件Excel的数据透视功能可以完美地实现大数据的联机分析处理,新西兰怀卡托大学(The University of Waikato)自主研发的免费数据挖掘工具Weka可以便捷地实践诸如关联分析、序列分析等常用的大数据分析算法,因此,软硬件技术条件并不是文化传媒和出版服务企业应用大数据分析的障碍。

综上所述,就目前我国文化传媒和出版服务业整体信息化水平而言,已经具备了应用大数据分析提升读者服务决策科学性、推进读者服务升级的必要条件,大数据分析技术在阅读服务和出版发行决策优化领域具有应用可行性。

3. 基于大数据分析的应用性分析

大数据分析的核心是要探索隐含在数据背后的读者阅读规律和潜在需求,进而以迎合读者需求为出发点,提供更为优质的读者阅读服务和出版发行服务。因大数据分析的算法不同,得出探索的读者阅读规律和需求也不同,文化传媒企业和出版服务企业应根据自身业务特点和所需解决的问题,选择适当的大数据分析技术。

联机分析处理(OLAP)是一种从不同视角分析读者阅读和需求数据的分析技术。我们将分析数据的角度称为“维度”,如“时间”“地点”“阅读时长”“阅读类型”等;同时将企业感兴趣的、需要进行深入分析的数据称为“度量值”,如读者的“阅读次数”“下载次数”“购买数量”等。这样通过对读者书刊阅读和购买数据进行不同角度的分析汇总,我们可以回答诸如“女性读者在某一时间段阅读文学类小说的总人数和比例是多少?”以及“读者在何时购买何种类型的书刊数量最大”等一系列阅读和购买习惯问题。基于此类数据分析,文化传媒和出版服务企业就可以根据读者阅读和需求偏好,有针对性地进行营销和推介服务,在满足读者需求的同时提高自身服务品质。

关联分析的主要目的是探索挖掘大数据背后隐藏的读者阅读关联规则,特别善于回答企业诸如“读者经常阅读或购买哪几类书刊?”“阅读或购买了这本图书的读者,还有可能阅读或购买另外哪几本图书”等“组合需求”问题。基于大数据的关联分析,文化传媒和出版服务企业就可以进行“出版物组合”推介营销。此外,将分析的读者阅读购买组合规律与联机分析处理得出的读者阅读购买汇总规律进行结合,就可以将企业基于读者单一阅读规律的服务决策扩展为组合式服务决策,如此可以更好地满足读者需求同时提升自身服务满意度和出版物阅读量、销售量;再辅以序列分析探索读者网络浏览的顺序与习惯,有效安排书刊信息推介的网络位置即可有效提高推介信息接受率。

不难看出,基于大数据分析的读者阅读和出版发行服务均是以企业的核心服务对象——读者需求为出发点,其服务决策可以更好地迎合读者阅读需求,有效提高企业服务满意度,提升企业业务水平,为文化传媒和出版服务企业带来可观的商业价值。因此,大数据分析技术在读者阅读和出版服务决策支持和优化领域具有很强适用性。

三、基于大数据分析的读者阅读、出版服务决策流程

大数据分析是解决企业实际问题的数据分析与挖掘技术,是问题驱动式过程,其原动力即在于企业亟须解决的业务问题。因此,对于文化传媒和出版服务企业,首先需要进行明确的问题定义,提出希望获悉的读者阅读和需求规律。此外,由于不同类型的问题需要不同的数据组织形式和算法,因此,企业还需要明晰提出问题的类型,如具体希望获悉多角度汇总数据类规律、关联规则或序列规则等,以便根据问题选择适当的算法和软件工具以及相匹配的数据组织形式。

企业在问题定义后需要根据所需解决的问题、问题类型和相应算法组织数据,即将日常业务数据如书刊阅读量、书刊类型、书刊销售量、网页访问量等按照具体应用的大数据分析算法和软件的要求,组织形成分析用数据源。具体而言,如果利用联机分析处理进行数据的多角度汇总观察,需要将数据组织成多维形式;利用Weka数据挖掘软件进行关联规则挖掘则需要利用二分法(YES或空值)标注读者是否阅读或购买了某一本或某一类型的书刊;利用时间序列数据按时间或顺序记录读者的网页或书刊阅读次序。

按照大数据分析算法和应用软件的要求进行数据组织后,即可利用适合的算法进行大数据分析。大数据分析不同算法技术的应用过程不尽相同,如联机分析数理技术属于演绎推理型大数据分析技术,每一个分析步骤都需要企业提出具体的问题,逐层深入,进而挖掘读者潜在偏好;利用关联分析进行关联规则挖掘过程只需在运行算法程序前输入适当参数,分析过程便可自动完成;序列分析则需要不断进行试算,以找到读者最为显著的浏览、阅读次序。

获得大数据分析结果后,尚不能直接用于读者阅读和出版服务决策支持与优化,还需要对所得结果进行评估,考虑分析结果是否与现有结论相矛盾,是否具有可行性,是否具有商业价值。如果大数据分析所得结论是以前未知的、具有可行性且能够带来商业价值,则进行知识同化,即根据大数据分析结论和企业自身经营状况,提出合理的读者阅读和出版服务对策并将其常态化;反之,如果大数据分析所得结论并不能满足文化传媒和出版服务企业的决策需求,则需要重新进行问题定义、数据组织、数据分析与结果评估,直至得到令企业满意的结果,再进行知识同化进而提出合理的阅读服务和出版服务决策。

基于大数据分析的读者阅读与出版发行服务决策流程如图1所示。

图1 基于大数据分析的读者阅读与出版发行服务决策流程

需要说明的是,以上只是解决读者阅读需求服务某一个或某一类特定问题、依据一段历史数据进行大数据分析的应用流程。当文化传媒和出版服务企业面对全新的问题时,需要重新进行问题定义,并依此流程解决新问题。此外,随着信息技术和阅读媒体软硬件技术的更新换代,读者的阅读规律和偏好随时可能发生变化,因此,大数据分析应转变为文化传媒和出版服务企业的常态工作并将其融入日常经营流程中,做到尽早了解读者潜在需求、优化服务决策、提升服务质量,增强企业在大数据时代的商业智慧和核心竞争力。

四、结语

2014年,我国出台了多个文化产业相关扶持政策,为“十三五”时期文化产业发展方向奠定了基调,即以“逐步发挥市场在资源配置中的决定性作用”作为主线贯穿我国文化产业发展路径。[5]非公有制文化企业的准入、小微型文化企业的扶植将会给整个文化产业市场带来更为激烈的竞争;大力度的金融扶植政策将使得有特色、优质的文化企业获得更多的融资机会和更广阔的发展空间。我国传统的文化传媒企业和出版服务企业已经处于转型升级的关键时期,提高自身服务质量、进行文化服务创新和转型升级已迫在眉睫。企业的文化服务创新、转型升级的目的即在于满足用户的文化需求,对于文化传媒和出版服务企业而言,仅仅满足读者的显在需求并不足以带来优势竞争力。因此,如何探究读者的潜在需求甚至是读者自身都没有意识到的隐性需求已成为企业亟须解决的问题。

大数据时代的到来为文化企业带来了全新的机遇,大数据中蕴含的读者规律为企业提供了全新的商业价值挖掘空间。因此,基于大数据的企业经营模式是文化传媒和出版服务企业未来发展的必经之路。大数据时代的经营模式转型涉及企业的软硬件升级、业务流程重组、人力资源配置等诸多方面的调整,是一项复杂的系统工程,需要有规划、有步骤地推进,否则可能会造成转型低效益甚至转型失败。就当前我国文化传媒和出版服务企业总体信息化水平而言,首要的工作是转变传统的经营观念,以满足读者需求为经营出发点,以现有软硬件条件和人力资源为依托,逐步提高大数据分析对日常管理和业务决策的支持力度,渐进实现大数据的商业价值,期间有规划地进行软硬件升级和人才培养,最终实现大数据时代的读者服务转型升级,推进我国全民阅读事业,促进我国文化产业的繁荣。

参考文献:

[1]段一,胡耀华.数字阅读:变革与反思[J].中国出版,2010(20)

[2]黄孝章,刘益.大数据时代出版业发展趋势研究[J].科技与出版,2014(10)

[3]何玉洁,张俊超. 数据仓库与OLAP实践教程[M].北京:清华大学出版社,2008:5

[4]刘硕.基于关联分析的出版社图书出版发行实证研究[J].科技与出版,2014(6)

[5]人民网.2014年文化产业政策奠定“十三五”期间发展方向[EB/OL].[2014-01-10].http://culture.people.com.cn/BIG5/ n/2015/0110/c172318-26360027.html

作者单位:(北京印刷学院经济管理学院)

猜你喜欢

数字阅读数据挖掘大数据
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
农村用户数字化阅读培养策略研究
近十年我国数字阅读的发展状况与趋势
手机阅读平台用户体验影响因子分析
基于大数据背景下的智慧城市建设研究
高级数据挖掘与应用国际学术会议
高级数据挖掘与应用国际学术会议