国内电子书研究的文献计量分析
2013-12-29李镜镜张志强
[摘 要] 采用文献计量学方法,对中国知网“中国学术期刊网络出版总库”中收录的有关电子书研究学术论文,从文献增长、著者、期刊、关键词等方面进行较为详细的统计分析。梳理国内电子书研究发展现状,揭示该主题研究论文的分布规律,并通过关键词词频统计分析,建立高频词共词表,归纳国内电子书研究重点和研究热点。
[关键词] 电子书 文献计量学 CNKI
[中图分类号] G237 [文献标识码] A [文章编号] 1009-5853 (2013) 04-0085-06
[Abstract] Based on China Academic Journal Network Publishing Database, the paper did a bibliometric research on the journal articles about e-books in China. It made a large scale of quantitative analysis from many aspects such as literature growth and distribution, author distribution, source journals and citations, keywords and so on to reflect the overall development and hotspots of e-book research in recent years. Finally, with the deep analysis of key words, it generalized the current research hotspots and key points of e-book research.
[Key words] E-book Bibliometrics analysis CNKI
随着知识和信息一体化社会的到来,传统的文化生产方式随着数字技术的发展而产生革命性的变更。电子书的诞生和发展是人类几千年文化生产的创新性延续,是对传统出版业的一次颠覆。如果说迈克尔·哈特(Michael Hart)1971年发起的“谷登堡计划”中数字化的《美国独立宣言》(United States Declaration of Independence)还只是电子书雏形的话,那么美国畅销小说作家斯蒂芬·金(Stephen King)在2000年与西蒙·舒斯特(Simon & Schuster)出版公司合作以电子书形式发表小说《骑弹飞行》(Riding the Bullet)则掀起了电子书的狂潮并迅速席卷全球。其后电子书作为数字出版的一种重要形式,在不断探索标准格式、盈利模式、版权保护和新出版流程中经历了一段较为曲折的发展低谷期。2004年,采用电子墨水技术(E-ink)制造的电子书阅读器横空出世掀起了电子书发展的第二轮热潮。近年来,亚马逊Kindle模式和苹果iPad模式的盛行,则将这股热潮推向顶点。“国内电子书产业因为电子书阅读器的火爆而持续升温,电子书被视为传统出版数字化转型的重要拐点,产业前景被业界普遍看好,平台服务商、内容提供商、网络运营商、硬件制造商、网络分销商等各方纷纷涉足电子书产业”[1]。
与业界的火爆相对应,电子书相关研究也成为学界关注的热点。本文通过对电子书研究领域相关论文进行文献计量分析,试图揭示论文分布规律,归纳研究重点和热点,为将来的电子书研究提供借鉴和参考。
1 数据来源和分析方法
发表电子书相关研究成果的期刊范围较广,加上对时间跨度和代表性等因素的考虑,本研究选定的数据来源为中国知网的“中国学术期刊网络出版总库”。这是目前中国最大、收录最全的学术期刊全文数据库,文献报道量大、来源广泛、检索方便,且具有较高的准确性和可靠性。截至2012年10月,其收录的国内学术期刊达7900多种,其中核心期刊收录率达96%。为了保证研究数据的准确性和可参考性,本研究将非学术类论文以及引文率和读者利用率相对较低的论文剔除,并将论文来源类别限定为核心期刊。
检索时间为2013年3月21日。为了保证检索结果的查全率和查准率,选择“题名”和“关键词”进行检索限定,构建检索式为:TI=(‘电子书’OR‘电子图书’OR‘电纸书’OR‘ebook’OR‘electronicbook’OR‘e-book’) or KW=(‘电子书’OR‘电子图书’OR‘电纸书’OR‘ebook’OR‘electronicbook’OR‘e-book’)。发表时间限定为2012年之前,共检索出1471条结果。经过查重并剔除与研究主题无关的论文以及会议通知、新闻报道、访谈等干扰文献,最后得到有效统计记录为1127条。
研究方法为文献计量分析法,主要涉及文献增长分析、著者分析、期刊分析、关键词分析等方面。选用SPSS 18.0和EXCEL作为统计工具对数据进行统计分析。
2.1 文献增长分析
将检索得到的1127条记录按照年代分布统计,得到如图1所示的电子书研究论文年载文量分布折线图。可以看出最早的一篇论文出现在1992年。2000年以前发文量不大,年载文量都在20篇以内。2000年至2003年出现了一个快速增长期。随后几年,年载文量或增或减,并无明显增长或衰退现象,呈现缓慢且平稳的发展态势。2010年出现拐点,载文量呈爆发式增长态势。
根据以上分析和图1,不难发现电子书研究年载文量呈现出明显的三个发展阶段,这与电子书产业发展形成呼应。2000年以前国内电子书产业处于孕育期,业界热情有余但动作不多,电子书形态更多是“软盘”或“光盘”,并没有引起学界的足够重视,所以关于电子书的研究也不多。1998年以RocketBook和SoftBook为代表的电子书阅读器出现,掀起了电子书发展的第一波热潮且很快波及国内,内容商和技术商纷纷涉足电子书产业。2000年以后“掌上书房”“翰林电子书”等纷纷出炉,与此同时国外Adobe、微软等巨头,国内超星、方正阿帕比等公司也纷纷涉足电子书领域,制订格式标准、开发阅读软件,相应地2000—2003年国内电子书研究迎来了一个小高潮。随后由于出版流程再造、版权保护、格式统一、盈利模式等问题的困扰,这一波电子书发展陷入困境,学界的研究热度也趋冷。2007年底亚马逊Kindle的横空出世引爆了电子书发展的新高潮,国内电子书市场汉王等终端制造商的发展空前火爆,其他通道、平台、内容等产业链各方也动作频频。2010年电子书市场202.87%的增长速度使得当年成为中国名符其实的“电子书元年”,相应地电子书研究也势如破竹、蓬勃发展,显著标志就是相关论文数量的急剧增加。
以文献累计数据为依据,并对其进行回归分析,可以发现文献增长规律。将电子书研究论文根据年载文量统计得出年累积文献量,再利用SPSS 18.0软件进行曲线拟合。若以普赖斯(D.J.Price)曲线来拟合得出的拟合曲线为F(t)=5.950e0.279t,若用三次曲线拟合得出的拟合曲线为F(t)= 0.132t3+0.917t2+13.817t-19.967。结合图2可以直观看出,相比较普赖斯曲线(R2=0.874),电子书研究的文献增长趋势与三次曲线(R2=0.996)拟合得更好。这说明到现在为止电子书相关研究的文献增长还处于初始阶段:“绝对论文数量少且增长不稳定,还没有到达严格服从指数增长的发展阶段”[2]。
2.2 著者分析
研究论文的合著情况一方面可以反映研究论文的深度和广度,另一方面也可以反映该研究领域的学科性质和研究方法等。在本文得到的1127篇论文中,除22篇是匿名作者以外,1105篇论文共有1591名作者,由此得出电子书研究论文的合作度为1.4398,合作率为0.2787,“明显低于自然科学动辄0.7左右的合作率,也低于一般社会科学的合作率”[3]。这说明电子书研究虽然涉及多学科领域,但还是以个人自由研究为主,合作研究有待深化。另外从表1的统计数据可以看出,在近20年里,电子书研究合著论文数量呈现明显增长趋势,虽然合著比例并不严格按照线性增长,但总体还是在逐步提升。
根据普赖斯定律:“核心作者应该完成所有专业论文总和的一半,核心作者的论文下限为N=0.749√(n_max ),n_max为所统计的年限中最高产作者的论文数量,发表论文数在N篇以上的作者即为核心作者。”[4]本文对1105篇文献按第一作者进行著者统计,发现发文最多的作者论文数量即n_max=5,根据公式计算出N约等于2。统计表明,第一作者发文数为2篇以上的作者人数为114人,共发文272篇,只占论文量的24.61%,很显然没有达到所有文献的一半,这表明电子书研究的核心作者群尚未形成。同时结合表2可以看出,发表2篇以下论文的作者人数占总人数的97.17%。这也说明现阶段国内电子书研究比较零散,研究还不够深入和持续,暂未形成核心作者群。
本文统计了第一作者发文在4篇以上的高产作者的分布情况(见表3)。作者单位多集中在三大类,即高校图书馆、高校科研机构和出版单位。这些作者多年潜心于电子书研究,具有较深厚的理论功底,引领了国内电子书研究的发展方向,他们或结合自身背景和研究特长,或从自身工作实践出发关注电子书的版权保护、盈利模式、格式标准、定价等问题。如赵继海从图书馆角度,围绕电子书和DRM技术对图书馆的影响展开研究;李爽介绍和总结国外电子书发展情况;叶兰则集中探讨电子书采购流程、定价模式等。
本文对文章著者所在机构的发文量进行统计,列出了发文数量在10篇以上的机构(见表4)。不难发现,高校科研机构和图书馆是研究电子书的主要力量。根据《中国电子图书发展趋势报告2011》的统计数据[5],2010年以前国内电子书市场所占份额最大的业务类型为“数字图书馆”,可以说电子书在图书馆数字化转型过程中发挥着非常重要的作用,电子书研究引起了图书馆研究人员的重视,所以清华大学图书馆、浙江大学图书馆、上海图书馆等机构发文量排名靠前。而高校科研机构如武汉大学、南京大学、北京大学等则凭借其在图书情报学、新闻传播学等学科的科研力量,从多角度切入,电子书相关研究成果颇多。
2.3 期刊分析
布拉德福定律指出,如果将期刊按刊载某学科专业论文数量的多少以递减顺序排列,可以将期刊分为专门面向这个学科的核心区、相关区和非相关区,各区的文章数量相等。此时存在常数a,使得三个区的期刊数构成1:a:a2的等比关系。本文按照发文量大体相当的原则,将1127篇论文分成3个区(见表5),载文量70篇以上的4种期刊为核心区期刊,载文量为358篇;载文量在40—70篇之间的6种期刊为相关区期刊,载文量为340篇;剩余的131种期刊为非相关区期刊,载文量429篇。但发现不存在常数a使三个区的期刊数成1:a:a2的等比关系,这说明电子书研究还处于起步发展阶段,学科发展不成熟,所以论文来源分布不完全符合布拉德福定律。
为了更好地考察电子书领域核心期刊的情况,本文统计了载文量在30篇以上的期刊(见表6)。发现发文量30篇以上的期刊中,除了《出版广角》《编辑学刊》和《图书馆工作与研究》外,其余均为新闻学与传播学以及图书馆、情报与文献学领域的CSSCI来源核心期刊。这说明研究电子书的相关论文学术水平较高,电子书研究受到新闻传播和图书情报领域专家学者的广泛关注和认可。
从期刊类型角度进行分析,从表6的高载文量期刊分布来看,电子书相关论文主要刊载在新闻传播类和图书情报类刊物上,而从表7总体来源期刊种类分布来看,89.27%的论文也分布在这两类学科刊物上,且两类期刊种类数量和载文量几乎相等,其中图书情报类期刊的载文量略高于新闻传播类,而教育类、计算机类以及其他类别期刊的载文量仅占10%左右。这表明,电子书的相关研究主要吸引了新闻传播学和图书情报学领域的学者,且两者科研能力相当;电子书相关研究还没有吸引到更多跨学科和跨领域的研究,但已经开始逐步向教育、计算机等领域渗透。
2.4 关键词分析
“词频分析法是指利用能够揭示或表达文献核心内容的关键词或主题词在某一研究领域文献中出现的频次高低来确定该领域研究热点和发展动向的文献计量方法”[6]。利用词频分析法分析高频关键词可以很好地归纳某一领域的研究热点。为了保证研究的准确性,本文剔除了没有关键词的文献,然后利用Excel对高频关键词进行统计,经过同义词和近义词处理后,统计出排名前20的高频关键词(见表8)。统计结果显示,与电子书相关的版权保护、电子书阅读器、商业模式、数字技术、发展趋势等成为学者关注和研究的热点。同时,由于数字图书馆建设、数字阅读、出版转型等与电子书发展息息相关,所以相关主题也出现在高频关键词表中,成为电子书研究的热点。
高频关键词之间的共词特性能更好地归纳某一学科专业的研究重点,因此本文利用共词聚类分析法来分析电子书领域的研究重点。“共词聚类分析法是通过文献计量和聚类统计的方法,计算关键词之间的联系密切程度即在同一篇文献中共同出现的频率,把联系密切的关键词自动聚类的过程”[7]。利用软件统计表7中高频关键词两两出现在同一篇文献中的次数,得到高频词共词表(见表9),利用SPSS 18.0将统计出的共词表转化为相关矩阵,再利用多维尺度分析对其进行聚类分析,得出的多维尺度分析结果如图3所示。由此可见,目前电子书的研究热点和研究重点主要集中在以下几个方面。
电子书与数字图书馆结合的研究。从图3可以非常清晰地看到数字图书馆、图书馆、亚马逊、数据库、资源整合等高频关键词非常紧密地联系在一起,形成一个聚类团。这反映图书馆相关研究人员非常关注电子书,他们从数字图书馆建设的实际出发,探讨电子书对于数字图书馆资源整合和数据库建设的重要作用,以及图书馆如何利用电子书等新媒体来发展和拓展数字阅读和数字借阅模式。
电子书发展对出版业的影响。这一主题也集中了较多文献,从表7发现排名前四的高频关键词均与该主题相关。研究人员从电子书对传统出版业的影响、出版企业的应对措施、传统出版转型、出版流程再造等角度切入,研究了电子书发展与出版产业发展的互动关系。
电子书的发展模式研究。图3显示,数字阅读、商业模式、数字版权、数字技术等高频关键词形成一个聚类团。这表明电子书的发展模式研究是电子书领域的研究热点之一。研究者关注随着电子书相关数字技术的发展和进步,与电子书发展紧密相关的数字版权保护、商业模式探索以及阅读方式转变等问题。
电子书产业链相关研究。电子书业界各方“跑马圈地”和“群雄争霸”的发展现状吸引了不少研究者关注电子书产业链。研究者关注点主要是电子书阅读器、平台构建、产业分工、盈利模式等。
3 结 语
通过对电子书相关研究论文的文献增长、著者、期刊和关键词等层面的文献计量分析,本文探讨了电子书研究文献增长分布情况和增长规律,分析了电子书相关研究的合作度,核心作者、高产作者分布以及作者单位分布,梳理了来源期刊的分布情况,总结了电子书领域的研究热点和研究重点。通过这些分析可以得出以下几点结论。
(1)电子书研究关注度不断增强。纵观1992年迄今的统计数据,电子书相关研究论文在数量上已经有了飞跃,尤其2010年以来论文数量实现了突破性增长。相信随着电子书产业的逐步发展壮大,未来电子书研究会吸引越来越多专家和学者的关注,形成更多更高质量的研究成果。
(2)电子书研究核心作者群还未形成。根据对著者的分析,我们发现电子书研究的核心作者群还未形成,已有的论文多为偶发性研究,并未形成持续的系统性研究,且研究的合作度较低,相关核心研究机构和研究团队也未形成。
(3)电子书的应用研究还不够。从研究电子书的作者背景、作者单位以及研究热点分析中不难看出,目前电子书领域的研究多为高校学者或者图书馆研究人员从理论层面进行,而电子书的应用属性要求加强电子书的应用和实践研究。
(4)电子书的研究领域还有待拓展。根据对电子书相关研究论文的作者机构、来源期刊分析,发现研究电子书的学者绝大多数来自新闻传播学和图书情报学领域,近90%的论文分布在新闻传播学以及图书馆、情报与文献学领域的期刊上。这说明电子书的研究领域还比较狭隘,跨学科研究和跨领域合作研究还比较少,研究领域有待进一步拓宽。
(5)电子书研究还有待深入。目前多数电子书相关研究还停留在表面,集中于电子书的基本概念、带来的影响、如何利用以及国内外业界动态的介绍,而电子书的格式、硬件、标准、流程、盈利模式、产业链等核心研究还不够充分,规律性以及实证性研究还有所欠缺。
注 释
[1]李镜镜,张志强.移动出版的发展模式及其评价[J].科技与出版,2010(8):37-40
[2]邱均平,刘华华.网络信息计量学的文献计量规律及发展现状研究[J].图书馆论坛,2009,29(6):58-62
[3]贾玉英.我国图书馆读者满意度研究论文的文献计量学分析[J].现代情报,2007,27(2):43-46
[4]邱均平.信息计量学[M].武汉:武汉大学出版社,2007:255
[5]中国图书商报,读吧网.中国电子图书发展趋势报告[R/OL].北京:中国图书商报&读吧网,2011[2012-11-30].http://news.du8.com/viewnews-88935.html
[6]马费成,张勤.国内外知识管理研究热点:基于词频的统计分析[J].情报学报,2006(2):163-171
[7]钟伟金,李佳.共词分析法研究(二):类团分析[J].情报杂志,2008(6):141-143
(收稿日期:2013-04-01)