基于知识图谱的国际电子书研究分析
2015-02-04余世英陈芳芳
余世英 陈芳芳
[摘 要] 借助信息可视化软件CiteSpaceⅡ,对科学网数据库中2004年至2014年间有关电子书的研究文献进行定量分析,以知识图谱的形式揭示其知识基础、研究热点及趋势,希望对未来电子书研究起到一定借鉴作用。
[关键词] 电子书 知识图谱 知识基础 研究热点 研究趋势
[中图分类号] G237[文献标识码] A[文章编号] 1009-5853 (2015) 01-0089-06
Analysis on E-book Research Based on Mapping Knowledge Domains
Yu Shiying Chen Fangfang
(School of Information Management, Wuhan University, Wuhan, 430072)
[Abstract] By using a information visualization software CiteSpaceII, this paper analyzes the literatures concerning e-books during 2004 to 2014 from the Web of Science databases. Relying on mapping knowledge domains, it explores the knowledge bases, research hotspots and trends of eBook research,which presents some valuable references to the related researches in the future.
[Key words] Electronic books Mapping knowledge domains Knowledge bases Research hotspots Research trends
信息通信技术和数字化改变了人们阅读图书的方式,自1971年迈克尔·哈特发起“谷登堡计划”以来,电子书从最初的星星之火发展到了如今的燎原之势。本文利用知识图谱对国际上近十年来电子书研究领域的文献进行可视化分析,重点揭示其知识基础、研究热点和趋势,以期为未来相关研究提供有价值的参考。
1 数据来源与研究方法
1.1 数据来源
本文所用数据来源于科学网(Web of Science)平台,选取了SCI、SSCI、A&HCI、CPCI-S和CPCI-SSH五个子库。为保证查全率和查准率,将检索主题词设定为“电子书”“数字书”“计算机图书”“交互式图书”,文献类型限定为期刊论文、会议论文和综述;采用“精确检索”方式,时间跨度为2004年1月至2014年7月9日,最终检出文献926篇,以全记录形式保存为纯文本格式进行数据处理。
1.2 研究方法及工具
知识图谱是科学计量学和信息计量学的新工具,它以科学知识为研究对象,通过挖掘、分析其中所隐藏的关系、规律和模式,以可视化图谱进行展示,能够非常形象地揭示某领域的科学知识发展脉络与结构关系,有助于辨别和追踪科技前沿。本文主要运用美国徳雷塞尔大学陈超美教授所开发的信息可视化软件CiteSpaceⅡ3.8.R1 , 并借助其文献共被引聚类、关键词共现和突变词检测功能,从多角度反映电子书领域的核心结构、研究态势及趋向[1]。
2 知识基础分析
知识基础能够反映研究前沿的本质,在CiteSpaceⅡ中主要通过共被引聚类来分析,节点类型选择引用文献(Cited Reference),设置适当阀值,以聚类视图(Cluster View)显示,见图1。
图1 共被引知识图谱
关于电子书的研究共有文献节点246个,连线549条。共被引频次越高节点越大;中心度则能反映某节点在整个网络中所起连接作用的大小,具有较高中心度的节点以紫色外圈表示。限于篇幅,本文仅列出共被引频次>20的文献及中心度≥0.1的关键节点文献,去重后按频次排序,如表1所示。
表1 重要文献列表(部分)
从聚类视图中可以发现,主要有两大类团:图1上方较大的类团研究重心在于电子书在教学环境中的应用发展。迪龙(Dillon)的《电子书:德克萨斯大学的经验》分两个主题,共被引频次分别为19和25,讨论了纸质书、电子书、信息生态和其间关系,以及影响图书馆电子书资源建设的关键问题和图书馆员的忧虑,通过数据说明图书馆在线增加了电子书书目信息后,用户使用情况以及图书馆员的电子书选择模式都有所变化。阿姆斯特朗(Armstrong)调查了英国学术图书馆提供电子书和电子信息服务的情况,讨论了各图书馆对于电子书的态度以及检索获取的相关问题,认为有必要成立专门的工作小组来解决授权、书目控制等问题。加州大学对其图书馆中NetLibrary电子书资源的使用情况进行了历时一年的调研分析,试图探索出一种共享电子专著资源的协作式馆藏发展模式[2]。阿努拉(Anuradha)的《学术研究环境下的电子书使用》中心度最高,为0.26,调查了在学术环境下电子书使用情况及其有用性,发现学生比教职工更倾向于使用这种新技术;总体上电子书使用率较低,要予以改善,需从用户宣传和教育、配套软硬件设施、提高电子书质量等方面着手。美国丹佛大学潘洛斯图书馆对用户进行调查,以明确其对于电子书的认识,为何使用、如何使用以及满意程度。结果显示大部分用户只是偶尔用到电子书,且只阅读一小部分,认为纸质书更适于沉浸式阅读;但也有超过80%的人表示在使用选择上二者均可,用户总体上对于电子书是满意的[3]。罗兰兹(Rowlands)从用户行为角度进行大规模调研,旨在评估学术型用户对于电子书的意识、认知和使用水平,并探寻最有效的图书馆营销和传播渠道。结果表明有几种方法可提升用户对电子书的接受度,而图书发现行为是提供和优化服务的关键点,对出版社和图书馆员来说是非常值得关注的问题[4]。
另一类团中,德容(De Jong)《幼儿读者的图书阅读质量:对同一本书纸质版和电子版的实验》的中心度较高,为0.22,分析了纸质书和电子书对于幼儿早教的影响,通过行为实验发现内容相同但载体不同时儿童对于文字和图画的注意力存在差异,纸质书更适于其学习故事内容和句式,但在认字方面二者并无区别。格里姆肖(Grimshaw)也研究了纸质书和电子书在儿童对故事书的阅读速度、喜爱程度、信息检索、理解力等方面的影响差异,以及载体的哪些特点有助于阅读理解。有学者运用维特洛克的生成学习模型(Generative Learning Model)进行案例研究,检验了儿童在阅读精巧的和粗糙的CD-ROM有声读物时的理解能力,发现精巧有声读物有助于其对故事的理解和重述,关乎汇集情感反应、认知过程和元认知活动的意义建构等过程[5]。
从图1可见,有两篇重要文献连接着两大类团,一篇是伍迪(Woody)的《电子书或纸质教材:学生更喜欢纸质教材》,研究发现性别以及是否经常使用电脑并不影响对电子书的选择和使用,学生相对更喜欢纸质教材,这种倾向性不会因对载体熟悉与否而改变,但在学习效果上二者并无区别。作者认为电子教材的设计须有别于纸质教材,提供更好的用户体验。另一篇是拉姆(Lam)的《便携式个人电脑上电子书的可用性和有用性》,认为电子书在促进高校教学尤其是移动学习方面具有潜力,但其目前尚未成为实用的专业学习工具,学生对电子书的喜爱程度并不高,对数字文本的阅读效率较低,而且移动设备本身也存在不足,如小屏幕不便于浏览图表、图像和整页内容,续航能力有限等,被调查者认为需要加强用户支持。从这两篇文献可看出,两大类团的主要联系是研究者都很重视纸质书和电子书在使用效果上存在的差异,尤其是电子书在学习方面的优势和局限性,在研究方法上多采用实证、对比分析法;最大的区别是研究群体不同,第一类团的研究对象对于学生关注颇多,第二类团则聚焦儿童这一特殊群体。
3 研究热点及趋势分析
3.1 研究热点分析
关键词是经作者分析、提炼给出的核心词汇,能较好地反映文献的主要内容,因此,可根据其共现结果来确定研究热点。笔者首先对关键词做了初步的数据清洗,将节点类型选为关键词(keyword),设置适当阈值,得到图2所示图谱,共155个节点、368条连线。重点整理出频次或中心度为前30%的高频关键词,去重后按频次排序,见表2,研究热点可分为以下几大角度。
图2 关键词共现图谱
表2 高频关键词表(部分)
(1)技术角度,代表词为技术(technology)、信息通信技术(information and communication technology)、电子阅读器(e-readers)、界面(interface)、系统(system)、软件(software)、设计(design)等。电子书的发展与技术创新密不可分,从ebook1.0到ebook3.0,显示技术、网络技术、多媒体技术、传感技术等发挥了重大作用。2011年由国际数字出版论坛发布的Epub 3.0标准对于电子书而言是里程碑式的跨越,其加强了对多媒体格式、非罗马文字格式、文字朗读技术等的支持,兼容CSS和HTML5标准,在国际上得到广泛认可。当前,用户对电子书的接受度和认知度不断提升,面对此契机,加强核心技术研发,依靠技术驱动以提供极佳的用户体验成为主要的发展思路,因此从系统优化设计与测试、功能界面与阅读绩效的关系、性能评价指标体系、格式标准及改进方法等成为学界聚焦的热点。
(2)数字化学习与教育角度,代表词为数字化学习(e-learning)、教育(education)、学生(students)、大学(university)、读写能力(literacy)、儿童(children)、表现(performance)、理解(comprehension)、词汇(vocabulary)等。随着教育信息化进程的加快,政府、出版商、教育机构等各方对数字化学习与教育的关注度日益增加,国内外电子书行业都将教育领域视为市场中坚。电子书的优势在于获取与携带方便、易于检索和互动,其搜索、注释、超链接及多媒体等功能有助于提高学习效率,因此从幼儿早教、基础教育到高等教育等不同阶段,学生使用电子书的情况及效用、发展策略成为研究热点。
(3)用户角度,代表词为用户(users)、阅读(reading)、行为(behaviors)、使用情况(usage)、态度(attitudes)等。客户价值最大化是竞争制胜的关键,因此用户研究具有重要的现实意义。与音乐、电影一样,图书也是一种体验产品,数字技术改变了消费者的体验方式,从功利(utilitarian)、享乐(hedonic)等不同视角出发,可发现不同的规律和特征。目前,用户研究热点主要包括:不同阶段、不同环境或特定学科的用户阅读习惯、阅读体验、阅读需求分析,用户对电子书的认识、态度、使用意向及阅读行为特征,不同的个体因素和环境因素对其行为产生的影响,满意度和有用性评价等。
(4)图书馆角度,代表词为图书馆(libraries)、学术图书馆(academic libraries)、数字图书馆(digital libraries)、馆藏(collections)、馆际互借(interlending)等。在数字时代,读者的信息、知识和文化需求不断提高且愈加多元化,图书馆等信息机构将电子书纳入服务体系已成必然之势,未来几年图书馆尤其是高校图书馆的电子书规模和影响力将显著提升 [6]。此主题研究包括:图书馆员的任务和角色变化、服务模式转变、电子书采购政策及过程、联盟营运模式、定价和许可模式、获取接口及可用性、元数据及其管理、电子书的馆际互借、与其他馆藏资源的整合、经费有限时对免费网络资源的利用、用户接受的影响因素等。
(5)数字资源与版权角度,代表词为资源(resources)、有声书(talking books)、图书(books)、电子期刊(electronic journals)、资源共享(resource sharing)、版权(copyright)等。要实现数字资源的有效管理和共享,涉及内容审查、组织、存储、检索、传递、资源关联管理、版权等一系列问题,其中版权授权和保护问题尤为突出,面对电子书盗版侵权现象频现的状况,须从技术、法律、监管体系等方面合理解决版权问题,规范市场秩序。
(6)书业发展与商业模式角度,代表词为互联网(internet)、数字出版(electronic publishing)、产业(industry)、模式(model)、影响(impact)等。网络对于出版业的冲击和影响是全方位的,改变了作者、出版商、传统或线上经销商、图书馆、读者等利益相关者之间的关系和角色。网络环境下,作者可自主完成图书的写作和营销,作者、读者间能持续交流互动,读者也可加入到创作过程中,大规模的群体协作成为可能[7];通过虚拟社区、社交网站等途径,读者可随时随地与他人分享、交流阅读体验,因此自助出版、社交网络营销、电子书业务发展路径等成为研究热点。受诸多因素影响,电子书市场环境不断变化,进而影响到供应商的产品和服务,其商业模式复杂多变,较为典型的是年度订阅模式、单本/章节/页购买模式、单次付费模式、短期租借模式、免费模式、读者需求导向采购模式等[8]。在商业模式选择与创新过程中,各方利益平衡仍是个难题。
3.2 研究趋势分析
CiteSpaceII具有突变词检测功能,通过考察主题词的词频变动趋势来识别学科领域的研究前沿。本文利用关键词及所提取名词短语的突变情况,以时区视图(Timezone)形式显示,得到图3所示图谱,共探测出13个突变词,如表3所示。
图3 发展趋势时区视图
表3 突变词列表
从表3各突变词的突发年份可见,国际上对于早教电子书的研究颇为重视。较早期的研究大多运用分组实验方法对比纸质故事书和早教电子书在儿童(children)学习兴趣、读写能力、理解力等方面的影响因素和差异性,近期的研究则致力于寻求解决儿童学习障碍的方法,关注电子书在提升语音意识(phonological awareness)等方面的有效性,以及早教电子书的分类标准及体系。
有声书(talking books)、多媒体(multimedia)的突发年份为2006年与2011年,表明多媒体电子书仍是目前的主流模式,而增强型电子书在未来将更加智能化、交互性更强,超越“书”的概念,实现内容、信息、服务、新媒体、受众参与和互动体验等的有机整合,所涉及的理念创新、技术应用、精准营销与市场开拓至关重要。值得注意的是,电子书强调基于用户的设计(design)。阅读电子书和翻阅纸质书是极为不同的体验。纸质书的优劣多取决于内容,而对于电子书,在导航、页面、内容等各方面的设计构思都会直接影响其可读性[9]。无论是电子书本身,还是应用服务平台,如何真正做到“以用户为中心的设计”,尚待继续探究。
电子阅读器(e-readers)的突发年份为2008年,可见相关研究与其市场发展情况紧密相连。2007年亚马逊推出的Kindle风靡全球,由此引发研究者对于阅读器的关注;2010年美国电子阅读器市场掀起降价潮,顺应了消费者心理需求,市场规模迅速扩大。与此同时,软性基板、柔性电子纸、彩色显示等相关技术不断完善,未来阅读器的产品定位和功能差异化会更加明显,有关其功能扩展、显示效果对易读性和视觉疲劳等的影响、潜在用途及价值评估、在特定环境(如协作式学习或学术环境)下的应用等方面值得深思。
大学(university)和学习过程(learning process)的突发年份为2009年和2012年,突发值为3.13和4.49,体现了近年来对于数字教育资源的重视。电子书要寻求在教育领域的长足发展,需针对不同类型用户的学习过程特点和规律,综合考虑用户和数字文本的因素,研发出高质量、易于使用的电子教材及参考书,让更多学生认识到电子书在提高学习效率和效果方面的有用性,以形成积极的使用态度。尤其是高等院校中有着庞大的学术群体,将电子书用于日常学习和科研工作、开放课件等开放教育资源及其对出版商的要求等都有待进一步探讨。
行为(behaviors)的突发年份为2010年,突发值3.62,证明近年用户行为(behaviors)全过程分析是重点方向。研究用户行为,首先需调查用户在购买或获取电子书产品和服务前的信息搜寻、评价与选择活动,在此基础上,详细分析用户的使用过程及效用,从而深入了解用户的认知、偏好、真实需求和选择倾向,大数据分析技术无疑为电子书相关企业和服务机构提供了强力支持。
移动设备(mobile devices)突发年份为2011年,突发值3.49,可见近年对移动阅读/出版的研究在迅速升温。在此背景下,电子书产业要抢占移动阅读市场,在社会化营销、移动阅读行为、个性化推荐、移动学习等方面都需加大研究力度。
数字内容(digital content)突发年份为2011年,就数字资源管理与共享而言,数字内容的开发、管理和利用举足轻重。虽然内容并非最终产品,商家也难以仅靠销售内容来实现盈利,但丰富、优质的内容资源是高附加值产品开发和服务创新的必要条件。因此,将自有版权且有市场价值的资源数字化,发展新资源,完善数字资源管理系统,可穿戴智能设备所开创的“以设备创造内容(DGC)”新模式等方面不容忽视。
4 结 语
本文以科学网数据库中近十年的电子书研究文献为样本,通过绘制知识图谱对其知识基础、热点和趋势进行了分析,得出以下结论。
从文献共被引知识图谱中,发现重要基础文献的研究主要集中在电子书与纸质书对比分析,电子书的内涵及特征,图书馆电子书资源建设与服务,电子书在早教及高等教育阶段的应用等。共被引频次较高的文献和中心度≥0.1的文献共同构成了相关热点和趋势的研究基础。
通过关键词共现图谱得出主要热点:数字技术的创新及转化应用,电子书在数字化学习中的使用情况分析,用户的阅读行为与需求,图书馆的电子书采购、管理和服务,数字资源建设及版权问题,书业产业链各环节的变化及商业模式。研究热点之间相互交融,互为支撑。
根据突变词检测得出主要前沿问题:早教电子书、增强型电子书、基于用户的设计、电子阅读器的功能及应用拓展、针对用户的学习过程提供适宜的电子书产品及服务、用户行为的全过程分析、移动阅读与电子书服务、数字内容资源开发和管理等。值得一提的是,“以用户为中心”的理念引起了各方关注,已成为电子书理论研究和应用实践的指导思想。
注 释
[1] Chen C. CiteSpace II: Detecting and visualizing emerging trends and transient patterns in scientific literature[J]. Journal of the American Society for Information Science and Technology,?2006,57(3): 359-377
[2] Langston M. The California State University E-book Pilot Project: implications for cooperative collection development[J]. Library Collections, Acquisitions, and Technical Services. 2003,27(1):19-32
[3] Levine-Clark M. Electronic Book Usage: A Survey at the University of Denver[J]. portal: Libraries and the Academy, 2006(3):285-299
[4] Rowlands I, Nicholas D, Jamali H R, et al. What do faculty and students really think about e-books[J]. Aslib Proceedings, 2007,59(6):489-511
[5] Labbo L D, Kuhn M R. Weaving chains of affect and cognition: A young child's understanding of CD-ROM talking books[J]. Journal of Literacy Research, 2000,32(2):187-210
[6] Vasileiou M, Rowley J, Hartley R. Perspectives on the future of e-books in libraries in universities[J]. Journal of Librarianship and Information Science, 2012(4):217-226
[7] Laquintano T. Sustained?Authorship:?Digital?Writing,?Self-Publishing, and?the?Ebook[J]. Written Communication, 2010,27(4):469-487
[8] Vasileiou M, Hartley R, Rowley J. An overview of the e-book marketplace[J]. Online Information Review, 2009,33(1):173-192
[9] Chong P F, Lim Y P, Ling S W. On the Design Preferences for Ebooks[J]. IETE Technical Review, 2009,26(3):213-222
(收稿日期:2014-10-31)