APP下载

图书内容索引出版综述*

2021-01-29钱澄澄王德广

图书馆研究 2020年6期
关键词:册数检索图书

刘 双,钱澄澄,杜 鹏,王德广

(1.徐州医科大学图书馆,江苏 徐州 221004;2.空军勤务学院图书馆,江苏 徐州 221004)

针对索引的概念,无论是《辞海》《现代汉语词典》《中国大百科全书》等权威工具书的释义[1-3],还是电子信息学界、百度百科等对索引的解释[4-5],目前都存在一定的偏颇或缺陷[6]56。结合索引在文献出版领域的实际情况以及在电子信息领域中的广泛应用,夏南强根据索引运用的领域不同给出了较为全面且清晰的定义:(1)在文献出版领域,索引亦名引得、通检,是把文献中具有检索意义的信息,如篇名、地名、主题、词语、人名等摘录或概括归纳抽取,有的略加注释说明,按一定方式编排并注明出处,以供查检的一种检索工具;(2)在电子信息应用方面,一般指数据库中建立的索引,为了加速对表中数据行的检索而创建的一种分散的存储结构,它是由数据页面以外的索引页面组成的,每个索引页面中的行都会含有逻辑指针,以便加速检索物理数据[6]56。索引具有检索、导航、预测、分解、梳理、结网、揭示、执简、组合、鉴别、追踪等功能[7]。

本文探讨的索引为文献出版领域[8],根据出版形式不同大致可划分为三类:一是专门的索引工具,将原始文献中某些重要的或有意义的信息,如书名、地名、刊名、关键词、人名、篇名等分别析出进行标引,再按一定方式编排,并注明出处,以供检索的工具,如科学引文索引(SCI);二是各类工具书中的索引,比如百科全书的分析索引,科学技术类文献检索工具中的专类索引,如关键词索引,著者索引,专利号索引等;三是内容索引,以文献中段落、章节等局部主题和所涉及的具有主题信息价值的各种因素(如机构、人物等)及其他有价值信息的索引项为标引对象,内容索引主要包括图书内容索引(或称书末索引、书后索引)、专利内容索引、期刊论文内容索引等[9-10]。

1 图书内容索引概念与分类

图书内容索引又称书后(末)索引,是文献内容索引的一种,一般置于书后,作为原书的一个组成部分随书出版。一般以书的附录形式出现,摘记书中的知识单元或事项为条目,表明出处,并按一定次序编排,以方便查检该书内容的“附属性资料”[11]89。从定义可以看出,图书内容索引具有有序性、定位性、单元性和附属性的基本特征[12]。其主要种类包括医药名索引、地名索引、人名索引、专利索引、主题索引等[11]89。张琪玉教授2006年出版了我国第一部图书内容索引专著《图书内容索引编制法》。

根据图书的载体不同,图书内容索引可以划分为两种类型:第一类是电子图书或者纸质图书电子化的图书内容索引;第二类是以纸质图书为代表的传统书籍的图书内容索引[13]。而根据主题限制不同,图书内容索引又可划分为另外两种类型:一是能够揭示检索出该书中所有信息内容的通常贯之以“主题索引”或“内容索引”之称的综合性索引,应该说这种类型的图书内容索引是最完全、最实用,在图书出版很多情形下是最应提倡使用的;二是限于出版篇幅、成本、编制技术、时间等因素,将图书的索引内容限制在某一范围内,与综合性索引相对应的另一类索引——专门索引或称特指索引,如医学书籍中特别设置的药名索引[14]42。

2 图书内容索引作用与价值

2.1 图书内容索引的作用

图书内容索引是为查阅图书中的知识、信息而编制的检索工具,除了具有索引的功能外,从其定义本身以及读者使用角度还可以归纳出如下具体作用。

2.1.1 实现对知识单元或事项的梳理与规整

图书内容索引是摘记书中的知识单元或事项组成的,书中一般包含许多有价值的知识单元或者反映某一主题的事项,通过内容索引将书中具有检索意义且能反映出书中论述侧重点和特点的知识单元或主题事项进行集中标引,实现了对书中知识单元以及主题事项的梳理和规整[10]32。

2.1.2 信息导航,提高获取信息的效率

与图书目录反映图书的内容与范围不同,图书内容索引反映图书的知识信息或主题事项并进行聚集,读者可以根据图书内容索引所提供的信息,自由选取书中某些自己感兴趣的内容学习,同时方便加深对某些知识或事项的理解,有利于指导阅读[15]。此外,通过具有一定次序规则排列起来的内容索引,可以帮助读者在不通读全书的情况下,快速检索到信息的确切位置,获取相关信息内容,大大提高信息获取的效率,更好地满足用户对查全率与查准率的要求[14]42。

2.1.3 便于知识挖掘,实现知识扩展与延伸阅读

图书内容索引将分散于图书中多处涉及同一主题或具有相似属性知识的信息通过一定的排序聚集在一起,是一次知识再加工的过程,并且数字出版环境下的内容索引还可以实现知识的分享与聚合,这些有利于使用者进行研究、交流、借鉴、集成与发展,从而进行知识再创新,便于挖掘新信息、新内容与新观点,使得使用者在翻阅内容索引的时候很容易进行知识扩展,实现不同主题或知识间的延伸阅读或延伸学习。

2.1.4 可充当工具书

“阅读性”是图书内容的基本属性,而对图书阅读功能有重要补充的则是检索性[16]。但当一本图书内容对检索性的要求非常强,且重要程度远超阅读性的时候,图书本身应充当检索工具书的角色,比如词典类工具书。此外,一些图书编制了较为翔实的内容索引,但其本身并不是工具书,也能发挥工具书独特的检索功能,在一定程度上可充当工具书进行使用。

2.1.5 为索引数据库补充基础信息资源

数字化环境为电子图书出版带来极大便利,长期看来,电子图书的比例会逐渐增多,数字化图书内容索引的比重也会逐渐增大,为构建图书内容索引数据库创造了良好条件,将经过筛选的数字化图书内容索引补充进索引数据库,一方面可简化处理过程并缩短处理时间,另一方可以为情报服务体系和索引工具书提供基础信息资源[17]。

2.2 图书内容索引的价值

一本图书有无内容索引对图书的销量与学术质量等以及在编制过程中著作者与编制者对这本图书在学术方向与应用领域上的把握都有一定的影响,因此,图书内容索引具有以下参考与应用价值。

2.2.1 增加图书价值(包括学术价值和经济效益)

图书内容索引可以帮助读者快速把握图书内容,通常一本含有内容索引的图书会有比较好的销量,并且有着广泛的受众群体,特别是国内出版或者国外引进的经典著作都含有内容索引,在取得较高的销量与出版定价的同时,在馆藏量、被引量、转载方面也会获得较多有利的同行学术评价,这些会大大增加图书的学术价值与经济效益。

2.2.2 评判图书质量,促进图书市场繁荣

图书内容索引编制有无以及好坏,通常作为评判图书质量的重要指标之一。2012 年9 月,新闻出版总署发布《关于进一步加强学术著作出版规范的通知》,指出“索引是学术著作不可或缺的重要组成部分,是反映学术著作出版水平和质量的重要内容。”[6]57图书内容索引是图书结构标准化和规范化的要求,是实现我国从出版大国到出版强国的必要条件之一,普及并规范图书内容索引出版,将会对我国积极融入国际图书市场,扩大图书对外交流传播,繁荣图书市场发展有极大的促进作用。

2.2.3 评价从业者出版素养

编制图书内容索引在国际上是通行的惯例,一些大型书稿、学术著作通常都要求编制内容索引[18]。具有良好声誉的图书出版机构、著作者与索引工作者一般都会本着以服务读者为宗旨的理念,在注重自身经济效益的同时,常常保持着较高的出版素养,在图书的内容索引上投入较大时间与精力,根据不同种类图书以及不同受众群体合理编制与设置内容索引,以便能充分发挥内容索引快速检索的特性。

3 图书内容索引编制

编制图书内容索引是一项非常重要的系统工作。在过去出版的图书中大多需要作者手工摘词编制,进行页码填入并编辑核对,工作比较繁琐,而现在随着计算机技术的广泛使用,出现了许多辅助编制图书内容索引的软件,如Cindex、Macrex、HTML Indexer、XRefHT32、DEXter、WordEmbed、Data Harmony、索引之星等各种类型的索引软件[19],提供给专业或非专业人员使用,并且不断有研究人员持续对图书生成索引算法进行改进[20],以改善图书内容索引编制软件的功能,使得编制结果更符合读者的使用习惯,这些都大大提升了图书内容索引编制的工作效率和满意度。但由于一些作者缺乏编制经验,导致图书内容索引编制不够理想,因此,对于是否编制内容索引以及如何编制内容索引,笔者认为应从以下几个方面重点考虑。

3.1 内容连续性差、文字量大、系统性与阅读性强的图书应编制索引

作为图书的附属结构,索引执行的核心功能是快速检索图书内容。如果一本图书章节之间相对独立、内容之间关联不大,即内容上连续性较差,这样读者很难通过简单浏览内容找到相关信息,这就要求对其检索性要大一些。同样,对于文字量大的图书,读者通常会花费较长时间检索自己关注的内容,对其检索性也有较高的要求。另外,学术著作、专业参考书、手册和高等教育教材等系统性较强并且要求读者仔细阅读的图书对检索性要求高等,像诸如上面提到有类似特点的图书都应编制内容索引。

3.2 索引应全覆盖图书内容

在抽取主题词做索引时,应从读者角度审视图书内容章节,仔细阅读图书中的段落,领会段落大意,以便选取出的主题词应能概括归纳某段或某几段文字表达的核心内容,最终使得所选主题词形成的内容索引对整本图书论述的主要内容进行全面覆盖。不能将抽取主题词局限在某句话或某几句话中,并且在概括归纳时应注意围绕段落中心内容,不能游离于中心内容之外选取主题词。

3.3 合理选择索引措辞

索引措辞是指为索引的内容选择合适的表达形式,使其方便读者理解检索内容与思路,提高检索效率。通常在考虑索引编排特点的同时,索引措辞应尽量使得抽取出的主题词专指被检索内容,必要时可设置二级主题词提高专指度;尽量使得抽取出的主题词采用图书中的词语且含义表达准确,并且在表述上符合读者的检索习惯与思路;尽量使得同义词索引条目合并,必要时设置参照,增加检索入口[21]。

3.4 注重索引排序

图书内容索引是按一定顺序进行编排的,排序的方法通常采用拼音、笔画、外文等顺序进行排列。读者在掌握排序规律后有利于快速定位索引条目出现的具体位置,并可以在查询前进行一定的预见,当读者在查询可能的适宜位置后,就可以判断该图书中围绕索引条目的有关内容是否齐全。另外,按照一定规律进行排序的索引条目,常常会把具有同类表述或同类词首的条目聚集在一起,有利于读者进行知识关联与挖掘。

4 图书内容索引出版现状

索引工作是索引实践和普及的出发点[22],在西方国家广受重视[23],自上世纪中期以来出版的图书中90%以上都含有内容索引[24]。我国近代索引理论源于欧美,自20 世纪20-30 年代起逐渐形成索引运动,经过近一个世纪的发展,现状不容乐观,先后有纪晓萍[14]42、周柏康[25]、余美萍[26]等学者对我国出版含有内容索引的图书进行抽样调查,结果显示有内容索引的图书占比从1.2%~3.5%不一而等,图书内容索引普及率较低,形势较为严峻。

笔者利用“读秀学术搜索数据库”中图书选项中的“目次”功能,以“索引”作为关键词进行检索(数据采集时间:2020 年8 月19 日),对我国1991-2018 年间出版的4 577 478 册图书含有内容索引的情况进行统计分析,结果显示含有内容索引的图书册数为113 320 册,占比约为2.476%。如图1所示,虽然我国在1991-2018 年间出版图书册数(主坐标)与含内容索引图书册数(副坐标)整体均呈现出上升趋势,但是(如图2)我国出版含有内容索引图书册数占当年出版图书册数的比例在1991-2018年间却呈现出整体下降趋势,这说明相比出版图书册数的逐年明显增多,我国出版含有内容索引图书册数并没有实质性提升,反而是下降了且下降趋势较为明显。此外,与文章统计1989-2016 年出版含有内容索引图书册数整体占比约为2.49%相比[27]21,虽然此次统计时间整体往后推移了两年,但这却说明了我国图书内容索引出版现状越发严峻,并没有因为时代的进步,使得我国图书内容索引编制落后的面貌得到改观。

图1 图书册数与含内容索引图书册数发展变化趋势

图2 含内容索引图书册数占比发展变化趋势

笔者以前期研究成果为基础,参照中图分类法,在图书内容索引出版上选取发展最好的生物科学大类以及发展变化较为典型的政治、法律大类作为研究对象,进行局部分学科分析[27]23-24。如图3 所示,作为图书门类中发展最好的生物科学类,虽然在1991-2018 年间每年出版的图书含有内容索引的册数占比在12%上下徘徊,超过所统计全部图书含内容索引册数占比近9.6个百分点,但是生物科学大类在1991-2018 年间出版含有内容索引图书册数占比依然呈现出整体下降趋势,进一步论证了我国图书内容索引出版现状不容乐观的局面。而如图4所示,作为图书门类中发展变化典型的代表政治、法律类,虽然在1991-2018 年间每年出版的图书含有内容索引册数占比整体呈现出上升趋势,但其在1991-2018 年间出版含有内容索引图书册数占比始终在2.24%上下徘徊,进一步反映出我国图书内容索引编制在所有图书门类上全面落后的现状。

图3 生物科学大类含内容索引图书册数占比发展变化趋势

图4 政治、法律大类含内容索引图书册数占比发展变化趋势

5 图书内容索引发展策略

我国图书出版事业的繁荣发展离不开国家政策法规的支持、行业协会的引导、从业人员的重视以及出版新技术的广泛利用与大众读者的广泛需求。面对我国图书内容索引出版事业落后的面貌,笔者认为应从以下几个方面着重考虑推动图书内容索引的长足发展。

5.1 出台具有强制约束力的制度规范

根据上文1991-2018 年统计数据,我国平均每年出版图书约为16 万册,而含有内容索引的图书约为4千册,面对我国出版图书册数整体呈现上升而含内容索引图书册数占比整体呈现下降的现状,我国正呈现出“出版大国、索引小国”的尴尬局面。与西方国家对图书内容索引有明确强制规定,有的甚至是立法约束相比,我国虽已出台有关图书内容索引的政策、标准以及通知[28,29],但没有形成强制约束的局面,使得行业以及从业人员忽视索引工作,我国图书内容索引发展落后的现状越发严峻,因此,只有出台具有强制约束力的制度规范,才能为图书内容索引出版事业构建起国家层面上的支撑屏障,为索引事业长足发展打下坚实基础。

5.2 充分发挥行业协会组织引导作用

中国索引学会、中国出版协会等行业组织,是索引研究、编纂、出版的学术组织,会员广泛分布在全国各省、市、自治区新闻出版、图书情报、文化建设等不同系统与领域。因此,这些行业协会组织应充分发挥自身优势与作用,定期开展学术研讨与交流,大力宣传与推广索引的作用与价值,通过加强索引学科建设、推动新技术广泛融合、开展索引职业认证制度等措施,引导从业人员广泛重视图书内容索引,为我国索引出版事业长足发展提供根本保障。

5.3 加强从业人员共识与能力建设

索引编制工作是一项系统工程,需要花费大量时间与精力,投入足够的经费与技术支撑去完成。与国外索引从业人员肯在索引编制上下功夫,将服务读者放在第一位相比,在我国没有出台强制约束制度规范的现状下,编制内容索引并没有在相关从业人员中形成共识,得到重视,所以不愿意花费时间与精力进行技能提升,也不愿意投入经费进行知识与手段创新,认为图书有无内容索引并不影响图书的销量,有的甚至将原本含有内容索引的国外图书经翻译后去掉等情况。因此,只有加强从业人员共识与能力建设,才能肩负起发展图书内容索引排头兵的责任。

5.4 广泛使用新技术

利用索引编制自动化技术与软件可以大大提升索引编制的效率,减少出错的概率。索引编制自动化技术与软件始于20世纪80年代,在西方国家出现并得到广泛推广使用,但由于在我国利用率和普及度不高,已经成为制约我国索引事业发展的瓶颈[19]47。近年来,随着索引应用技术与算法的不断创新带来的索引编制高度智能化以及数字化出版广泛发展带来的使用便利,只需按照设定的标准就可以高效完成编制工作,这将会大大降低图书内容索引编制的门槛,逐步扩大图书内容索引编制的规模。因此,只有广泛使用新技术,才能为我国加快推进图书内容索引出版事业发展提供动力。

5.5 培养读者的阅读习惯

图书内容索引最主要的作用是可以帮助读者加快信息检索,启发读者挖掘书中潜在的知识,从而促进学习与改善工作效率。在重视竞争、讲究效率的社会环境下,西方读者善于使用图书内容索引进行检索,习惯利用分类法、主题法实施检索,以便快速获取自己所需信息,这些促使了读者以维护自身利益为核心对内容索引的根本需要和行业及其从业者以服务读者的需求为首位对编制内容索引的重视,这为西方国家图书内容索引事业健康发展奠定了良好基础。因此,只有培养读者“以索引检得”的阅读习惯,才能为促进我国图书内容索引出版事业长足发展提供有利条件。

猜你喜欢

册数检索图书
图书推荐
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究
求比一个数多(或少)百分之几的数是多少的应用题教学设计
求比一个数多或少百分之几的数是多少的应用题教学设计
欢迎来到图书借阅角
班里有个图书角
日本初高中教科书出版“明细账”(下)
函是什么?