国内年鉴索引研究概况
2013-02-15衡中青
●康 艳,衡中青
(1.金坛市图书馆,江苏 金坛 213200;2.佛山科学技术学院 图书馆,广东 佛山 528000)
年鉴是一种资料密集型工具书。新中国“年鉴热”始改革开放后,发展十分迅速,从1980年的6种发展到2010年的3000种。[1]然而,年鉴索引发展与年鉴的发展极不相称。据统计,目前国内出版的各类年鉴中,编制较为规范的索引的可能连20%都不到。[2]年鉴索引呈下列状况:一是有索引的年鉴少,二是编制规范的年鉴索引更少。本文通过论文统计与分析的方法来考察近年关于年鉴索引研究的概况,包括年鉴索引编制技术、机编年鉴索引等,并对国内年鉴索引研究存在的问题提出一些看法。
1 关于年鉴索引的文献分析
1.1 论文数量
据统计,1991~2010年共计发表40篇关于年鉴索引的论文(见图)。2000年以前发表17篇,呈不均匀分布,如1998年集中发表10篇,而1992、1994~1996年却没有论文发表,说明在1998年前后,年鉴索引的研究曾达到一个高峰。2000年以后共计发表论文23篇,分布相对均匀;几乎每年都有1~3篇关于年鉴索引的论文发表,其中以2010年发表最多(5篇)。可见,年鉴索引正在逐渐被重视,并开始进入稳步发展的时期,但研究的力度还需加强。
1.2 论文研究范围
本文按照理论研究、实践经验、机编索引、标准制定、其他内容对研究内容进行分类统计(有的论文可能涉及多项内容)。目前国内年鉴索引还多集中于理论研究(占48%),其中部分来源于年鉴编辑在实践过程中总结的经验(占24%),其次是对机编索引技术的研究(占24%)。可以说,国内对年鉴索引的研究以理论为主的,同时也在不断尝试和探索更有效的编制技术,特别是对计算机技术的利用。
1.3 作者单位性质
从作者情况来看,其单位性质为年鉴编辑部、图书馆、高校学者。详见表。
从表可知,论文数量最多的来自于各年鉴编辑部,这是由于年鉴索引的编制大多是由年鉴编辑完成,他们经验丰富,撰写的论文数量也最多。其次是高校图书馆等科研机构的研究人员,有的亲身参与索引编制,探讨索引的技术,甚至开发了应用软件;有的则是从理论角度论述年鉴索引的编制方法。然而年鉴编辑和图情专家在索引编制上却还没有很好地结合,导致了在对索引的一些概念界定上两者存在一定的分歧。如果将双方的工作结合起来,那么前者的实践经验和后者受控语言及索引学的知识,将会在很大程度上提高年鉴索引的质量。
另外,论文作者主要集中于江苏省(8)、北京(6)、山东 (5)、广东 (5)、上海 (4)等地。这几个省份是年鉴索引研究活跃地区。
2 年鉴索引研究进展
从收集的40篇论文内容来看,年鉴索引研究主要集中于以下四个方面。
2.1 年鉴索引和目录的功能
笔者以为,造成我国年鉴索引数量少、质量欠佳的一个重要原因是相当数量的年鉴编辑人员对索引的重要性认识不足,他们认为“目录可以取代索引成为年鉴检索工具”。其实不然,索引的编排顺序不同于按页码排列的目录,二者都是检索系统的重要组成部分,缺一不可。索引相对于目录来说具有不可替代的优势:① 揭示隐藏主题,标引的对象是任何一种有价值的信息,能够把隐藏的主题揭示出来;② 编制范围宽泛,可根据需要在任何一个确定的范围内进行编制,比目录灵活得多;③ 索引的集合性,索引能将散见于全书各处的同一事物的信息集合一处;[3]④ 索引的连续性,索引能够在同一位置检索到年鉴连续记载的事物信息,而对于目录来说,一旦年鉴的条目位置发生变化,检索者则无所适从。[4]
2.2 年鉴索引的种类
针对各种年鉴的特点,应该编制不同类型的索引。年鉴索引,简而言之,可分为单一主题索引和综合主题索引。笔者统计的研究论文涉及的索引类型有:主题索引、人名索引、地名索引、机构索引、图表索引、序号索引和条目索引等。现有年鉴索引多为综合主题索引,研究论文多涉及混合主题索引,如《中国百科年鉴》 《扬州年鉴》等均采用混合型索引。[3]但也有一些单一主题索引,如《上海文化年鉴》的人名索引、机构索引。此外,还有一些年鉴根据自身特点设置索引类型,如《北京年鉴》编制区情县情索引,《中国出版年鉴》编制篇名索引,《中国图书年鉴》编有辞目分类索引,等等。[5]
2.3 索引编制技术
年鉴索引的编制步骤和普通书后索引的编制步骤类似,即选择索引类型、确定标引范围和深度、主题分析、选取标目、排序、编制参照系统、校验、生成索引。如何在编制索引的过程中提高索引质量,也是近年来专家学者关注的对象,其研究主要集中在以下几个方面。
2.3.1 索引的范围
我国年鉴索引多存在范围不完整的问题,专家学者讨论较为热烈。
一般以年鉴的正文内容为标引范围,同时涵盖全书,尽可能包括一切有揭示价值的对象。专文、特载、报告、综述、概况、法规、文献等各种文献类型,统计资料、表格、图片等各种资源类型,附录中包括的有实质性内容的资料等都应作为索引的对象。而年鉴中不具有实质性内容或缺乏揭示价值的对象,如年鉴序言、凡例、目录和编后记、指南、名录等一般不纳入索引。[5]当然,根据实际情况还可以对一些特色年鉴的大事记中记录的内容,甚至设计精美的宣传彩页和广告进行标引。总之,索引的范围以便于用户查阅为准。
针对部分内容编制主题索引难度较大的问题,也有学者建议在主题索引之外建立人名索引、地名索引、机构索引、统计数据索引等专名索引,这些专名索引编起来简单又省时,读者使用起来也方便、快捷。[6]
2.3.2 索引的深度
索引深度决定索引的规模,反映内容的揭示程度或水平,是索引编制规划中应加以明确的重要内容。国内测量索引深度的方法目前有两种:①索引款目与条目总数之比;②索引篇幅与正文篇幅比例。前者反映索引涉及条目内容的深度,后者从年鉴结构上反映索引所占的份额。许家康在“第十九次全国城市年鉴研讨会”上提出,当务之急是将索引比提升到1:1.5至1:1.2的水平。[7]
对索引深度规划时,应以年鉴资源中具有解释价值的内容作为依据。对条目或文章内的多个主题和隐含主题或辅助主题进行深入分析,并从内容分析、各种专名等不同的角度抽取索引内容,以便提供更细致更丰富的有效信息。为了保证各栏目选词尽可能做到均衡,编制索引时要大致确定选词的“级别”,即根据条目内容的层次或条目内容,规定一个深度,如《上海文化年鉴》。[2]
2.3.3 规范主题词
(1)全面性与完备性。对文献中所包含的具有实际意义的重要内容进行标引;注意挖掘隐含主题;注意某概念在不同时期的不同提法而多做一些主题词,增加检索入口;[4]对性质相同或相近的内容要通过建立参照系统的方式,指明事项之间的相互关系。
(2)专指性与准确性。一词一义,不能引起歧义和误解;复合主题拆分为单主题;主题词应具有最大专指度。
(3)简洁性与便捷性。内容要高度浓缩,字数控制在一定范围内。遵从读者的检索习惯,主题词的中心词要前置或使用被动式,避免使用动宾短语。[2]
(4)规范性。[2,8]主要是细节问题,包括避免出现口语化或叙述体的标引词;不用标语、口号和政策宣传性语言,不用比喻、借代语言等;删除“关于”“对于”等不确定性词;选择被社会和大众经过实践认定形成的词语,等等。
另外,有专家学者研究并尝试在编制过程中引入主题词表进行规范,取得了一定成效。例如:广州年鉴社的黄泽霖分析了按主题词表编制年鉴索引的可行性;[9]《扬州年鉴》为了减少主观影响,通过自建词表的方法,将年鉴中出现频率高的事物、概念等作出规范的全称或简称,以便全文统一风格,最大限度地避免人员主观性对工作的影响。[3]《北京东城年鉴》在编制主题词索引时,参考了中国档案文献出版社的《中国档案主题词表》和北京市人民政府办公厅编制的《公文主题词表》。当然,年鉴种类繁多,且主题词表也有其自身的局限性,因此在目前编制索引的过程中也不能完全局限于规范性主题词的范围内。
2.3.4 排序规则
排序这一工序已基本能够通过计算机自动完成。常见的排序方式有汉语拼音排序法、部首笔画排序法、分类编排法等,其中最常用的是汉语拼音排序法。汉语拼音排序法是根据现代汉语语音基本知识,确定每条索引款目的主题词中每个汉字的声母、韵母和声调,再遵照24个拉丁字母顺序排列,同时注上页码。
索引款目排序的工具主要有数据库软件、文字处理软件和索引编辑软件。但索引编辑软件是国内专家针对索引编制工序开发研制的工具,普及率不高。一些学者提出排序技术处理方法,如:为了避免特殊符号(如《》、“”等)影响排序结果,在排序前将特殊符号的前半部(如《、“)删掉,在完成排序后通过检索或事前记录等方法恢复;为了完成主标目下副标目的排序,排序前所有副标目以“一级款目,二级款目”的形式录入,排序后保留第一行“一级款目,二级款目”的形式,删除其余二级款目前的“一级款目”并缩进;完成汉语拼音排序后还要对多音字进行单独处理,合并标目内容完全相同的款目。[8]
2.3.5 参照系统
参照系统是揭示概念之间关系的主要方法,即在每个标目词下设立参照项,用参照符号指出该词的等同关系词、上位词、下位词和相关词。参照能够提供多检索入口,减少篇幅,提高检全率和检准率。[10]而在已有的年鉴索引中,普遍存在没有参照系统或参照系统薄弱的问题。
在现有的年鉴索引中,一般认为索引的参照通常包括“参见”和“附见”两种,这与索引学中的参照系统有很大区别。“参见”是将分散在各处同一主题的条款页码,集中标注在一条索引款目之后以便检索。“附见”是将同一主题的内容集中排列在一个主题索引下,作为这一主题索引的“附见”以便查找。《中国百科全书》就通过建立完善的参照系统形成了纵横交错的立体网络,[11]是我国年鉴索引的参照系统编制的典范。
2.4 索引标准的颁布
2008年11月3日,由中国索引学会主持制定的国家标准GB/T 22466-2008《索引编制规则(总则)》颁布,并于2009年4月1日正式实施。该标准为各种类型索引的编制提供有关内容、表示及其组织的一般规则和说明性的规定及实例,既适用于任何类型文献的索引编制,也适用于人工编制的和计算机编制的各种类型的索引(包括纸质印刷索引、索引数据库等)。有学者以该标准为据,探讨了《新编地方志索引标准》的可行性并提出技术性建议。[12]
此外,为了配合在全国推广、实施《索引编制规则(总则)》,中国索引学会还主持编写了《索引编制手册》和《索引编制规则(总则)应用指南》,两书即将由中国标准出版社和国家图书馆出版社出版,其中专设“地方志索引编制法”章节,重点说明地方志索引(包括地方综合性年鉴索引)的性质、类型和特点,编制过程及技术要点,并附有示例及其说明。[13]这标志着我国索引编制工作进入了一个崭新的发展阶段。
3 机编索引研究概况
如何充分利用计算机辅助编制年鉴索引一直是很多专家学者关心的问题。
3.1 数据库技术
从1995年开始,年鉴工作者就尝试利用FOXBASE等数据库和WPS、Word等文字处理软件来编制索引。具体操作是将标引结果(包括标目、页码)按照一定格式输入事先设置好字段的数据库,通过数据库指令将索引款目自动排序并生成索引。宝山年鉴编辑部的胡新力等人对Foxpro和Word97两种工具进行对比之后认为,Word97在编制索引上更有优势。[14]由于标引过程必须由人工干预,因此,在整个过程中计算机参与最多的环节还是款目排序。
3.2 Word索引功能
随着Word文字处理软件的出现,年鉴工作者开始利用其段落或表格排序功能实现款目自动排序。从Word97开始还提供“插入目录和索引”功能。索引编制者可直接在doc、rtf、txt等格式下抽取主题词,排序并生成索引,这使得计算机辅助索引又前进了一步。但该方法只适用于Word能够识别的文本格式,且标引某一主题词的时候会将文章中所有提到该词的地址都添加标记,这些问题仍然需要进行人为控制。
3.3 专门索引编制软件
《索引之星》是一款针对国内索引编制研制的软件,能够支持方正大样文件S2、S72、S92、PS2、MPS的标引。标引人员可通过鼠标右键选中标目进行标引,并可对标引结果进行修改。《索引之星》能够按照标目的拼音、笔画和页码进行排序。还可以使用缩写代码进行标引。但该软件一次只能标引一个词,也不能像Word那样随时预览标引结果。另外,北京市东城区地方志办公室开发的“计算机图书索引生成系统”,经过实践应用,也达到了满意的效果。
总之,机编索引技术还是今后索引编制技术研制的主要内容。随着计算机技术的进步,充分利用计算机提高索引编制的质量和效率,是年鉴索引研究的一个发展方向。
4 国内年鉴索引研究存在问题及解决方案
随着我国年鉴事业的发展,年鉴索引从无到有,从有到优,已经越来越受到社会各界的广泛重视。很多专家学者都在致力于改进年鉴索引的编制技术,也取得了一定成果。但由于国内起步较晚,在普及程度、自动化编制水平、规范化方面和国外索引发展还存在一定的差距。总结近几年的研究,笔者认为,主要有以下几方面有待改善。
(1)针对年鉴索引的研究需要扩宽和加深。近几年研究的内容以理论研究为主,且部分内容重复,建议今后从提高索引编制质量、索引标准化、索引自动化、国外年鉴索引发展等方面加强研究的力度。
(2)研究和编制人员的队伍建设。目前研究力量主要来自年鉴编辑社(包括方志办公室)、高校及其图书馆等单位的专家和学者。前者是编辑年鉴的主力军,具有丰富的年鉴专业知识和实践经验;后者是情报检索语言和索引学的专家。两者应紧密配合,加强年鉴编辑队伍建设,以促进索引的标准化和规范化建设。
(3)充分利用现代计算机技术辅助编制年鉴索引。我们的机编索引技术还主要停留在自动排序上,利用的工具基本是Word97/Word2000、Foxpro、Foxbase等已少人问津的软件。建议在编制过程中,不断尝试新的工具和技术,例如研究不同版本Word中的“插入目录和索引”功能是否有所改进;利用SQL Server、Oracale等大型数据库强大的数据处理功能来辅助编制索引等。
(4)充分吸收国外先进技术和经验,编制更多、更完善的索引软件。自机编关键词索引思想提出以来,国外机编索引技术发展迅速,涌现了一批著名的索引工具。Macrex、Cindex等索引软件更是在实践中不断更新和完善,具有相当广泛的用户人群,因此通过比较国外索引软件的功能,吸取其精华,为中文索引软件的开发提供借鉴。
(5)年鉴索引制作的标准化、规范化。年鉴主题索引的制作存在很大的弹性,尚无明确的定量、定性标准。例如对主题词的规范和对年鉴参照系统的解释等。如何更好地发挥已颁布的索引标准的作用,实现年鉴索引制作的标准化、规范化,也是今后年鉴编纂的一个努力方向。
(6)尝试按主题词表编制年鉴索引。虽然这会涉及情报工作的专业性和年鉴出版的时间性,但已有年鉴社对此进行尝试,并取得一定成效。因此,如何更好地将主题词表引入,也是有待专家学者们长期研究的课题。
(7)创新。例如,尝试实现年鉴索引的电子化(如《威海年鉴》)和网络化,将便于读者查检、借阅相应年鉴,提高年鉴的利用率。另外,随着年鉴索引质量的提高和细化,可尝试针对不同年鉴的特点编制不同类型的索引。
[1]中国出版工作者协会年鉴工作委员会.部分在京年鉴座谈会会议纪要 [J].年鉴通讯,2010(4):2-4.
[2]沈美新,等.编好年鉴索引,促进年鉴信息资源深度开发 [J].年鉴信息与研究,2004(5):39-40.
[3]李全权.编制高质量索引 打造实用型年鉴[J].年鉴信息与研究,2009(3):80-81.
[4]刘宜群.索引的定位与编制[J].年鉴信息与研究,2004(3):54-55.
[5]马张华.年鉴索引的功能与编制特点[EB/OL].[2011-05-25].http://www.yearbook.cn/NJGongZuo TanSuoInfo.aspx?Id=404.
[6]初云峰.提高年鉴索引编制质量的几点做法[J].年鉴信息与研究,2007(2):56-59.
[7]许家康.论年鉴的检索性——在第十九次全国城市年鉴研讨会上的主题报告[J].广西地方志,2010(1):21-25.
[8]李洪格.谈年鉴索引的制作[J].年鉴信息与研究,2009(5):113-115.
[9]黄泽霖.对年鉴索引的思考——按主题词表编制年鉴索引的可行性研究[J].年鉴信息与研究,2004(1):44-46.
[10]赵锋,顾海英.地方志索引基本问题思考[J].中国地方志,2006(9):33-36.
[11]邵荣霞.年鉴检索系统的处理[J].年鉴信息与研究,1999(1):58-59.
[12]衡中青.制订《新编地方志索引标准》的可行性分析及技术性建议[J].佛山科学技术学院学报(社会科学版),2010(6):74-80.
[13]张贤俭.制订中国索引标准的可行性分析[J].中国索引,2006(2):2-4.
[14]胡新力,吴峰.计算机辅助编制年鉴索引比较[J].年鉴信息与研究,2000(1):56-57.