中文图书主题标引工作的实践与思考
2012-02-15王艳萍
王艳萍
(中国国家图书馆,北京 100081)
主题标引是对文献的学科性质进行分析、归纳并赋予其主题检索标识的过程。在通常情况下,主题标引的深度及专指度影响文献的查全率及查准率。本文结合工作实践,就中文图书主题标引工作中的主题词的查找、在版编目数据的利用及《中国分类主题词表》(Web版)的使用等进行分析,同时,就标引人员如何提高中文图书主题标引质量谈了自己的看法。
1.1 通过查重查找主题词
查重作为标引工作的首要环节,是避免重复劳动、提高标引工作效率与保证书目数据质量的一条捷径。在知识爆炸的今天,出版物的数量逐年急剧上升,其中存在大量同主题图书出版的情况。对于此类图书,标引人员可以通过查重以确定图书的主题词。如题为《新编大众菜谱》的在编图书,因馆藏图书中有 《大众菜》、《大众菜谱》、《大众菜1000例》等。因此,标引人员完全可以参考这三种图书的主题词,选择任何一条主题标引数据加以利用。
题名查重是最为常用的查重方式,查全率和查准率都比较高,主要分为两种形式:第一种是利用计算机检索馆藏书目数据库,选择题名检索,将在编图书的题名全部准确地输入计算机,查找本馆是否收藏。大量教材类图书的主题标引都可以采用这种方式查找主题词;第二种是采用前方一致的检索方式,通过检索图书正题名,将正题名前面一部分相同的图书检索出来,便于标引人员参考。例如:要对《ActionScript 3.0宝典》一书进行主题标引,标引人员可通过题名中的“ActionScript”作为题名检索词,利用前方一致的检索方式,可以查到题名带有“ActionScript”的图书,如《Action-Script 3.0从入门到精通》、《新手学ActionScript 3.0》等,这些图书的主题词都为“动画制作软件”,因此《ActionScript 3.0宝典》的主题词也是“动画制作软件”,其主题标引数据为:6061#$a动画制作软件。以上两种查重形式简单而又直观,已被广泛地用于文献标引工作中。然而,有些图书的标引查重比较复杂,需要拓宽查重途径。如在题名查重中增加中间一致查重、后方一致查重,也称为截词查重。例如:要对《家庭保洁服务》进行主题标引,标引人员可以题名中的“保洁”作为题名检索词,采取后方一致的查重方式,可以查找到《家庭保洁》、《保洁员》等书,直接利用这些书的主题标引数据“6061#$a住宅$x清洁卫生$x职业培训$j教材”。
另外,利用ISBN查重、著者查重等也是查找主题词的重要方法。ISBN查重主要用于重印图书、不同装帧形式图书、不同版本图书、连续出版物和多卷书的查重。著者查重可检索到同一责任者的文献,多用于文学类图书的分类标引查重。这些查重途径灵活组合运用,可极大地提高主题标引效率。
1.2 新增主题词的查找
《中国分类主题词表》(二版)增加了大量的关键词作为主题词检索的入口词,通过关键词的查找,便可检索到主题词。例如:对于《大麦丰产种植新技术》,标引人员可通过查关键词“丰产”,就能检索到 “高产栽培D丰产栽培”,该书主题标引为“6061#$a大麦$x高产栽培”。又如:《中国特色社会主义理论体系基本问题研究》一书,通过查关键词“中国”、“特色”、“社会主义”或者“色社”都能检索到“中国特色社会主义”这一新增主题词,该书主题标引为 “6061#$a中国特色社会主义$x理论研究”。
利用《中国分类主题词表》中的分类号查找主题词,如通过分类号“I210.97”可以检索出新增主题词“鲁迅著作研究、鲁迅著作评论”等词,同样通过分类号“I054”可检索出“小说理论、小说创作”等新增主题词。
利用《中国分类主题词表》,通过词语组配检索新词。例如:对于主题标引数据“6061#$a家庭$x生活$x基本知识”,通过“家庭”和“生活”的组配,便可检索出“家庭生活”这一新词,再如:对于主题标引数据“607##$a中国$x历史$j通俗读物”,通过“中国”和“历史”的组配方式同样可检索到新增的“中国历史”主题词,该书主题可直接标引为“6061#$a中国历史$j通俗读物”。
2 图书在版编目数据的合理利用
在主题标引工作中,标引人员可合理参考、利用图书在版编目(Cataloguing in Publication,简称CIP)数据。在版编目是指在图书出版过程中,由确定为集中编目的机构,根据出版部门提供的图书校样或有关编目资料,按一定标准进行规范化的编目处理,然后再将这种格式化的编目数据资料返回原出版部门,印制在图书的版权页上供图书出版发行部门、图书馆、书目编制机构和读者使用。
2.1 利用CIP数据标引的优点
CIP数据在图书主题标引方面起着一定的参考作用:一是为标引人员提供了专、深主题词,指引标引人员对于一些专、深学科主题进行标引,起到一定程度的引导作用;二是标引人员在进行主题概念转换时,不仅获取了图书主体因素的词源参考,同时也得到了通用因素、位置因素、时间因素、民族因素、类型因素等词源参考。例如:《应力波诱发冲击矿压的动力学机理研究》一书,CIP数据主题分析为“6061#$a矿山压力$x冲击地压$x动力学分析”,标引人员可直接采用这一CIP数据。
2.2 CIP数据存在的不足
CIP数据在主题标引方面存在着一些问题,最主要的是选词不当,如所选主题词不规范,过于宽泛,专指度不够。同时也存在错标、漏标等现象。如清华大学出版社出版的由龚威主编的 《现代楼宇自动控制技术》一书,其CIP数据主题标引为“6061#$a智能建筑$x房屋建筑设备$x自动控制$x高等学校$j教材”,其中的“智能建筑”为非正式主题词,正确的标引应该是“6061#$a智能化建筑$x房屋建筑设备$x自动控制$x高等学校$j教材”。
正确认识CIP数据的优缺点,有助于标引人员更好地利用CIP数据。对于CIP数据,标引人员不能完全持全盘否定的态度,而应该有效地利用CIP数据,提出提高CIP数据质量的意见,以利于出版机构对CIP数据的改进。图书馆应重视CIP数据,批判性加以利用,以减少重复编目、缩短编目程序、提高编目效率,从而节省大量的人力、财力、物力,同时还可以加强与出版发行机构的交流合作,以促进我国图书在版编目质量的提高。
3 《中国分类主题词表》(Web版)的使用
随着计算机技术、网络技术在我国图书馆界的广泛应用,联机编目与远程编目的进一步发展,传统印刷型的《中国分类主题词表》已满足不了快速建立机读数据库的需求,不能帮助标引人员提高选词的效率。因此,要提高和优化主题标引工作,必须具有符合当今时代要求的查表选词工具作支撑。
《中国分类主题词表》(第二版及电子版)已于2005年9月由北京图书馆出版社出版。该书Web版于2010年3月17日通过国家图书馆验收。新修订的《中国分类主题词表》是我国规模最大的分类主题一体化的标引工具,为了适应新学科、新技术、新事物文献标引的需要,该表主题词增至110 837条,新增主题词为21 607条,如新增的 “电子政务”、“电子银行”、“网络营销”、“网上购物”、“网络贸易”等与网络有关的主题词。新增的主题词提高了文献主题内容揭示的专指度,是广大标引人员提高标引工作效率、提高主题标引的质量的重要参考依据。又如《选股不如选时:中国式炒股圣经》一书,第一版的 《中国分类主题词表》标引为“6061#$a股票$x证券投资$x基本知识”,新修订的《中国分类主题词表》已有“股票投资”一词,该书主题可直接标引为 “6061#$a股票投资$x基本知识”。《三维动画特效》以前主题标引为“6061#$a三维$x动画$x软件”,新版的《中国分类主题词表》增加了“三维动画软件”主题词,该书主题可直接标引文“6061#$a三维动画软件”。
《中国分类主题词表》(Web版)是通过互联网技术为 《中国图书馆分类法》、《汉语主题词表》、《中国分类主题词表》的广大用户提供各类信息资源的知识组织、知识检索、学科导航和实时更新的一个通用的数字型知识组织系统服务平台,具有多样化的检索功能、丰富的超文本链接功能以及提供各类知识内容、主题词、分类号的在线浏览、互动显示和多途径检索服务。用户可根据需要打开多个浏览窗口并在文档之间和各款目要素之间进行切换,可以用族首词查找新词,如用“文学研究”一词可以检索出“诗歌研究、小说研究”等新增的主题词。
4 结束语
主题标引是组织图书的一个重要环节,也是对图书信息的再创造的过程,优化标引工作、保证书目数据的质量以及保持数据的可持续发展,标引人员必须具备合理的知识结构体系,具有广博的知识面,不但要熟练掌握标引技术及对文献主题的分析和主题词的切分,还要具备坚实的应用检索语言的能力及一定的专业知识。加强标引人员培训,提高标引人员业务素质。标引人员只有通过学习文献主题标引理论与技术,在工作中善于发现问题,及时与同行进行沟通、与编目各个环节人员之间进行交流,才能更好地掌握分析文献主题的技巧,才能循序渐进地提高标引质量。以上几点仅是本人从事编目工作的粗浅体会,改进图书标引工作需要广大同行的持续努力和不断探索。
[1]张立新.查重--探析网络环境下中文图书编目的方法和技巧[J].新世纪图书馆,2005(4):23-25.
[2]梁平.中国图书在版编目问题研究[J].图书情报工作,2002(4):79-85.
[3]国家图书馆《中国图书馆分类法》编辑委员会.《中国分类主题词表》(第二版)及其电子版手册[M].北京:北京图书馆出版社,2006.
[4]李可立.文献数据库建设中的主题标引与质量控制[J].图书与情报,2005(5):71-72,92.
[5]陈瑞红.中文图书编目主题标引问题与解决办法[J].黑河学刊,2012(2):165-166.