APP下载

中文医学文献数据库的使用问题

2015-03-22,,

中华医学图书情报杂志 2015年8期
关键词:标引文献数据库主题词

,,

医学文献数据库是医务人员及科研人员更新医学知识、寻找科研突破点、提升工作技能及研究能力等的重要途径。基层医疗卫生机构的卫生技术人员外语水平有限、计算机操作和文献检索能力不高,对中文医学文献数据库的依赖更强。然而任何数据库系统都会存在这样那样的问题,医务人员及科研人员应了解常用中文医学文献数据库存在的问题,并在使用中加以注意,以免影响对研究结果的评判。为提高用户对常用中文医学文献数据库的认识,方便其正确使用,对4种常用中文医学文献数据库开展实证研究。

1 常用中文医学文献数据库基本情况

常用中文医学文献数据库主要有中国生物医学文献服务系统(SinoMed,其前身为CBM)、中国医院知识总库(中国知网旗下的CHKD)、万方医学网(万方公司旗下,简称WF)和重庆维普中文科技期刊(简称VIP)[1-4]。SinoMed为医学文摘型数据库,CHKD、WF、VIP是综合性全文数据库,均收录医药卫生类期刊文献,既有目录文摘,又有全文。

2 常用医学文献数据库存在的主要问题

2.1 收录文献重复及收录不全问题

收录文献重复是指上述4种数据库收录的文献存在较多的重复。在期刊全文中除中国知网有独家授权的期刊、万方独家拥有的中华医学会、中国医师协会部分期刊外,其余超过50%(根据独家授权的期刊数量占总期刊数的比例进行估计,并参考文献[5])的期刊CHKD、WF、VIP均有收录,检索下载文献时要对各数据库的检索结果进行繁琐的去重。

收录不全主要体现在以下两个方面:一是由于中国知网和万方都各有一部分获得独家授权的期刊,故各数据库均无法将期刊收录齐全,如中国知网从2007年起不再收录中华医学会系列期刊;二是某一种期刊的某一期次或某篇文献未收入数据库中,如SinoMed虽然收录了2009年的《现代预防医学》,但却未能检索到发表在该刊当年第22期上题为《四川省城乡居民健康状况现况调查》的论文,而在CHKD及WF中均能查到此文。出现这种情况的原因可能是因为数据录入有疏漏,说明数据库应该进一步加强质量控制。

2.2 重要检索途径不完善

2.2.1 主题词检索问题

主题词是科技文献检索的基本途径之一,但中文文献大多未进行主题标引,盲目和随意使用检索词,对查准率影响较大。4种数据库中,SinoMed主题标引严谨,主题导航清晰,能提示用户将非主题词转变为主题词进行查找,适合专业人员使用;CHKD设有主题检索字段,具有自动将非主题词智能转换为主题词进行查询的功能,主题词更新时间是2014年,并且有中医药主题词表,有助于提高查准率,极大地方便了用户;WF也设有主题检索字段,但没有将非主题词智能转换为主题词的功能,主题词更新时间是2011年;VIP数据库未设主题词检索途径。

以“肝癌”作为主题词检索上述4种数据库(检索日期为2015-04-17,不限检索范围),从SinoMed中检出79 000条记录,从CHKD中检出73 437条记录。检索时,在主题途径中输入“肝癌”进行检索,CHKD将“肝癌”转化为主题词“肝肿瘤”进行检索并提供结果;SinoMed则提示规范主题词,用户需再次输入转换后的规范主题词进行检索;WF不能提示规范主题词或智能转化,检出记录为零(若以“肝肿瘤”进行主题检索,检出27 742条记录);VIP无主题词检索功能。

上述分析显示,使用相同的检索字段,各数据库检索结果差别较大。除了收录期刊种类和时间有差别外,其检索系统实现方式不一样也是重要原因。

2.2.2 关键词检索问题

CHKD、WF、VIP数据库虽都有关键词检索,但大多是直接使用期刊论文中的关键词,未能进行二次加工和补充。很多作者和编辑不了解标引规则,随意标引,关键词标引质量难以保证,这直接影响检索结果的准确性和完整性。

2.3 检索功能缺失

个别数据库检索字段不能实现精确检索,检索结果较粗糙,不准确,甚至出现完全不符的结果。WF检索时将不能拆分的作者姓名或机构名进行了拆分,得出错误的结果。如以作者途径检索“欧阳婷”得到了作者名为“欧阳利芬”、“徐玉婷”的记录,以机构途径检索“成都市第四人民医院”出现了机构名为“成都市第七人民医院”的记录。

以药品“盐酸黄连素”为例,通过“全部字段”和“药品”、“疾病”、“病症”途径分别在WF数据库中检索,检索结果均为187条记录,可以看出WF的“药品”、“疾病”、“病症”3个检索途径和“全部字段”检索项检索结果一样,说明这3个检索途径尚未实现。

2.4 数据库设计问题

2.4.1 期刊收录的时间轴及连续性、收录率不清楚

4种数据库均有期刊导航,可清晰地了解其收录的各学科期刊情况,但无法按时间(如按年或按月)准确查询各库收录的期刊明细,包括连续收录情况(历年收录)或收全情况(同一年所有期刊收录情况)、停刊及期刊变动信息等。

2.4.2 医药卫生类期刊学科归类不统一

分析4种数据库中医药卫生类期刊导航的学科分类情况,SinoMed 划分21类,CHKD,WF,VIP分别划分14类、16类和18类。4种数据库共划出26个学科类别,除7种学科名称相同外,有19种 (占73%)均不同或不完全相同(表1)。其中,SinoMed分类最详细,其次为VIP的分类,CHKD分类较粗(部分不完全与医药卫生相关的期刊也归入其中)。4种数据库对同一种期刊的分类也不统一,如《中国护理管理》、《中华医学图书情报杂志》、《医学信息学杂志》(表2)。医药卫生学科归类的不统一会影响用户按学科类别浏览检索文献,要引起注意。

表1 4种数据库医药卫生期刊的学科分类及各类期刊数量

注:1.统计时间2015年4月16日;2.在 SinoMed中同一期刊同时归入不同学科,去重后为2 777种。

表2 4种数据库期刊分类不一致示例

3 解决常用中文医学文献数据库存在问题的建议

解决上述问题需要用户、数据库开发商及医学情报专业人员、杂志编辑等共同努力。

3.1 深入认识各数据库的特点,根据需要有选择性地使用

3.1.1 从收录范围看

SinoMed是文摘型数据库,收录了1974年至今正式发行的中文医学期刊,受版权限制程度低,有独有的资源优势。

CHKD收录的期刊最早回溯到1979年,重点收录科学领域的核心期刊和具有专业特色的中西文期刊,还有一部分独有期刊,更新速度快。

WF收录的期刊最早回溯到1998年,收录医药卫生文献质量最高[6],主要是万方独家拥有、备受医疗和科研人员关注的中华医学会系列期刊和中国医师协会部分期刊。

VIP收录的期刊最早回溯到1989年,收录具有一定影响且连续性的非正式发行刊物,收录时间长,较适合以资料的丰富性和完整性为检索目标的文献检索。

可见,虽然目前SinoMed、CHKD、WF和VIP数据库之间期刊收录重复严重,但没有一个库能将所有中文期刊收齐,没有任何一个数据库可以被替代,各数据库收录资源既相互重复又有各自的特点和优势。目前只有将这4种数据库全查,建立中间库筛选查重,除此之外,未见有其他更好的方法和捷径[5]。一般来说,要查全某一专题的中文文献首先用SinoMed检索,然后再用CHKD、WF和VIP数据库补充,获取全文则宜首选CHKD。

3.1.2 从检索途径看

SinoMed标引质量高,检索字段全面,检索功能较强,可以精确检索、模糊检索,能提示将非主题词转换为主题词进行检索或精确、模糊检索,也可以使用检索式进行随机组配,并且分类详尽,检索方便、准确,是目前查找国内医药卫生文献最权威的检索工具[7]。

CHKD具有精确、模糊检索功能,其主题词检索途径可将非主题词转换为主题词,实现智能检索。CHKD还独有全文检索功能,查全率较高,在一定程度上弥补了主题标引规范化不高导致的漏查,但往往检出的文献太多,用户难以挑选到合适的文章,所以更适用于检索前沿性课题或文献量较少的冷门课题。VIP的“任意字段”检索是在论文中除正文以外的其他任何地方进行检索,检出率虽然低于全文检索,但比较实用[8-9]。

3.2 进一步加强医学文献数据库的标准化建设和质量控制

着力加强医学文献数据库的标准化建设,提高检索系统的质量。政府、用户、数据库开发商及医学专业人员、情报专业人员、杂志社编辑等要联合起来,构建检索系统的标准等并推进其执行。

第一,要重点规范统一医学专业学科类别,提高中文医学文献数据库质量。近15年来,随着信息技术及医学科学技术的发展,医学领域分类越来专业化、细分化,并出现大量交叉学科、边缘学科,而《中国图书馆分类法》医学专业分类表自1999年出版后一直未再版或更新、维护[10],原有的医学专业学科类别已远远不能适应目前医学文献数据库建设及检索的需要,亟待更新。

第二,加强关键词和主题词标引。中文作者在投稿时标引关键词而非主题词,由于大部分作者不了解关键词标引规则,也未接受过关键词标引方面的培训,在确定关键词时比较随意,审稿老师或编辑老师审核时也不能发现问题。数据库开发商在构建检索系统时无参照标准,无专业情报人员对其进行指导,未开展二次加工补充和完善,而是直接照搬作者所提供的关键词,从而影响关键词检索的效果。因此,编辑部要重视对论文关键词标引的审核把关工作,可以借鉴国外医学主题词标引的方法构建中文医学主题词库并定期更新,同时将关键词标引逐渐上升到主题词标引。各数据库开发商在建设检索系统时要依靠专业图书情报人员的关键词标引及主题标引的指导与审核。只有把好后台关,前端展现的检索结果及引文分析产生的知识发现才有价值。

第三,严把文献数据库质量关。一方面,政府学术管理机构要建立并完善医学文献数据库涉及的文献规范及信息技术标准。

要求数据库开发商要详细列出各自收录数据的时间轴、期刊清单,并及时公布收录率、收全率等情况。数据库开发商要严格按有关标准、规范构建数据库,加强测试及试用完善,同时在数据录入、标引等环节加强质量监管,避免遗漏和错误。文献出版机构、杂志社编辑要加强与作者的沟通交流,并注重规范性审校等,共同提高文献数据库的质量。

(注:由于对4类文献数据库的使用还不够深入,文中若有不妥之处见谅。)

猜你喜欢

标引文献数据库主题词
《感染、炎症、修复》杂志检索数据库
中医古籍医案知识元标引方法的思考及对策
《感染、炎症、修复》杂志检索数据库
关键词的提取与确定
《中国医学计算机成像杂志》2020 年第26 卷主题词索引
档案主题标引与分类标引的比较分析
基于用户心智模型的文献数据库评价研究
论我国学术文献数据库的质量调控
《中国骨与关节杂志》2016 年第五卷英文主题词索引