APP下载

基于提高查新员检索效率的PubMed检索案例分析

2017-01-27,,,

中华医学图书情报杂志 2017年6期
关键词:字段主题词检索

, , ,

PubMed作为国际公认的权威资源[1],是医学查新必查数据库之一。查新员通常采用关键词、主题词等检索方法,使查全率和查准率达到理想的平衡点[2],但检索效率往往并不高,原因主要有三:一是检索式冗余。例如主题词检索被过度使用,导致检索时间过长,检索效率低下;二是检索过程复杂,包容性不强。采用多途径检索时,各种途径相互独立,包容性差,检索界面来回切换,耗时较长,检索效率低下;三是缺乏归纳总结。查新课题千变万化,但检索万变不离其宗,学会归纳总结并灵活运用是提高检索效率的捷径。

1 检索词的分析与课题分类

检索前要制定有效的检索策略,检索策略的具体体现是检索式[3],而检索词是影响检索式构建和检索效果的关键。

常见的检索词包括关键词、主题词、副主题词等,主题词、副主题词均属于关键词的范畴。主题概念词在MeSH表中会匹配有主题词,主题词与副主题词[4]的组配原则是使用专指副主题词,不可越级组配。

按检索词是否属于主题概念词可以将查新课题分为两类:一类是包含主题概念词,但副主题词未作具体限定的检索;另一类是包含主题概念词和特定副主题词的检索。本文通过案例详细分析以上两类课题的检索策略,并从影响检索效率的三个方面作出案例小结。

2 包含主题概念词和未限定副主题词的检索

一般来说,为了比较全面地了解新课题,首先应选择在“All Fields”(所有字段)中进行检索,目的是帮助查新员迅速深入了解课题内容,缩短查新时间[5]。【案例1】“艾滋病(Acquired Immune Deficiency Syndrome,aids)与人乳头状瘤病毒(human papilloma virus,HPV)感染”课题项目。本课题查新点是人乳头状瘤病毒感染与艾滋病发病间的关系。通过分析,本案例包含两个关键词Acquired Immune Deficiency Syndrome和human papilloma virus,这两个关键词均属于主题概念词,且都未限制具体的副主题词,因此应采用“全部副主题词”。此种类型课题的检索可以分以下2步。

2.1 All Fields字段的初步检索

首先利用PubMed 默认转换方式,直接输入检索式:(Acquired Immune Deficiency Syndrome OR aids) AND (human papilloma virus OR HPV),未标识字段,默认字段为All Fields,PubMed会按以下Details进行检索:(("acquired immunodeficiency syndrome"[MeSH Terms]OR ("acquired"[All Fields]AND "immunodeficiency"[All Fields]AND "syndrome"[All Fields]) OR "acquired immunodeficiency syndrome"[All Fields] OR ("acquired"[All Fields]AND "immune"[All Fields]AND "deficiency"[All Fields]AND "syndrome"[All Fields]) OR "acquired immune deficiency syndrome"[All Fields]) OR ("acquired immunodeficiency syndrome"[MeSH Terms]OR ("acquired"[All Fields]AND "immunodeficiency"[All Fields] AND "syndrome"[All Fields]) OR "acquired immunodeficiency syndrome"[All Fields]OR "aids"[All Fields])) AND (("papillomaviridae"[MeSH Terms]OR "papillomaviridae"[All Fields]OR ("human"[All Fields]AND "papilloma"[All Fields]AND "virus"[All Fields]) OR "human papilloma virus"[All Fields]) OR HPV[All Fields])。为保证查全率,多数查新员会再进行主题词检索。主题词检索式为("Acquired Immunodeficiency Syndrome"[Mesh]AND "Papillomaviridae"[Mesh]),最后对检索结果去重处理。

默认在全部字段中检索时,PubMed会根据预先编制好的主题词表[6],在MEDLINE及其他子库中进行检索,而主题词检索时只检索MEDLINE库[7]。通过分析Details发现,关键词检索的结果包含主题词检索结果。当利用默认途径在全部字段中检索时,要避免因主题词检索的过度使用而导致的检索式冗余,检索效率低下。

2.2 缩小结果范围,提高检索精准度

在All Fields字段中检索的结果范围大,数量多,文献相关度低。针对这种情况,可以给关键词加双引号和限定字段,缩小检索范围,提高检索精准度。无论是精确查找还是字段限定检索,PubMed都不再自动匹配主题词。本案例中“human papilloma virus”有多种分型,比如16型、8型等,单纯用关键词检索易造成漏检,为保证查全,应进行关键词和主题词的复合检索。若限定在标题或摘要中检索,其复合检索式应为("Acquired Immune Deficiency Syndrome"[Title/Abstract]OR "aids"[Title/Abstract]) AND ("human papilloma virus"[Title/Abstract]OR "HPV"[Title/Abstract]) OR ("Acquired Immunodeficiency Syndrome"[Mesh] AND Papillomaviridae[Mesh])。

以上是包含主题概念词和未限定副主题词的案例。此类课题,查新员首先应在全部字段中检索,如果检索结果数量多,范围大,可再运用精确检索、限定字段等方法调整,编写包容性强的复合检索式,避免在多种检索途径中来回切换,实现一键式快速检索,节省时间,提高检索效率。此外,并非任何课题都需使用主题词检索,而是需根据课题内容深入分析,再结合匹配的主题词确定[8]。

3 包含主题概念词和特定副主题词的检索

无论何种检索内容,检索的宗旨都是在保证查全率的基础上提高查准率。检索内容包含主题概念词和特定副主题词时,副主题词又分为显性副主题词和隐性副主题词两种情况,显性副主题词指在课题中能一目了然的副主题词,隐性副主题词指未能全部揭示,在字面上是隐性的,或者隐藏在某些概念之中,需要分析才能确定的副主题词。

3.1 显性副主题词检索

【案例2】“非典型肺炎(Severe Acute Respiratory Syndrome,SARS)的流行病学(epidemiology)研究”课题项目,本课题查新点是某地区非典型肺炎流行病学特征,为制定防治策略提供科学依据。此案例中包含的两个关键词是“非典型肺炎”和“流行病学”,非典型肺炎是主题概念词,流行病学是非典型肺炎的专指副主题词,属显性副主题词。流行病学包括患病率、发病率、死亡率等,只用关键词检索易造成漏检,需要采用关键词和主题词的复合检索。默认检索中Details显示的“epidemiology”[MeSH Terms]是把epidemiology匹配成主题词进行检索,是不恰当的。这种情况下应该强制输入专指副主题词,复合检索式为("Severe Acute Respiratory Syndrome"[Title/Abstract]OR "SARS" [Title/Abstract]) AND "epidemiology"[Title/Abstract]) OR "Severe Acute Respiratory Syndrome/epidemiology"[Mesh]。

无论是查新还是一般检索,首先要保证检索策略特别是检索式的正确性和严谨性,否则检索效果可想而知。与一般检索人员不同,查新员不能盲目参照PubMed实际使用的检索策略和语法[9],而应在其基础上根据课题订制检索式。

包含主题概念词和显性副主题词的课题,关键词和主题词均需检索。查新员需要熟练掌握PubMed常用副主题及其组配原则,为保证检索质量,建议每次只用一个主题词与副主题词的组配检索[10]。

3.2 隐性副主题词检索

【案例3】“支原体肺炎(mycoplasma pneumonia,mycoplasmal pneumonia) 的糖皮质激素(glucocorticoid)治疗(therapy) ”课题项目。本课题的查新点是与其他药物相比,用糖皮质激素治疗支原体肺炎的效果评价。案例包含3个关键词“糖皮质激素”“治疗”和“支原体肺炎”,但实际检索时并不都用作检索词[11],糖皮质激素与支原体肺炎之间属治疗方式与治疗对象的关系,因此“治疗”无需过度检索。糖皮质激素和支原体肺炎的副主题词都是隐性的。糖皮质激素是肾上腺皮质分泌的一类甾体激素,应选择上位主题词glucocorticoids,专指副主题词为therapeutic use (治疗应用),支原体肺炎的专指主题词Pneumonia,Mycoplasma,匹配的副主题词应为drug therapy(药物治疗)。本案例默认检索的Details显示两个主题词匹配的都是全部副主题词。因此,手动调整检索式,强制进行专指副主题词的组配检索,复合检索式为: "glucocorticoid"[Title/Abstract]AND ("mycoplasma pneumonia" [Title/Abstract] OR"mycoplasmal pneumonia"[Title/Abstract]) OR (glucocorticoids/therapeutic use[Mesh]AND Pneumonia,Mycoplasma/drug therapy[Mesh])。

包含主题概念词和隐性副主题词案例的检索,挖掘隐性副主题词是重点也是难点。查新员要结合课题和副主题词表,在充分考虑主题概念词间关系的基础上作出判断,而不是笼统地用全部副主题词代替。复合检索式编写时可以手动输入副主题词,进行强制检索。

4 查新员能力拓展

查新工作受理的时间集中,查新员需具备较强的综合检索能力和课题分析总结能力,才能在短时间内高效完成任务。

4.1 综合检索能力

综合检索能力是指熟练运用复合检索式整合关键词和主题词检索,通过不断调整检索策略,使检索结果达到最佳。综合检索能力的核心是熟练、准确地编写复合检索式。虽然PubMed有多种检索途径,但默认检索整合了PubMed其它检索方式。查新员需要充分利用默认检索,编写复合检索式,实现一键式快速检索。复合检索式的编写要考虑关键词及其同义词,逻辑算符、检索字段,主题词、副主题词等,熟悉常见主题概念词匹配的主题词或其上位主题词,熟练掌握82个副主题词及其组配范围。精通MeSH表,不是通过死记硬背的方式,而是对数量众多的课题项目进行分析、归纳总结,并把经验运用到查新中去。

4.2 课题分析总结能力

结合本文的3个案例,针对新课题,要分析哪些是关键词?哪些是检索词?哪些是主题概念词?哪些是副主题词?主题词是专指主题词还是上位词主题词?检索课题是属于包含主题概念词、副主题词未作具体限定的检索还是包含主题概念词和特定副主题词的检索?副主题词是显性的还是隐性的?不同课题类型其检索策略及复合检索式的编写上都不完全相同,检索策略的好坏及复合检索式的正确与否直接影响查新的质量和检索效率[12]。课题的归纳与总结,包括主题概念词匹配的主题词及副主题词分别是什么?同类课题在选择主题词及副主题词上有何特点?哪些词需要进行主题词检索?归纳总结的过程就是积累检索经验的过程,在以后的查新中,完全可以参照类似课题的检索经验,节约时间,提高检索效率。

查新是一项高强度,高技术含量的工作,其工作性质决定了查新员要具备较强的综合检索能力、分析能力和实际运用能力,查新员只有加强学习并注重经验的积累,才能达到高效工作的目的。

猜你喜欢

字段主题词检索
关键词的提取与确定
《中国医学计算机成像杂志》2020 年第26 卷主题词索引
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
浅谈台湾原版中文图书的编目经验
Can we treat neurodegenerative diseases by preventing an age-related decline in microRNA expression?
浅议专利检索质量的提升
《中国骨与关节杂志》2016 年第五卷英文主题词索引
无正题名文献著录方法评述
无正题名文献著录方法评述