APP下载

煤炭科技论文中关键词标引与检索探讨

2010-02-13

中国煤炭 2010年8期
关键词:标引题名检索

颉 君

(煤炭信息研究院,北京市朝阳区,100029)

★经济管理 ★

煤炭科技论文中关键词标引与检索探讨

颉 君

(煤炭信息研究院,北京市朝阳区,100029)

阐述了关键词及其作用和意义,并针对煤炭科技论文中关键词标引不合理的例子进行了分析,叙述了关键词标引与信息资源检索的关系以及科技论文关键词标引的方法。

科技论文 关键词 标引方法 文献检索 关系 G254.2

AbstractThe functions and meaningsof key words are described and examp lesof inadequate markings of key wo rds by coal technical papers are analyzed.The relationship in betw een the markings of key words and the searching of information resources and the ways of markings of key wo rds are depicted.

Key wordstechnical papers,key words,waysof marking,literature searching,relationship

所谓关键词,是指那些从文献的标题、摘要、层次标题和正文中选取的,对表达文献主题内容具有实质意义的并可以作为检索入口的词语,是一种近似自由词的自然语言。国家标准对于关键词的描述为:“关键词是为了文献标引工作从报告、论文中选取出来用以表示全文主题内容信息款目的单词或术语”。由此看来关键词必为单词或专业术语,而且能高度概括和代表整个文献的基本内容,是文献的灵魂。当今世界每年科技论文发表数万篇,类型繁多,出版分散,内容交叉,相互渗透,随着计算机技术的发展,刊载该论文的期刊进入了各种各样的数据库,成为人们检索的对象。论文中标引的关键词就成为重要的检索标识信息。由于关键词是为了满足文献标引或检索工作的需要而从文献中提炼出的词语,所以关键词选得是否恰当、准确,就关系到该文被检索的利用率。所以那些不能揭示文献核心内容的词语,就不能选作关键词。

1 科技论文关键词标引的作用

1.1 可以帮助人们理解文献的主题,并获得文献的关键信息

关键词能够直观地表述文献的主题,并将文献的重要信息点提供给读者阅读,读者只要分析一下关键词,就可对文献的类别、主题内容及可能提供的信息进行判断,从而了解该论文论述的主题,作出是否需要阅读正文的判断。

1.2 可以帮助人们进行文献检索

关键词是检索文献的入口之一。选择何种词语作为关键词,实际上就是把文献定位于某一特定的类别。选取和标引关键词,实际上就是做了文献的归类工作。现在各种专业文献库相继建立,在建设数据库的过程中,数据文献的处理是数据库的主体内容,这种处理主要是通过编写程序和标引来达到的,关键词提供了检索的途径。因此,关键词具有重要的检索意义。

2 科技论文中关键词标引不当对信息检索的影响

2.1 文献主题内容分析错误造成标引错误

关键词必须是在正确分析提炼出所标文献的主题内容基础上进行,只有弄清其中心内容,才可从中提炼出文献主题来,不能只凭题目臆想其主题。否则造成文献的误检,降低了检索的查准率。

例如:题名“关于槽型皮带运输能力计算公式中截面系数k的讨论分析”,文章主要讲了输送机胶带的运输量的计算问题。

原关键词标为:输送带;断面;系数k。

阅读分析文章后,发现这里的“截面”系指槽型输送带物料堆积的截面,不是皮带断面,因此标“输送带断面”是错标。正确的标引应为:

带式输送机;输送带;槽型输送带;运输能力;计算方法。

2.2 标引的关键词不能准确反映主题内容

关键词的主要作用是通过这些词的逻辑组合,揭示论文的主要内容。但是许多论文在选用关键词时没有准确把握关键词的作用,选出的几个关键词并不能有效地提示论文主题内容,因此无法判定该论文所阐述的主题内容,造成读者检索时误检或漏检。

例如:题名“浅谈山西国有煤炭企业管理信息化”,文章阐明了信息化建设在煤炭企业安全生产管理、提高管理效率和提升企业的综合竞争力等方面所起的作用。

原关键词标引为:煤炭;信息化建设;解决实际问题;健康发展;统一规划;实施对策。

上述标引中,揭示主题内容的词“企业管理”没有标出,从选用的几个关键词中,无法判断这是一篇描述信息化建设在煤炭企业管理中应用的文稿,因此在检索有关煤炭企业管理的文章中是无法检索到该篇文章的。降低了文献的检索率。

正确的标引应为:煤炭企业;企业管理;信息化建设;管理效率。

2.3 标引的关键词概念大于或小于所标文献的主题内容

标引时选用的关键词要与主题概念内容相符,且是最专指、最恰当的词,不能以“大”代“小”或“小”代“大”。

例如:题名“浅议如何减少轨道电路故障”,文章介绍了如何减少露天矿煤炭运输铁路轨道电路故障。

原关键词标为:铁路;电路;故障。

上述标引中,首先主题内容“露天矿煤炭运输”这一词没有表达出来,其次“铁路”一词概念的范围太大,应选用“轨道运输”这一专指词。

正确的标引应为:露天矿运输;煤炭运输;轨道运输;电路故障。

如读者查找有关露天矿煤炭铁路运输轨道电路故障方面的文章即可查到,因此,提高了检索的查准率。

2.4 将研究对象的母体遗漏,造成关键词漏标

例如:题名“如何在有利的市场情况下做好煤炭销售工作”,文章论述了在市场经济形势下,煤炭销售工作的重要性及煤炭营销工作策略。

原关键词标为:市场细分;渠道管理;掌控资源;整合营销。

在上述题名中很明显最能反映文献主题内容的“煤炭销售”一词漏标,这样在检索有关煤炭销售方面的文章时就不能检索出此篇文章,使查阅者失去一些有价值的文献,而所选用的几个词均无法体现“煤炭销售”这一主题内容。

正确的标引应为:煤炭销售;煤炭市场;营销策略;市场细分;整合营销。

2.5 把关键词写成短语

按照国家标准对关键词的描述,选作关键词的词语,应是单词或术语,关键词既要反映论文的主题内容,也要具有专指性和检索意义,不能为了强调全面反映主题内容而把关键词写成词组或短语。有的作者为了使每一个关键词都尽可能准确地表达论文某一确切的含义,将关键词写全、写完整,进而写成一个短语。

还如上述题名为“浅谈山西国有煤炭企业管理信息化”的一文中,关键词“解决实际问题”一词显然不符合国家标准对关键词的描述,已写成了短语,故在选词上属于不正确。

2.6 将一些泛意词、连词选作关键词

科技论文中大都有一些不具有学科性质的通用词,如研究、方法、分析、应用、发展等,作为关键词标引出来,缺乏对论文主题内容的专指性,也就失去使其在提示某一论文主题内容的检索作用,极大影响了论文的检索效率。

例如:题名“提高我省煤炭外运能力的建议”,文章就陕西省运输战线存在的铁路运输紧张,形成煤炭积压,而公路汽车运输却货源紧张,无米下锅的问题,提出了如何提高煤炭外运能力的建议。

原关键词标为:煤炭;能力;建议。

上述标引像“能力”、“建议”这类通用词如果读者进行检索,将会把数据库中包含的各学科文献归总为一类检索出来,检出的文章内容会包括各个专业,所指的对象千差万别,这样也就很难从中检索出所需的文章,降低了文献的查准率。所以对一些无实际内容的附加词、泛意词不能选为关键词标引。

正确的标引应为:煤炭运输;铁路运输;公路运输;运输能力。

3 科技论文中关键词标引的方法

3.1 分析文献主题,对主题概念进行提炼标引

关键词的标引应该严格按照国家标准《文献主题标引规则》的规定,在审读文献题名、摘要、结论的基础上,对文献进行主题分析,然后从中抽取与主题概念一致、具有检索价值的专业性的词和词组作为关键词进行标引。

例如:题名“矿井深水平煤层的瓦斯抽放”,文章介绍了采深600~1000m的煤层,采用水力爆破方法提高钻孔抽放量的试验情况。

进行主题分析后,选用的关键词:深部煤层;水力爆破;瓦斯抽放。

3.2 关键词标引必须符合检索要求

从文献题名、文摘或正文中抽取关键词时,应考虑用户的检索习惯;若使用冷僻、罕见的词作为关键词,必然导致被标引文献的漏检。

3.3 分析隐含概念,切忌只按题名标引

某些主题在题名、摘要中表达不是很明确,但是又隐含着某一主题,这时要对全文进行主题分析并经提炼后标出其关键词,避免直接依据题名进行主题分析。

例如:文献题名:“煤炭,黑金依旧闪烁”。从题名上看,主题内容不是很明确,但仔细研读全文进行主题分析,发现作者对煤炭行业的产销量、煤炭价格、投资价值等进行了分析,因此该篇文章提炼出的关键词:

煤炭供应;煤炭价格;投资价值;产销量。

对于题名不能反映主题内容的,如果只从题名上进行标引,检索时就无法查询到这篇文章作者写作的真实意图,造成漏检。

3.4 对专业名词、专有名词应直接标引

在选取关键词的过程中,常常会碰到一些词组,特别是有些专业名词及一些固定搭配的词组,标引时是不能切分的而要直接标引。如“地理信息系统”,就不能切分为“地理”和“信息系统”两个关键词。“计算机辅助设计”也不能切分为“计算机”“辅助设计”两个关键词。

3.5 把握好关键词标引深度

标引深度是指对一篇文献所给予的全部检索标识的数量。即对该文献中具有检索意义的内容特征和外表特征,进行分析描述所达到的深度。对关键词标引来说,则是指对该文献所给予的关键词数量的多少。对于科技论文文献来说,从对文献内容的角度分析,一般可从生产设备名称、技术性能、生产原理、产品结构、设计方法、所用材料、工艺过程等角度抽取关键词标引。单主题文献的关键词可少些,多主题的关键词应多选些,一般可选取3~8个词作为关键词。

4 结语

综上所述,在信息资源检索中,标引具有重要的作用。在整个检索系统中,标引处在承上启下的地位,它既是文献存入检索系统的依据,又是从检索系统中查出文献的依据。从这个意义上讲,标引又成了沟通文献著者和文献使用者之间的桥梁,也是检索的基本前提,没有正确的标引,也就不可能有正确的检索。而关键词标引既是揭示文章主题内容的精华,同时又是检索所需要的词,两者缺一不可。如何使标引达到直接、客观、完整地揭示主题本质的要求,关键在于对文章主题要作全面的,合乎逻辑规律的分析。关键词标引的过程实质上是对论文内容的提炼过程、评价过程和概括的过程。标引质量提高了,检索结果才能准确、实用。

(责任编辑 熊志军)

Brief review on marking&searching of key wordsof technical papers of coal industry

Xie Jun

(Coal Info rmation Research Institute,Chaoyang District,Beijing 100029,China)

颉君 (1962-)女,汉族,北京人,毕业于北京首钢工学院,馆员。

B

猜你喜欢

标引题名检索
栖凤阁题名记
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
档案主题标引与分类标引的比较分析
第二届“常山杯”观赏石珍品展展品选登
大数据时代数字资源的主题标引研究
专利检索中“语义”的表现
关于关键词标引的要求
关于关键词标引的要求
佳石选赏