CNKI数据库高级检索的应用探究
2013-08-15鲁海涛
鲁海涛
(宝鸡文理学院,陕西 宝鸡,721013)
随着互联网技术的成熟和广泛应用,获取知识信息资源的渠道正从传统的图书馆向便捷的数字化图书馆转变,当下的中国社会特别是杂志、图书出版部门和高等教育部门正加大对数字化图书馆资源的利用强度,学术成果的资源共享、成果的不端行为检测、期刊的影响因子、成果的引用情况等等都依靠着数字化、信息化的互联网知识资源数据库,在众多的数据库中CNKI无疑是使用最广泛的、操作最便捷、功能最全面的数据库应用系统。
1 CNKI数据库的特点
CNKI 是“中国知网”(China National Knowledge Internet)的英文简称,是国家知识基础设施(National Knowledge Infrastructure)的建设成果。世界银行《1998 年度世界发展报告》指出, 建设一个国家知识基础设施是发展中国家迅速提高自己知识创新能力和国民素质, 尽快缩小与发达国家差距, 发挥自身优势, 实现跨越式发展的一个重要途径。CNKI是世界上全文信息量规模最大的数字图书馆,通过网络资源共享平台,利用产业化运作,为全社会知识资源高效共享提供最丰富的知识信息资源和最有效的知识传播与数字化学习平台,具有知识的整合、集散、出版和传播的功能。
《中国知识资源总库》(简称《总库》)是CNKI的核心资源,是通过知识元的提取,实现对各类知识资源的跨库、跨平台、跨地域检索和链接。《总库》的建成对于传播中华文化、加速知识共享、促进全民素质和创新能力的提高具有与《永乐大典》、《四库全书》同样高的历史和学术价值。中国知网正是因为有了以《总库》为核心的强大数据库资源,因而区别了互联网上一般的新闻网站或综合信息网站,成为了真正能够满足人们知识需求的知识门户网站。
CNKI对库内文献内容进行了详细的标引,因而实现了文献的多指标检索功能,使用者可以通过标题、作者、关键词、摘要、全文等数据项进行检索。同时,检索出来的结果可以有多种排序算法,如相关性排序考虑了文献的引用关系、全文内容、文献来源等多种因素,使排序结果更合理;被引频次排序是根据文献的被引频次进行排序;作者指数排序则是根据作者发文数量、文献被引用、发文影响因子等评价作者的学术影响力,并据此对文献进行排序。此外,CNKI 文献检索提供的知识聚类功能是一般搜索引擎没有的。基于快速聚类算法,对返回结果的知识点进行聚类,并将主要知识点显示给用户,帮助用户改善搜索表达式,扩展搜索意图。
CNKI作为世界上全文信息量规模最大的数字图书馆,实现了以下功能:1.制定了“CNKI 系列数据库产品标准”,涉及到从数据入编、加工到最后形成数据库产品的全过程,从数据源头、数据质量等方面为开展深入的知识挖掘提供了基础。2.建设了“中国知识资源总库”,包括期刊、学位论文、会议论文、报纸、年鉴、工具书等源数据库,在资源数量和完备性上为建设各种知识搜索产品提供了保证。3.建设了各种知识库资源,包括:CNKI 知识词典、引文数据库、各种索引数据库、主题词词典等,对实现知识搜索、提高搜索性能起到了基础性作用。
2 CNKI数据库高级检索的使用特性
2.1 高级检索可使用的检索参数分为“检索内容条件”和“检索控制条件”,其中“检索内容条件”通过“主题、篇名、关键词、摘要、全文、参考文献、中图分类号”等关键字段,利用“并含、或含、不含”等逻辑关系字段进行检索算法编程,通过使用者检索预期标的设计检索程式,达到检索目的。“检索控制条件”通过“发表时间、文献来源、支持基金”等关键字段进行“精确/模糊”查询。单就这种检索算法而言并没有特色,这类检索的亮点在于引入了“词频”字段作为检索参数参与检索算法程式。“词频”指检索词在相应检索项中出现的频次。词频为空,表示至少出现1次,如果为数字,例如3,则表示至少出现3次,以此类推。
2.2 专业检索可通过逻辑字段编写专业检索语法表达式进行检索,可检索的字段有:“SU=主题,TI=题名,KY=关键词,AB=摘要,FT=全文,AU=作者,FI=第一责任人,AF=机构,JN=文献来源, RF=参考文献,YE=年,FU=基金,CLC=中图分类号,SN=ISSN,CN=统一刊号,IB=ISBN ,CF=被引频次”。示例:TI='生态' and KY='生态文明' and (AU % '陈'+'王' )可以检索到篇名包括“生态”并且关键词包括“生态文明”并且作者为“陈”姓和“王”姓的所有文章。
2.3 作者发文检索的亮点是可以通过“第一作者”和“单位”的组合条件进行检索,这类检索针对跨研究机构合作开展研究项目的增多而设计,这类研究成果在实际工作中不但要检索到成果,还要检索到第一完成人,以及第一完成人所在单位等信息。
2.4 科研基金检索提供了“精确/模糊”的检索模式,同时提供了重要基金列表供使用者选择,列表中包含“国家自然科学基金、国家社会科学基金、863计划、973计划、攀登计划、国家科技支撑计划”等98项中央国家级基金项目,还包括了442项地方省市级基金项目,314项高等院校基金项目,96项科研院所基金项目,2项企业基金项目,10项社会团体基金项目,3项军队基金项目,43项国外及国际机构基金项目。基金项目列表本身就具备一定的参考价值,将其应用在数据库检索中无疑是CNKI的一大亮点。
2.5 句子检索提供了任意字词在“同一句子/同一段落”中检索的功能,满足了了解某类学术热点研究现状的要求。
2.6 文献来源检索是CNKI检索的重要功能,其提供的文献来源列表具有重要的学术参考价值。CNKI将文献来源分为“期刊来源、博士学位授予点、硕士学位授予点、报纸来源、年鉴来源、辑刊来源”等6类,每一类又进行了二次检索分类,十分详尽。以期刊来源为例,可以通过“期刊名称、ISSN、CN”作为关键字段检索,还可以按照“收录来源”检索,收录来源细分为“CA、SA、SCI、EI、CSCD、CSSCI”等关键字段,还可以按照“核心期刊”检索,该检索项按照学科专业设置分为了七编,内容全面、准确。
以上是CNKI高级检索的主要功能,通过分析我们可以很容易的看出,CNKI不仅提供了便捷、准确、全面的检索服务,同时多角度检索算法给予使用者极大的目标空间,使用者可以根据自身需要利用多种检索字段进行检索,极大满足了检索目标的实现。
3 CNKI数据库检索功能的延伸
CNKI 数据库的全文资源采用收费模式运营, 但非全文资源可以通过免费方式获取,这极大满足了广大使用者的应用需求。当下国内高校均已购买CNKI 的使用权,但CNKI对于单位客户是利用IP地址锁定来实现权益维护的,一般而言CNKI 资源只能在高校校园网上使用,这种限制可以通过以下做法来弥补。使用者可根据需要利用免费非全文数据库, 检索相关内容所涉及文献题目, 并将文献题目粘贴至word文档保存, 然后利用有校园网络资源的电脑上,打开数据库将题目复制到检索框内,便可完成全文下载。另外, 大多单位不会购买CNKI 提供的所有数据库的使用权,使用者同样可以利用免费资源查询相关文献信息,利用其他渠道查询纸质文献。
CNKI的《中国引文数据库》收录了中国学术期刊(光盘版)电子杂志社出版的所有源数据库产品的参考文献, 并揭示了各种类型文献之间的相互引证关系。它既可以为科学研究提供新的交流模式, 也可以作为一种有效的科学管理及评价工具。
[1]白志文.CNKI数据库检索策略[J].长春大学学报,2000,10(2):72.
[2]刘莉.CNKI检索功能的深度开发和使用[J].大学图书情报学刊,2007年,25(1):43.