APP下载

大数据时代学术期刊信息数据库的建设

2020-01-03谢文亮郑添尹

现代信息科技 2020年14期
关键词:学术期刊数据挖掘数据库

谢文亮 郑添尹

摘  要:研究大数据时代学术期刊如何通过数据挖掘构建五类学术期刊信息数据库,通过采取数据挖掘方法对作者信息相关数据进行收集,分析和探讨学术期刊五类数据库建设条件和数据库的信息资料来源搜集方法。结果表明,学术期刊信息数据库建设方法简单可行,适合一般学术期刊的信息数据库建设,为学术期刊的信息数据库建设和维护管理提供借鉴。

关键词:大数据;学术期刊;数据库;信息搜集;数据挖掘

Abstract:This paper studies how academic journals construct five types of academic journal information database through data mining in the era of big data,collects data related to the authors information by adopting data mining methods,analyzes and discusses the construction conditions of five types of academic journals database and the source collection methods of database information. The results show that the construction method of academic journal information database is simple and feasible,which is suitable for the construction of general academic journal information database,and provides reference for the construction and maintenance of academic journal information database.

Keywords:big data;academic periodicals;database;information searching and collection;data mining

0  引  言

学术期刊的发展依赖各类人员,如期刊的稿源来自作者、读者和潜在的作者源,期刊的质量把握依赖外审专家,期刊发展后劲除了作者、读者、专家外,还依赖于潜在作者来源,期刊的宣传有赖于自媒体群,如QQ群、微信群等。可以说,办刊以人为本,事关刊物成败的人员分为两种,一种是编辑部内部人员,其重要性不言而喻;另一种是编辑部外部人员,其中,比较重要的是以上列出的五种人员,即专家、作者、读者、潜在作者以及自媒体群人员。五类人员与期刊休戚相关,对其建立数据库是期刊管理的一个重要组成部分。期刊的信息数据库的建立,既为期刊编辑服务,也为期刊的可持续发展服务。计算机技术的信息化和网络化为信息数据库的建设提供了良好的条件,数据挖掘和语义技术为数据库人员信息的完善和扩充提供支持,因此,要善于利用当前的计算机技术来建立和完善信息数据库。然而,目前学术期刊普遍不关注信息数据库的建设与维护,导致学术期刊信息数据库建设严重滞后,发展后劲遇到了瓶颈,探讨期刊信息数据库的建设可为期刊提供借鉴。

1  学术期刊信息数据库的作用

对于期刊来说,最关紧要的是几类人群是:专家、作者、读者、潜在作者、自媒体群人员等。如果建立起这几类人群的数据库,对期刊的发展有不可估量的作用。因此,期刊要将建设专家数据库、作者数据库、潜在稿源数据库、期刊自媒体群数据库、读者数据库五类信息数据库[1]作为重要的期刊管理事务。建立数据库的目的是便于联系和交流,因此,有了读者,期刊才能生存下去。建立这五类数据库,可定期给这五类人员发Email、寄样刊、发送最新选题和特色栏目、发约稿函,每到节日发贺卡问候祝福;一回生,二回熟,三回有印象。这样期刊不愁没有来稿,不愁没好稿件,对期刊的影响力、评刊指标、长远发展等都有极大的帮助。建立读者数据库,可定期为库中读者提供期刊信息,提供期刊目录精准推送服务,能加强与读者的交流,并通过已有读者发展读者,扩大读者群。建立起作者数据库,便于组稿和约稿;学术期刊并非永远有优质的来稿,需要编辑进行策划和组稿,稿件的来源便有赖于作者数据库。通过潜在稿件数据库容易挖掘出有利于期刊的潜在读者和潜在的优质稿源。通过在期刊自媒体群数据库中自媒体群的宣传,可扩大期刊知名度。

2  五類数据库的建设

2.1  专家数据库的建设

专家是期刊质量的保障。专家在期刊的办刊中起到多方面的作用,一是专家为期刊发展的“军师”,可为期刊的战略发展提供咨询、策划期刊的发展方向等,如期刊的专家顾问团、顾问委员会、期刊智库等;二是专家稿件效应,一个期刊想要与众不同或想要有知名度,必须能约到一定数量的专家级的稿件,专家稿件在质量保证、转载、转引、关注度上有明显优势;三是专家审稿,学术论文由于其专业性强,编辑无法熟悉每一个领域的内容,因此论文的内容科学性、选题新颖性、思想性等问题交由专业领域的外审专家来审定。专家数据库对期刊的长远发展有着决定性的意义。建设专家数据库时,专家的信息可从不同的途径获取,如官方主页、高端会议、国家基金项目、国家级成果文库等[3],如图1所示。

在官方主页上,每个高等院校或科研单位都会将本单位的专家资料放在“院士风采”“名家风采”“教授风采”“长江学者”“学科带头人”等栏目供人浏览;一些博士生导师或硕士生导师等在某一学科有影响力的人物,一般会放在各个二级部门主页的“师资力量”上,具体的信息还可以从当年的硕士或博士招生目录中找到;从各种会议、论坛上获得专家信息,如中国可信计算与信息安全学术会议、IEEE无线通信,网络技术与信息安全国际会议、图像与信号处理、生物医学工程与信息学国际学术会议、中国经济学年会等,会议举办方会将参会人员通讯录发放到每个人的电子邮箱里,通讯录人员信息包括单位、部门、姓名、性别、职务、职称、手机、电子邮箱、研究领域、研究专长等,通过筛选,将符合条件的人员数据直接导入到数据库中。还有其他渠道,如从国家、省、市等公布的自然基金项目获得者中得到专家的信息。将专家的资料提取出来,建立专家数据库。专家数据库必须定期进行更新和完善,每年都会在学科领域出现新的面孔,要特别重视并将这些新专家加入数据库。建立起专家数据库后,要重视与数据库中专家的联系,编辑可通过发邮件、寄样刊等方式,与专家建立起良好的关系,再根据专家的研究领域、研究专业、研究方向等,试着向专家约稿,邀请专家审稿,或就期刊的选题或发展方向等向专家咨询。利用学科年会等与专家接触,建立起良好的合作关系。

2.2  作者数据库的建设

作者是期刊的生命线,期刊必须尊重作者、善待作者。作者是期刊忠诚的读者,他们对期刊投稿,意味着他们对期刊质量的认可。对于无论是采用或是不采用的来稿作者,都要给予重视。如果一个作者的稿件沒被采用,期刊就对该作者不问不睬,久而久之,作者对期刊的忠诚度也会减弱,优质稿件再也不会投到期刊来。因此,对作者要重视,建立起作者数据库是为了持之以恒地与作者保持联系。

传统的纸质投稿由于速度慢、不便于管理等原因逐渐被信息化投稿方式淘汰。目前,期刊投稿方式基本有两种,一是电子邮件投稿,一是在线投稿。邮件投稿的作者在来稿中一般会附上自己的相关的信息,如姓名、单位、部门、职称、研究领域、电子邮箱、手机,这些信息就是作者数据库现成的可用来源。对于在线投稿来说,作者信息更齐全、更详细,并且系统提供Excel导出功能,可以直接将需要的数据导到数据库中。对来稿作者的信息,不是来者必录,而是要进行严格的筛选,标准是研究方向必须符合本刊的选题定位。根据这个标准,对初审中不符合本刊学科研究方向的作者作不入库处理。对于符合入库条件的,无论稿件采用与否,都要将作者资料信息录入数据库。在网络化、信息化时代,人性化的交流尤其重要。学术期刊要定期给作者发邮件,真诚地问候作者,关心作者研究近况、最新研究成果以及最新创作等情况。定期、周期性的交流工作,让作者意识到期刊一直关注着他的研究工作注,加深了作者对期刊的良好印象;作者一有新稿件问世,在考虑投稿时,会将稿件投往他印象最深刻的期刊。因此,对作者的重视,是对期刊生命线的维持。

2.3  潜在稿源数据库的建设

拓展稿源是落实学术强刊的关键[4]。期刊不仅要保持现有的核心作者源,还要寻找、发现和挖掘有潜力的作者,获取途径如图2所示。

学术期刊往往忽略了对作者的团队成员的挖掘,学术研究团队能提供更宽阔、更广泛的、有相同研究方向的潜在作者,这是学术期刊必须长期重视并且努力争取的稿源。学术研究团队的挖掘有现成的工具可利用:对本刊发表文章的作者,中国知网上提供了作者的知识网络,包括作者关注领域、作者的导师、合作作者(包括同机构作者、其他机构作者,并给出了合作者之间的关系图)、指导的学生等。由于学术研究团队具有统一性、连贯性和继承性,因此学术研究团队的研究学科、方向基本都适合本刊的要求。由作者形成的知识网络出发,可以完成作者的学术研究团队数据的收集。另一种潜在作者是通过各种期刊,如在本专业核心期刊以及一般期刊等发现人才,其搜索需要花一定的精力以及有一定的判断力。不过互联网本身就是一个无边际、信息量巨大的数据库,现在的交互性媒介,如微信公众号、博客(包括微博)、论坛等为学者提供了表达观点、发表文章的机会。一些人喜欢在自己的微信公众号、博客发表文章,有些作者现在缺乏知名度,但文章有见解、有前瞻性,具有一定的含金量,这些作者具有发展潜力,是学术期刊争取的潜在稿件对象。如果学术期刊在他们尚未成名之前就将其作为潜在稿源,经常交流,建立起良好的关系,树立起期刊品牌形象,这些潜在作者一旦成名,会饮水思源,将是优质的稿件的来源渠道。当然,还有其他发现潜在稿源的途径,如参加学术会议并对会议论文集进行研究阅读,也可以发现其中有潜力的作者;平时阅读学术期刊时,对那些有深入见解的作者也要给予高度重视,将他们的信息收集到潜在稿源数据库中,主动跟他们联系。总之,潜在的作者源数据的建设,是学术期刊可持续发展的保障,要勤于挖掘和发现。

2.4  期刊自媒体群数据库

互联网时代,特别是移动互联网时代,自媒体宣传成为学术期刊自我宣传的一个窗口。目前QQ和微信是当今我国最流行的即时通讯工具,几乎每个上网的中国人都人手一个QQ号码和一个微信号码,QQ群、微信群也是信息发布和信息交流的地点之一。读者都比较喜欢和编辑打好关系,只要编辑主动地在网上提供QQ号码和微信号码,读者会自动地加编辑为好友,这样就可以组成一个编辑群,可以为读者答疑、发布征稿消息和选题信息等。自媒体群的方式主要有两种,一种是QQ群,另一种是微信群。一些学术期刊建立起了多个自媒体群,如编辑部内部群、期刊同行交流群、期刊与作者群等。从某种角度来说,自媒体群也是一种数据库[5]。虽然基于推广期刊、促进交流的目的建立了QQ群、微信群等,但容易忽略自媒体群数据库的建立。自媒体群处于变动状态,一旦群解散了,经过千辛万苦建立起来的关系就立刻解除。因此,要防患于未然,建立期刊自媒体群数据库,将群人员的信息,包括QQ号、微信号、工作单位、所在自媒体群等用数据库方式保留起来并定期更新,掌握自媒体群信息主动权;一旦群解散,由于人员信息还在,容易再次组建。

2.5  读者数据库的建设

读者的来源很广,包括专家、作者、潜在稿源作者、自媒体群人员、高校科研人员以及期刊同行等。读者数据可以是以上建立的四个数据库的数据库的合总,再加上其他人员的信息合并而成,如图3所示。

得到读者数据的最简单的方法是通过在期刊主页上建立调查问卷,调查问卷中要求参与者输入正确的个人信息,对参加调查问卷的读者赠送一点小礼物;在纸质期刊上附纸质的调查问卷,让读者填完后回寄,也是建立读者数据库的途径之一。通过在线系统接收投稿的学术期刊社,其在线系统有提供读者注册服务,读者信息可从系统中直接导出。对于其他类型的读者,要根据期刊社的发展需要以及一些读者的合理要求,建立起读者数据库。

3  学术期刊数据库建设实践

广东财经大学学报通过数据挖掘技术对各类期刊人员信息聚类和分析,建立起了五类人员数据库。每一类数据库都必须仔细记录了人员信息,包括姓名、单位、部门、性别、职称、研究领域、手机、电子邮箱,如图4所示。

使用Microsoft Excel建立数据库。每一张Excel表就是一个数据库,表中的每一个方格就是一个数据项。由于Excel具有强大的求和、筛选、排序等功能,可以进行统计分析、分类汇总、查询检索等[2],因此在建设的过程中,使用Excel进行重复筛选、去伪存真、分类聚类等,使得数据库简洁明了,人员分类有条理,能高效地查询到所需的人员信息。在建立学术期刊信息数据库的过程中,考虑到信息的来源不同,对不同数据库的内容采取不同搜集方法,利用大数据技术和信息化手段来搜集各个数据库的数据项,并时常进行内容的更新。

4  结  论

在信息数据库的建设和应用过程中,要注意以下方面的事项:首先,对数据库数字信息的搜集,要从合法的、公开的途径,要遵守相关的法律法规,才能做到合法合理;其次,对数据库要做好保密措施,谨慎使用其中数据,不能随便将数据库信息透露给其他人,因为很多信息涉及个人隐私,一旦不小心泄露了出去,会给人员造成很多工作和生活上的不便;再次,通过数据库与专家、读者、作者等联系时,要注意时间、节奏等细节,过于频繁会让人误解为骚扰;第四,数据库要勤于维护和完善,增加新的、删除过时的、补充原来未全的、去掉被证明为错误的,才能使数据库的数据趋于完善、精确;最后,建设数据库的过程中,要加强信息甄别能力,学会辨别真假信息,要增强信息辨别素养和学术鉴赏素养,才能日益扩充数据库中的数据。

参考文献:

[1] 李明志,锁志海,赵大良.学术期刊审稿专家数据库的开发及其使用 [J].编辑学报,2004(4):274-275.

[2] 王宁宁.图书馆QQ群咨询服务研究 [J].现代情报,2009,29(1):174-177.

[3] 庞富祥,李彦民.学术论文评审专家数据库的建设 [J].科技与出版,2000(3):42-43.

[4] 杨勇.拓展稿源是高校学报学术强刊的关键 [J].编辑学报,2009,21(3):245-246.

[6] 梁爱香,梁永忠.Excel报纸数据库的创建及应用 [J].大学图书情报学刊,2004(4):36-37+62.

作者简介:谢文亮(1979.10—),男,汉族,广东潮州人,编辑,副编审,硕士研究生,主要研究方向:数字出版;郑添尹(1982.08—),女,汉族,广东湛江人,学士学位,硕士研究生,研究方向:网络与新媒体传播。

猜你喜欢

学术期刊数据挖掘数据库
推动学术期刊繁荣发展
新创办的学术期刊发展探讨
数据挖掘综述
数据库
软件工程领域中的异常数据挖掘算法
基于R的医学大数据挖掘系统研究
数据库
数据库
数据库
总局首次开展学术期刊资质审核认定