基于大数据《烟草科技》期刊学术影响力分析
2020-06-06茹呈杰周雅宁董志坚洪广峰
高 琳,茹呈杰,周雅宁,董志坚,洪广峰,曹 娟,李 阳
中国烟草总公司郑州烟草研究院,郑州高新技术产业开发区枫杨街2 号 450001
当今社会,知识对人类社会发展与进步的作用日益突出,科技期刊作为刊载各学科研究成果和动态的载体,担负着发布学术成果、繁荣学术思想、推动科学技术发展和社会进步的职责。近年来,随着信息技术的发展,大数据的重要性越来越被广泛认可,成为科技界、企业界甚至各国政府关注的热点,通过处理、分析海量数据可以提高洞察力、决策力以及优化创新能力等。庞大的数据流还能够提供新线索、新思路,大数据已成为新技术、新发明和新理论的重要源泉[1]。同样,大数据也给科技期刊的发展带来了新的机遇和挑战,探讨大数据时代下科技期刊在出版形式、出版流程以及经营策略等方面所面临的变革已成为热点[2-5]。夏登武[6]和颜廷梅等[7]探讨了网络大数据在科技期刊内容优化和选题策划中的应用;张凯[8]和孙丰成等[9]研究了如何利用大数据分析来提高科技期刊的影响力。研究发现,被引频次(被引量)是评价期刊或论文的学术质量、衡量其学术影响力的重要指标之一,我国主要的学术期刊评价体系,如中文核心期刊、中国科技核心期刊、CSCD 核心期刊等,均采用了这一评价指标[10-11]。高被引频次意味着期刊或论文总体的学术影响力较高,通过分析期刊的高被引论文可以预测学科研究方向、确定核心作者群,从而有针对性地开展选题和组稿。
《烟草科技》期刊创办于1957 年,主要刊登烟草工业、农业基础学科及应用技术等方面的学术论文[12],现为中文核心期刊、CSCD 核心库统计源期刊、中国科技核心期刊,并先后被CA、INSPEC、Elsevier Scopus 等国外数据库收录,特别是2013 年进入EI 数据库,期刊学术影响力得到大幅提升[13]。但是近年来,期刊也面临着来稿数量下降、优质稿源流失、评价指标提升乏力等问题。
CNKI(中国知网)《知识资源总库》包括了《中国学术期刊网络出版总库》(其中收录8 000 多种学术期刊)、《中国博士学位论文全文数据库》、《中国优秀硕士学位论文全文数据库》、《中国重要会议论文全文数据库》、《中国重要报纸全文数据库》和《中国学术辑刊全文数据库》等多种数据库,其中存储了海量的引文数据[14]。因此,基于CNKI 的大数据,采用文献计量学方法统计分析《烟草科技》刊登的被引频次较高的论文,以期了解和把握烟草学科的研究热点和发展方向、发现优质作者和高产机构,为提高《烟草科技》的学术水平和影响力提供参考。
1 数据与方法
以CNKI《知识资源总库》为统计数据源,采用文献来源为“烟草科技”的检索方式,按照被引频次排序,检出《烟草科技》期刊自创刊以来所发表论文中被引频次最高的前50 篇论文,这些论文的发表时间为1988—2009 年。通常论文发表的时间越长,其被引用的概率越高,发表时间较早的论文反映了期刊和论文的长期影响力。
另一方面,有研究发现大多数论文的被引频次在其发表的2~3 年内会达到一个高峰[15-16],因此,为了解近年来《烟草科技》的学术影响力和烟草行业的研究热点,又采用逐年检索的方式,检出了从2012 到2016 年每年《烟草科技》所刊登论文中被引频次最高的前20 篇论文,共100 篇。
两种检索方式所检出论文的被引数据统计截止日期为2019 年1 月25 日。
采用文献计量学方法,应用Excel、词频云图等软件从关键词、被引频次、主要研究内容、基金论文比、作者和机构等方面对检出论文进行了统计分析。
2 结果与分析
2.1 关键词分析
论文的关键词是在分析论文主要内容的基础上,提炼、归纳出能代表论文主要内容的规范词或短语。关键词能准确反映论文的主要研究领域。因此,分析高被引论文的关键词可以了解同期烟草学科的主要研究内容和关注热点。图1 是150篇高被引论文的关键词词频云图,其中的关键词均出现了两次以上,出现频次越多的关键词其字号越大、越醒目。
图1 高被引论文关键词词频云图Fig.1 Keyword cloud of highly cited papers
由图1 可见,出现频率最高的关键词是“烤烟”,达到了44 次;其次是“烟叶”、“烟草”、“化学成分”和“卷烟”,均在15 次以上;“焦油”、“烟碱”、“有害成分”、“产量”、“烟气”等均在5 次以上。说明长期以来,烤烟生产技术、烟叶与烟气化学成分分析、卷烟降焦减害等一直是烟草学科的重点研究领域。
2.2 高被引论文被引频次分析
由于论文的被引频次与其发表时间高度相关,为更加科学合理地比较论文的学术影响力,在进行被引频次分析时把检出的150 篇论文分为两组分别进行对比分析。第一组为被引频次最高的前50 篇论文;第二组为2012 到2016 年间发表的100 篇高被引论文。分别从篇均被引频次、年均被引频次和篇均年均被引频次等方面对两组论文进行分析。
2.2.1 前50 篇高被引论文分析
前50 篇高被引论文的发表年份及被引频次见图2,这些论文发表时间的跨度为1988—2009,其中1989—1992 和2008 年所发表的论文在按照被引频次排序时未能进入前50,这5 年的高被引论文篇数和被引频次均为0。从1999 年到2005 年期间,每年均有不少于3 篇的高被引论文,高被引论文的数量和合计被引频次也在2001 年达到了峰值,分别为1 277 次和7 篇。表明1999—2005 年间《烟草科技》所刊登论文的学术影响力明显提高,期刊的学术水平显著上升。
图2 前50 篇高被引论文的发表年份与被引频次Fig.2 Publication years and citation frequencies of top 50 highly cited papers
50 篇高被引论文的总被引频次为8 321 次,篇均被引频次为166.42 次。其中有10 篇的被引频次超过了200 次,见表1。由表1 可知,“烤烟碳氮代谢几个问题的探讨”的发表时间最早(1998 年),被引频次最高,达到了403 次。发表年限最短的是“卷烟烟气危害性指数研究”一文,自2009 年发表以来总计被引用312 次,其年均被引频次最高,为34.67 次。
2.2.2 2012—2016 年高被引论文分析
从2012 到2016 年,5 年间《烟草科技》共刊登论文1 050 篇,其中100 篇(每年各20 篇)高被引论文的总被引频次为1 782 次,篇均被引频次为17.82次。为多角度分析论文的影响力,分年度计算了这些高被引论文的篇均被引频次和篇均年均被引频次,结果见表2。由表2 可见,各年度的单篇被引频次(除2015 年的单篇最高被引频次外)、合计被引频次和篇均被引频次均随着发表年限的增加而提高。而篇均年均被引频次由于避免了发表年限对被引频次的影响,所以其变化趋势不同于其他几组数据。单从篇均年均被引频次来看,2015年发表的高被引论文的学术影响力最高,其次是2016 年。
表1 被引频次排名前10 的高被引论文详细信息Tab.1 Details on top 10 highly cited papers
表2 2012—2016 年高被引论文被引频次统计Tab.2 Citation frequencies of highly cited papers from 2012 to 2016 (次)
2.3 高被引论文主要研究内容分析
检出的150 篇高被引论文分别来自不同的栏目,为准确把握烟草学科的新兴研究热点,按照学科领域进一步分析了高被引论文的主要研究内容,以了解《烟草科技》的自身定位,合理布局各栏目的发稿比例。
2.3.1 高被引烟草农学论文分析
烟草种植是烟草行业持续稳定发展的重要基础,因此烟草农学是烟草学科的重点研究领域之一。在150 篇高被引论文中,共有68 篇来自“烟草农学”栏目,约占45.33%;68 篇论文的总被引频次达到5 305 次,篇均被引频次为78.01 次。
在68 篇烟草农学高被引论文中,研究内容涉及烟草栽培的论文数量最多,达到54 篇,占高被引农学论文总数的79.41%,表明烟草栽培类论文对期刊影响因子和总被引频次的贡献最大。其次是有害生物防治5 篇、烟草分子生物学3 篇、烟叶调制3 篇、烟叶分级2 篇,分别占7.35%、4.41%、4.41%、2.94%。在54 篇烟草栽培类论文中,田间管理、栽培生理学原理、种植与育苗的高被引论文较多,分别为25、17 和8 篇,占高被引烟草栽培论文总数的46.30%、31.48%和14.81%。
在10 篇被引频次大于200 次的论文(表1)中,有4 篇是烟草农学类论文。由史宏志等撰写的“烤烟碳氮代谢几个问题的探讨”被引频次最高,该文阐述了碳氮代谢在烟叶生长发育过程中的变化及其与氮代谢之间的关系等,并提出了可以对代谢过程进行有效调节的关键位点及主要调节途径。第一作者分别为邵丽和唐莉娜的论文研究了利用光照、降雨等生态条件以及施肥、打顶、移栽等栽培措施提高烟叶品质、降低烟碱含量。蔡宪杰等在“烤烟外观质量指标量化分析初探”一文中运用相关分析、聚类分析和主成分分析对外观质量指标进行了研究,初步验证了烟叶外观质量量化指标的合理性。
共有30 篇总被引频次大于100 次的烟草农学论文,其中烟草栽培类论文有24 篇,占80.00%,说明烟草栽培类的高被引论文不仅数量多而且被引频次也高,进一步反映了烟草栽培是烟草农学的研究热点,其学术影响力大、受关注度高。近年来,分子生物学是全球生命科学研究领域的热点。在68 篇烟草农学高被引论文中,虽然烟草分子生物学只有3 篇,但其具有成为高被引论文主力军的潜力。
2.3.2 烟草化学高被引论文分析
烟草化学也是烟草学科的重点研究领域之一,烟叶和烟用辅料的化学成分极大地影响着烟草制品的品质,同时吸烟与健康的相关性研究也与烟草及烟气的化学成分密不可分。150 篇高被引论文中有54 篇来自“烟草化学”栏目,占36.00%。54 篇论文的总被引频次为2 383 次,篇均被引频次为44.13 次。
在10 篇被引频次大于200 次的论文(表1)中,有3 篇来自“烟草化学”栏目。发表于2009 年的“卷烟烟气危害性指数研究”[17]一文被引频次达到了312 次,其中22 次被引来自《外文题录数据库》、240 次来自《中国学术期刊网络出版总库》、43 次来自《中国优秀硕士学位论文全文数据库》、7 次来自《中国博士学位论文全文数据库》。在该文中,谢剑平等为评价卷烟产品的危害性,研究建立了一种新的卷烟烟气危害性评价方法,明确了烟气有害成分与毒理学指标的函数关系,筛选出最具代表性的7 种卷烟烟气有害成分,并首次提出了一种新的卷烟烟气危害性评价指标——H 指数。目前,该指标在烟草制品危害性评价中被广泛采用。
周正红等的“烟草中化学成分对卷烟色香味品质的影响及其研究进展”一文的被引频次为258次。该文论述了烟叶中碳水化合物、含氮化合物、有机酸、酚类化合物等类别的化学成分对卷烟烟气的吸味、香气、刺激性等感官指标的影响。
胡建军等的“烟叶主要化学指标与其感官质量的灰色关联分析”一文的被引频次为244 次。该文采用灰色关联分析法研究了不同产地烟叶中的蛋白质、总氮、烟碱、总糖、糖碱比等化学指标与香气质、香气量、杂气、刺激性、余味等感官质量指标之间的相关性。
依据《中国图书资料分类法》中的“TS4 烟草工业,TS264.3 烟用香精、香料和R99 毒物学(毒理学)”类目对烟草化学高被引论文进行分类,见表3。其中,TS4 烟草工业主要涉及“基础科学”、“烟草加工工艺及制品”、“产品标准、检验”等几大类;“基础科学”可细分为烟草化学、烟草物理学、烟草生物化学、烟草微生物学、吸烟与健康等,而“烟草化学”又进一步细分为烟草化学成分分析和烟气化学成分分析[18]。
表3“烟草化学”栏目高被引论文专业分类①Tab.3 Classification of highly cited papers in“Tobacco Chemistry”Column
由表3 可见,烟草化学高被引论文中,有43 篇的研究内容为烟草和烟气化学成分分析,约占79.6%;烟气和烟草化学成分分析类论文分别占总数的42.6%和38.9%。其次是吸烟与健康类论文,占总数的24.1%。说明烟叶和烟气化学成分分析以及吸烟与健康问题是烟草化学方向的热点研究领域[18],这些领域论文的学术影响力大、读者关注度较高。
2.3.3 高被引烟草应用技术论文分析
“烟草工艺”、“设备与仪器”和“信息技术”3 个栏目主要刊登以面向行业需求、解决实际问题的侧重于应用技术为主的烟草相关学科论文,150 篇高被引论文中共有28 篇应用技术论文。
在10 篇被引频次大于200 次的论文(见表1)中,有2 篇来自“烟草工艺”栏目,1 篇来自“设备与仪器”栏目。28 篇应用技术论文中被引频次最高的论文是由烟草行业的首位中国工程院院士朱尊权先生所撰写的“烟叶的可用性与卷烟的安全性”一文,自2000 年发表以来,被引频次达到了343次,其中179 次被引来自《中国学术期刊网络出版总库》、140 次来自《中国优秀硕士学位论文全文数据库》、19 次来自《中国博士学位论文全文数据库》、5 次来自《中国重要会议论文全文数据库》。朱院士在该文中提出以烟叶的可用性代替烟叶品质来评价烟叶的价值更符合烟叶收购商和烟草制品生产商的要求,介绍了烟叶可用性的内涵,并分析了几十年间国际烟叶和我国烟叶可用性的变化,同时指出降低卷烟烟气焦油释放量、从而降低吸烟对健康的危害将是烟草行业的长期目标,烟叶生产应根据这一目标适时地调整、提高烟叶的可用性[19]。
从主要研究内容来看,28 篇高被引论文中有4篇涉及到烤烟的感官质量,分别采用不同方法研究了烤烟感官质量与其理化指标、香味成分、外观质量等的相关性。有4 篇以再造烟叶为研究对象,分别论述了碳酸钙、木浆添加量对造纸法再造烟叶片基的影响,比较了不同再造烟叶的物理指标和纤维质量,介绍了国内外造纸法再造烟叶工艺与品质的差异;另有两篇涉及再造烟叶的主要原料——烟梗、烟叶碎片和烟末的化学成分和纤维形态。还有两篇涉及中式卷烟加工工艺及其感官评价方法,两篇涉及叶丝加料效果的影响因素,其他论文涉及的研究内容还包括烤烟各等级烟叶质量指数、烤烟质量风格特色感官评价方法、不同香型烤烟烟叶香韵、自然醇化和外观质量对烤烟化学成分的影响、梗丝形态对细支卷烟品质的影响、烟叶含水率对其力学特性的影响等。
此外有3 篇论文的内容涉及烟草设备与仪器,分别探讨了烟叶烘烤设备的研究进展以及自动识别技术在烟叶分类和条烟分拣中的应用;另有两篇则涉及信息技术在烟草行业营销中的应用。
2.4 高被引论文中的基金论文比例
基金论文比是指基金论文占全部可被引论文的比例。高基金论文比说明某研究领域的新颖性强及学术水平较高,科技期刊对基金论文的吸引力在一定程度上反映了期刊在该研究领域的学术价值和影响力。同时,基金资助也是快速筛选高质量学术论文的有效方式之一。
《烟草科技》150 篇高被引论文中的基金论文比例较高,达到了72%。共有108 篇为各种基金项目资助的论文,其中由一项基金资助的有71 篇,由两项基金资助的有28 篇,由三项基金资助的有9 篇;无基金资助的论文有42 篇。这些论文所占的比例见图3。
图3 高被引论文中基金论文的比例Fig.3 Proportion of funded papers in highly cited papers
108 篇基金论文中共涉及到154 项不同级别的基金项目,见表4。由表4 可见,基金论文以省部级和市厅级为主,这两类基金论文的数量分别有74 篇(48.1%)和60 篇(38.9%),而且其中80%以上属于烟草行业的科研项目。国家自然科学基金资助的论文只有8 篇,数量有待提高。
表4 基金项目级别和比例Tab.4 Levels and proportions of funded projects
2.5 高被引论文第一作者及其机构分布
论文作者是期刊的核心,是期刊赖以生存的基础,作者的学术水平决定了期刊的学术水平,并直接影响着读者的下载和引用。抓住核心作者,提高作者的水平与层次是期刊发展的关键。
高被引论文中有5 篇论文的第一作者是湖南农业大学农学院的邓小华,有3 篇的第一作者是中国烟草总公司郑州烟草研究院的薛超群,还有11 位第一作者发表了两篇高被引论文。此外,另有40 位第一作者虽然都只有一篇高被引论文,但其被引频次均在100 次以上。按照第一作者机构统计,表5列出了贡献两篇及以上高被引论文的机构。
表5 两篇以上高被引论文第一作者机构Tab.5 First authors’affiliations contributed more than two highly cited papers
由表5 可见,这些高被引论文主要来源于科研机构和高等院校,发文量最多的机构是中国烟草总公司郑州烟草研究院,共有35 篇,占23.3%。其次是河南农业大学和湖南农业大学,论文数量分别达到了13 篇(8.7%)和10 篇(6.7%)。虽然科研院所和高等学校是《烟草科技》高被引论文的主要第一机构,但来自中烟工业公司即卷烟生产企业的高被引论文数量也占了很大比例(22 篇,14.7%)。其中湖南中烟有5 篇,上海烟草集团和安徽中烟各有4 篇。这些机构均为优质稿源和优秀作者的分布地。
通过分析高被引论文的基金论文比、作者和机构可以发现学术水平高、来稿数量多的核心作者和核心机构,挖掘出“双高”作者和机构,即篇均被引频次和投稿数量均较高的作者和机构。
3 小结与建议
(1)研究发现,在今后相当长的时期内为不同的烟草制品培育适宜的烟草品种、优化烟叶生产技术、进一步提高烟叶生产和卷烟加工的自动化、智能化水平以及持续降焦减害仍将是我国烟草行业的长期目标,而且现阶段与未来相当长的时期内中式卷烟仍将是我国烟草制品消费的主要形式。此外,随着广大消费者对吸烟与健康问题的关注,该领域的研究必将日益受到重视。因此,期刊编辑部应加强与上述领域学术带头人、科研团队和重点实验室的联系,及时跟踪重点科研项目的进展,做好组稿、约稿工作。
(2)通过分析2012—2016 年间高被引论文的研究内容,可以发现每年读者关注的重点均不相同,说明烟草行业的研究热点每年均有所变化。期刊可以从分析每年受关注论文的选题差异入手,挖掘新颖的热点选题,有针对性地开展组稿。
(3)学科分析对于明确期刊定位具有重要意义。烟草学科的研究内容涉及到多个领域,例如农学、化学、机械设备、制造工艺、检测仪器、物流、信息技术等。研究结果表明,《烟草科技》被引频次、基金论文数量排名前3 的学科为农学、化学、工艺与设备,以上学科可视为期刊的优势学科,应加大这些学科的发稿数量。
(4)期刊编辑部应加强与“双高”作者和机构的沟通和联系,通过设立“优秀论文奖”等形式,强化作者粘性,开展定期调研、关注同类期刊的高被引作者,主动约稿,扩大作者范围。此外,还可以借助施引机构、发文机构、下载和浏览机构的分析,锁定核心机构和核心读者,有针对性地进行宣传和推介,将优秀读者变为作者,不断提高作者水平与稿件质量。
为了期刊的长期发展,在关注烟草行业科研项目的同时,也应放宽眼界,走出主办单位,密切关注与烟草研究领域相关的国家级、省部级科研项目的研究进展。同时,还应扩大宣传,促进作者群多元化发展,吸引行业内外其他单位的参与和关注,不断提高期刊的学术影响力,使期刊长期保持健康、稳定发展。