APP下载

浅谈期刊稿件登记和汇总的智能化实践

2020-07-10李新安

科学与信息化 2020年12期
关键词:汇总参考文献文档

李新安

摘 要 论文初审是现行期刊的初审、外审、终审的“三审制”中重要的环节。而稿件登记和汇总又是初审入口关,在分析稿件登记和汇总目前存在工作量大、容易出错等问题后, 设计了稿件登记智能化流程,采用Python软件设计了代码。在实践中运行成功,保证了准确性,提高了工作效率。

关键词 期刊;稿件登记;编程

引言

期刊的论文撰写和发表是为了交流、传播信息,目的是要同行认可并利用,通过符合标准和规范的编排使读者能顺利地阅读、迅速而方便地了解和利用论文的内容[1]。为此论文的作者和编者都应按照科技期刊的要求,遵循规定的格式,科技论文的基本要素包括:文章题名、作者署名、作者单位、摘要、关键词、引言、正文、结论、参考文献等。但编辑部经常收到的论文缺部分要素,有的论文没有参考文献,有的文章甚至没有作者姓名和作者单位,给编辑部稿件登记和初审带来不便[2-4]。同时为了统计和以后工作的快捷,稿件的登记常采用Excel表格,目前大多数文章是Word文档。编辑部收到的稿件放入一个文件夹,有的期刊一周能收到好多文章,登记文章时,逐步打开Word文档,把题目、作者、单位等复制和粘贴到Excel表格中,工作量大,也容易出错。笔者在某编辑部实习期间,发现采用编程和爬虫技术,可以把收稿文件夹中的Word文档论文的要素提取出来,自动生成到Excel表格中,大大提高效率和准确性,为编辑部的办公智能化提高发挥了一定作用。

1稿件登记智能化流程设计

根据以上采用Visio设计的工作流程如图1所示。

2采用Python编程

具体的编程代码如下:

from win32com import client as wc

import os

from docx import Document

import pandas as pd

def doc_to_docx(dirpath,path):

file = dirpath + ‘\\ + path

word = wc.Dispatch(‘word.Application)

doc = word.Documents.Open(file)

doc.SaveAs(file.replace(‘.doc,.docx), 12)  # 12表示docx格式

doc.Close()

word.Quit()

os.remove(file)

return file.replace(‘.doc,.docx)

def get_data(dirpath):

for root, dirs, files in os.walk(dirpath):

result_list = []

for i in files:

try:

result_dict = {}

text = []

if i.endswith(‘.doc):

file_name = doc_to_docx(dirpath,i)

document = Document(file_name)  # 打开文件demo.docx

for paragraph in document.paragraphs:

c = paragraph.text.replace(‘ ‘,)

if c != ‘:

text.append(c) # 打印各段落内容文本

elif i.endswith(‘.docx):

document = Document(dirpath V ‘\\ + i)  # 打开文件demo.docx

for paragraph in document.paragraphs:

c = paragraph.text.replace(‘ ‘,)

if c != ‘:

text.append(c)

result_dict[‘稿件名称] = text[0]

result_dict[‘作者] = text[1]

result_dict[‘作者单位] = text[2].replace(‘(‘,).replace(‘),)

num = 0

for i in range(len(text)):

if ‘寄刊 in text[i]:

result_dict[‘参考文献数量] = text[i-1].split(‘])[0].replace(‘[‘,)

result_dict[‘手机号码] = text[-1].split(‘:)[1]

result_list.append(result_dict)

except Exception as e:

print(e)

with open(‘err.txt,w) as f:

f.write(i)

pd.DataFrame(result_list).to_excel(‘收稿件登記簿.xls)

print(‘程序结束)

if __name__ == ‘__main__:

dirpath = input(‘请输入存放word文件的绝对路径\n)

# print(dirpath)

get_data(dirpath)

运行后生成的Excel表如图2。

收稿件登记簿生成的是Excel格式,便于用于以后本期刊的统计分析,比如作者单位统计,可以看出那些单位投稿的文章数量多,高校的文章和科研院所文章投稿数量对比,及参考文献数量汇总及平均引文数量统计等等,以此Excel文档为基础,还可以扩展应用到稿酬计算和给作者寄刊汇总的方面,大大节省编辑的录入时间,提高了工作效率。

3结束语

在期刊现行的初审、外审、终审的“三审制”中,初审是控制稿件质量的入口,是把握刊发论文学术质量的第一道防线,而稿件登记是编辑部论文初审环节中重要的一环。针对这个环节,设计稿件登记智能化流程 ,并用Python软件编程,自动生成的Excel文档,便于汇总、统计、分析,提高了编辑部工作效率。

图2  自动生成的Excel表格界面

参考文献

[1] 陈浩元.科技书刊标准化18讲[M]北京:北京师范大学出版社, 1998:101.

[2]张建合.学术期刊编辑初审探微[J].编辑学报,2003,15(1):23-26.

[3] 居自强.科技期刊编辑应做好文稿的初审工作[J].编辑学报,2005, 17(1):58-59.

[4] 沈玲.高校学报编辑初审探微[J].吉林省经济管理干部学院学报,2010,24(6):81-84.

猜你喜欢

汇总参考文献文档
浅谈Matlab与Word文档的应用接口
源流2020年目录汇总
有人一声不吭向你扔了个文档
轻松编辑PDF文档
近两年来国务院及相关部门出台的促进消费政策汇总
2013—2017年市人大常委会执法检查项目汇总
Word文档 高效分合有高招
Study on the physiological function and application of γ—aminobutyric acid and its receptors
交变电流基本知识汇总
The Review of the Studies of Trilingual Education in inghai