APP下载

高校毕业论文管理系统的设计与实现研究

2021-12-09

信息记录材料 2021年11期
关键词:查重毕业论文文档

孙 超

(吉林工程技术师范学院 吉林 长春 130052)

1 引言

高校毕业论文是教育工作实践的一部分,学生在完成论文的过程中,问题发现、分析、解决能力也随之得到提升。但是高校毕业论文管理工作比较繁琐,传统管理形式效率不高,还会导致大量资源浪费,学生完成论文全过程监管不到位,有时学生可能在答辩前期突击完成论文,不能保证论文整体质量,所以处在信息化时代下高校毕业论文管理工作也需要向数字化、自动化创新。

2 高校毕业论文管理系统结构

高校研发毕业论文管理系统见图1,系统架构主要有B/S架构、C/S结构两种:C/S架构(Client/Server,客户端-服务器),在客户端上直接安装软件即可,系统直接与服务器对接,发出请求后满足不同的功能要求;B/S架构(Browser/Server,浏览器-服务器),用户利用浏览器便可使用各项功能,浏览器在Web服务器、数据库的交互下为用户提供不同的功能[1]。两种架构对比,其中B/S结构可将客户端各项服务简化,在C/S技术基础上进行改造与优化,但缺陷是服务器端的工作量大,要求服务器必须要保证较高的性能,一般可结合高校毕业论文管理实际情况选择相应的结构进行设计。

图1 系统结构图

3 高校毕业论文系统设计

3.1 设计目标

按照高校毕业论文管理系统应用要求,系统设计从操作系统选择、确定数据结构、设计数据库和开发环境等角度展开,使其可以组建成为完整的结构。此次设计毕业论文管理系统,主要包括提交子系统、重查子系统(图2),站在系统管理人员、导师、学生角度展开功能设计,满足不同人毕业论文管理的需求。

图2 系统流程设计

(1)系统管理人员。管理人员随之登录系统,将高校发布的关于毕业论文的有关通知在系统上公开[2]。此外,如果学生未分配到论文题目,管理人员可以为其分配题目。登录到系统后,管理人员按照需求获取所有学生论文开题报告信息、各系学生论文完成进度与实际情况、题目评价信息,还可实现导师与学生的管理,设置系统用户权限。(2)导师。系统设计中关于导师需求,负责发布学生需要完成的毕业论文题目、学生在系统中提交开题报告的审核、撰写论文期间和学生的及时交流、学生论文查重、论文答辩等。(3)学生。系统设计满足学生的需求,主要表现在参与论文选题、上传开题报告、撰写论文及和导师之间的交流、上传论文、论文查重、提交论文答辩申请等。

3.2 系统设计

3.2.1 提交子系统

提交子系统所有功能模块均以独立的形式存在,管理员功能模块包括发布公告、课题审批、管理教师、管理学生4个模块;教师功能模块有个人信息、课题审批、确认选题学生、中期检查、后期审核5个模块;学生功能模块则有个人信息、课题选择、前期任务、中期任务、后期任务、师生沟通6个模块[3]。设计阶段提前确认选择用户身份,在提示页面输入用户名与密码,便进入到提交子系统主页面,按照个人情况选择相应的功能完成操作。

提交子系统设计模式为3层框架,由表示层、业务逻辑层、数据访问层、实体层组成,设计人员在客户端、数据库的中间位置选择任意位置加入“中间层”[4]。表示层也被称为界面层,可将论文提交数据全部展示,并负责接收用户上传的数据信息;业务逻辑层的功能是处理重要业务、传输数据;数据访问层与数据库对接;实体层包括若干实体类,主要负责传输数据。

3.2.2 查重子系统

查重子系统是由服务器、数据库、用户文档提取与文档信息对比组成,通过服务器可接收到关键数据,并对数据进行判断,数据库储存文档记录。用户文档信息提取技术处理流程包括文档提取、结构表示、章节定位。文档提取严格按照数据库数据文件形式,采用文本提取工具获取相应的文本内容[5]。例如Word文档采用Spire.Doc中Document.Get Text提取,PDF文档的提取工具则为PDF Document。章节定位必须提前确定文档目录,精准得到文档章节的标题,再对其完整性展开校对。文档结构表示涵盖了文档编号、名称与作者等一些比较重要的信息,因为结构表示内容按照重要程度划分为各个等级,文档名称和作者的重要程度较高,所以文档结构表示内容一般会采取加权处理方式。创建“Structure Extraction”类方法,提取文档结构之后在集合中储存,随之划分文档结构信息类别并加权,集合储存的数据格式转换成XML文件,经过计算可得到查重系数[6]。

文档信息对比技术在设计时应注意相似度计算、模板去除法这两点,相似度计算部分,不同文档相似度难免会受到共同性、差异性两项因素干扰,例如共同性大、差异性小,此时相似度会偏高,共同性小、差异性大,此时相似度偏低。建议采用余弦相似度计算表示文档相似性,文档以空间向量的形式表示,对向量夹角余弦值进行测量、计算相似性,如果余弦值是1,代表两个向量存在相同指向,余弦值是0,则代表两个向量指向相反,余弦值是-1,代表向量长度并非是直接影响因素[7]。模板去除法部分,根据模板内容,按照规定格式填写内容,论文正文关联不大的内容,主要有停用词、同义词等。其中停用词指代的是虚词、助词等,加强论文语句表达的流畅性,但是没有实际意义,设计阶段查重系统可直接将其过滤。同义词的出现频率比较高,尽管表示形式有一定区分,但内容大致相同意思,处理时一般会用短词替代长词[8]。

4 高校毕业论文系统实现

毕业论文管理系统的设计结束后,应该及时组织测试,保证各项功能完善,测试阶段找出漏洞,为论文管理工作提供帮助。采用任务内并行处理、任务间并行处理融合的方式,展开层次化并行处理,测试系统性能。并行分布式查重子系统实现阶段的结果一一对比分析,评价指标也设计为任务内并行、任务间并行的形式。随之检测任务间并行实施效率,同时检测4篇论文重复率,最后得到查重报告与综合性评价指标,如论文总文字复制比、去除引用文献复制比等,可以非常详细地得出论文疑似剽窃观点、疑似自我剽窃等信息[9]。此外,该系统编写后端代码,编写程序与调试同步展开,若出现错误系统自动提示。此外,前端代码利用Google Chrome可进行调试,而且支持单步调试。系统实现测试环节,还需展开安全测试,重点是毕业论文管理系统中安装的保护机制,可有效杜绝非法入侵,搭建缺陷记录跟踪库,测试之后验证运行的稳定性[10]。

5 结语

综上所述,高校毕业论文管理系统的设计,将所有上传论文、处理信息等储存在数据库中,结合不同使用者需求设计相应的功能,例如论文查重、发布论文题目、学生上传开题报告等,以免因传统管理模式降低效率。此外,高校利用毕业论文管理系统,也可实现论文有关工作的集成化,在原有管理模式基础上应用信息技术与平台,有利于推动高校管理信息化、数字化。

猜你喜欢

查重毕业论文文档
浅谈Matlab与Word文档的应用接口
有人一声不吭向你扔了个文档
学位论文查重乱象引关注
“本科毕业论文要不要取消”为何长期无解
学术论文该“查”什么?
论文查重别大意
学术论文该“查”什么?
高等院校音乐本科毕业论文教学和写作的问题透视与思考
基于RI码计算的Word复制文档鉴别
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat