APP下载

基于Excel的高校实验室信息统计数据处理方法研究与实践

2016-11-03计培良林燕芬

中国教育信息化·基础教育 2016年8期
关键词:字段单元格字节

计培良+林燕芬

摘 要:文章依托多年实验室信息统计工作实践,通过分析高校实验室信息统计数据处理手段的现状,总结当前数据统计上报过程中格式转换、规范性等方面的问题,化繁为简,提出了基于Excel的数据处理方法。该方法通用性强、操作简便,能明显提高实验室信息统计工作的效率。

关键词:高校实验室信息统计;Excel

中图分类号:G434 文献标志码:A 文章编号:1673-8454(2016)16-0072-04

高校实验室信息统计工作是教育部统一部署的高校实验室管理的一项基础性工作,对高校实验室建设意义重大。2006年教育部制定的“高等学校实验室信息统计”指标体系,增加了报表数量,丰富了上报信息;构建网络系统简化上报程序,实现了网上报送[1-2]。在新方法新技术为数据报送带来便利的同时,也对各高校的数据报送工作提出了新的要求。工作人员必须结合新形势探索更加高效便捷的方式,设法提高实验室信息统计工作水平。

根据高校实验室信息统计工作的网报要求,目前高校普遍面临的问题主要体现在对基础数据的收集、规范以及格式化上。

一、高校信息化建设是实验室信息统计工作的基础

要求开展实验室信息统计报送工作的单位范围较广,包括全国普通本科高等学校、高职高专院校和独立建制的成人高等学校,内容上涵盖仪器设备、实验项目、人员、实验课程等多个报表,数据量较大。关键问题是,报表之间彼此有关联,内在逻辑关系严密,可以说,实验室信息统计是一项基本涵盖全校实验基础数据、量大面广较为复杂的工作,在基础数据收集和对数据做规范处理等环节都离不开高校的信息化建设。

在基础数据收集环节,重点是要及时准确地收集数据。各高校对此已进行了大量深入的研究,工作人员积极创新,在制度建设、分工协作、人员培训、网络化信息管理系统建设等方面都做了研究和实践,取得了良好的成效。

对数据做规范处理环节,网报系统要求提交适于计算机阅读的纯文本格式,对各字段的位置及长度都做了严格的规定,必须要完全符合报表定义,不能有任何偏差,稍有误差就无法通过统计系统的检测,难以完成上报。对数据格式做如此严格的规定为工作带来了很大的难度。报送文件格式规定为文本格式(.txt),与电子表格(.xls)或word文档(.doc)等形式相比,对于工作人员而言,由于文件阅读性较差,难以手工直接编辑,这也为直观地查错纠错带来了困难。因此,在数据处理阶段,形成满足网报系统要求的数据格式要求是报送成败的关键,须借助专用软件进行处理,这对工作人员的软件应用能力提出了较高的要求。

二、借助专用软件对数据做规范处理的现状

由于各高校信息化建设发展程度不同,对学校数据信息化的能力水平就有差异。整体而言,各高校信息化建设发展存在不平衡现象。

近年来,虽然各高校对实验室建设与管理工作的信息化越来越重视,也已取得了较明显的进展,但各高校实验室建设与管理信息化程度存在较大差异。许多高校已经使用了专门定制的业务管理系统,集成了较强的信息统计功能,但还有不少学校缺乏专门的业务管理系统,一直沿用着传统的手工纸面化管理手段。

当前各高校普遍存在一个现象:在实验室硬件设备管理和实验教学课程管理两方面的信息化水平发展不平衡,即与实验仪器设备相关的资产管理系统得到了较为广泛的开发和应用,而与实验课程和实验项目相关的实验教学管理系统就明显缺乏,至于全校性的实验教学管理信息化平台就更为稀缺。

与此相应,不同高校在实验室信息统计工作中采取的技术手段和方法亦有所不同,整体来说,目前主要有以下五种:

1.定制的重量级校级综合管理平台

这类平台借助数字化校园建设成果,消除了信息孤岛,切实提高信息化管理水平,是比较理想的。但市场上成熟通用的产品较少,专门针对高校实际情况定制开发,投入较大、开发周期长,且必须依托全校信息化建设程度进行推进,实施难度较大,因此应用这种管理平台的高校数量较少。

2.定制的轻量级专用软件

这类软件只能初步实现对基础数据的收集、整理和统计,后期还需要投入人力进行数据间的匹配与核对,这样的半信息化操作模式对改善学校整体信息化管理水平不具有实质性效果。

3.北化软件

北化软件是一款专门针对实验室信息统计设计研发的软件,利用北化软件可以实现与教育部实验室信息统计上报系统的对接,直接完成网报。在统计上报工作新的指标体系正式实施后,北化软件开发组对软件做了相应的调整,修改加强了数据输出和自动调整的功能,以适应新的指标体系。其资产管理软件具有日常管理功能,其他部分则侧重数据收集与统计。

4. Excel

使用传统的办公自动化软件Excel来维护业务数据,然后通过上报系统提供的单机版检测系统等各类软件将数据格式进行转换,从而生成符合上报要求的数据。虽然该方法在操作上费时、费力、易出错,显得较为传统和原始,但对工作人员的计算机操作能力要求较低,不受学校整体信息化水平制约,因此,目前还有很多高校依然在使用这种方法对数据收集、处理和规范化,所要求上报的每张报表都可以用此方法。

5.信息化管理平台

有些高校拥有国家级和省级实验教学示范中心,具备良好的信息化管理平台,但往往这些平台彼此之间相对独立,不同的实验室报送的数据格式或许都不同,这些基础数据依然需要通过手工操作进行规范处理,经过整合和转换格式后再统一报送,常见的整合手段往往是利用办公自动化软件Excel。

上述五种方法中,由于普遍高校的整体信息化建设发展程度不足,最后两种方法目前在大多数高校中使用最为普遍。由于Excel是为大部分老师所熟悉且运用较为熟练的办公软件,使用非常广泛,并且也能够完成现阶段的实验室信息统计报送工作,满足工作要求。基于多年的工作实践与经验积累,笔者对如何在Excel中实现数据的规范化和格式化进行了研究,发现通过使用Excel的LEFTB、LEFT、LENB、LEN、Text等文本函数[12]编写出恰当的公式,可以实现在Excel中直接生成符合规范的上报数据,进而直接形成满足要求的报表,结果准确,操作简单,可大大提高工作效率,缓解工作压力。利用Excel进行数据处理及上报流程如图1所示。

三、利用Excel进行数据处理的方法

根据教育部关于实验室数据文件的详细填报要求,通过报表的定义、上报系统的操作要求以及已成功上报的数据文件进行分析后,可以发现符合上报要求的数据文件须满足以下条件:①上传到系统中的数据文件格式为文本文件(.txt);②文件的内容是单行或多行文本,行结构由报表的定义决定,单行的长度是各字段长度的总和;③一行文本对应一条记录。

在记事本中打开“教学科研仪器设备表(基表一)”对应的上报数据文件sj1.txt,显示如图2所示。

需要强调的是,每个字段都有固定的长度,例如基表一中“设备名称”字段的长度要求为30字节,当实际长度不足30字节时,需在后方用空格补足,符合格式规范的txt文件可通过Excel软件生成。

1.维护基础数据

数据维护指的是,严格按照统计报表的填报要求(即“基表说明”),根据报表定义和字段数据类型建立Excel表格并设置其中各单元格的格式,做好基础数据的输入、更新等工作。在进行数据转换之前必须要做好数据维护工作,数据维护是数据转换的前提。在Excel表中维护原始数据如图3所示。

2.转换数据格式

数据转换就是利用Excel公式把不同类型的数据转换成指定长度的文本数据,具体操作方法是,首先编写单个单元格的数据转换公式,然后再把同一行各单元格的转换公式有序地组合起来,从而得到单行数据的转换公式。

(1)单元格转换公式

由于各表中各字段的数据类型和长度(单位:字节)并不完全相同,故不同字段的转换公式亦不尽相同,本文以“基表一”中“仪器名称”字段为例来介绍单元格转换公式。由于按照基表一的填报要求,“仪器名称”字段是长度为30的字符型数据,所以转换结果也必须是长度等于30字节的文本。由于字段“仪器名称”的实际长度不定,且含有中文等双字节字符,故将其转换成长度为30字节的文本需要考虑若干种情况,具体算法如下:

a.若“仪器名称”长度不超过30字节,则保留所有字符,否则

b.若第30、31字节不属于同一字符,则取前30字节,否则取前29字节

c.a或b的结果与30个空格连接(空格在后),然后取前30字节

与此算法相对应的公式为:

式中D2表示“仪器名称”所在的单元格。由于单元格中的数据可能含有非打印字符,因此,可以用CLEAN(D2)替换式中的D2,来过滤非打印字符。

对于“单价”等非字符型数据,可以先将其转换成文本后再转换其长度,例如:通过公式“=Text(630.2,”0.00”)”把数值630.2转换为保留两位小数的数据。

(2)行转换公式

“基表一”共14个字段,将同一行中各单元格的转换公式用“&”运算符连接生成这一行的转换公式。

3.建立转换模板

每个报表都可以建立转换模板。每个模板包含表头、数据区和公式区,“基表一”的转换模板如图4所示。图4中,“O”列从第3个单元格起是公式区,在“O3”单元格中输入行转换公式。

拖拉“O3”单元格的右下角填充手柄,即可完成对每一行数据的转换。

4.转换文件格式

在数据区输入统计数据,利用Excel的公式操作可在“O”列得到各行的转换结果,各行的转换结果如图5所示。

为了满足上报文件的要求,必须将目前的Excel格式转换txt文件。操作很简单,新建一个文本文件并打开,复制“O”列公式区内的转换结果,并粘贴到新建的文本文件中,以“sj1*.txt”为文件名保存该文本文件,“*”为学校代码,该文件即为满足格式要求的数据文件。

5.检测查错及纠错

将得到的txt文件导入“高等学校实验室信息统计检测系统”(单机版),对报送数据进行检测。检测包括单表检测和表间检测,如果单表数据有错、不规范,或者表间数据的逻辑性不一致,则会弹出错误提示,须按照报错内容做相应的修改。尤其对于表间错误,需要特别注意确保表格中相同字段数据的一致性。在数据的规范性上,也要满足填报需求,通过检测系统可以进一步查找错误。

修改错误时,根据报错提示的行号去检查Excel表中对应的行数据,更正后重新生成txt文件后,再导入检测系统中进行检测,如此反复,直到检测系统不再提示有错误为止。最终经过检测无误的txt文件就是满足要求符合规范的数据文件,可以上报。

6.上传报送

上报时,打开网址http://www.stats.edu.cn/,输入学校账号、密码登录后,将经检测无误的txt文件逐个上传,也可将几个txt文件放入文件夹后,生成压缩包zip文件进行上传。上传成功后,系统会自动生成综表。

四、结束语

利用Excel转换数据并生成高校实验室信息统计报表,具有以下几个优点:①对工作人员的专业技术水平要求不高,利用Excel公式一次性编写并成功建立数据转换模板后,以后只需能够熟练应用表格模板即可,无需关心代码编写,操作极其便利,一劳永逸;②工作流程简单,数据可读性强、直观,错误率低,且易查错、纠错;③利用Excel公式,还可方便地将往年成功上报的文本数据还原成Excel表,以便于新学年在此基础上进行数据的更新,进而再生成新一年的新报表。④无需单独开发专用系统软件,成本较低。

这种基于Excel的高校实验室信息统计数据处理方法是多年实际工作的经验总结,极具有操作性,在工作中也成效显著。在全国高校推广和普及此项研究成果,在一定程度上可以缓解由于实验室建设与教学管理等方面的信息化程度不够而带来的实验室信息统计困难的压力,对提高信息统计工作效率、解决实际问题具有实际意义。

参考文献:

[1]教高厅函〔2006〕45号.教育部办公厅关于报送高等学校实验室信息统计数据的通知[Z].

[2]陆敏峰,李晓林,高惠玲,梁军.基于B/S结构的高等学校实验室信息统计系统的设计与实现[J].实验技术与管理,2011,28(11):304-307.

[3]杨群.EXCEL图表、函数、公式一本通[M].北京:清华大学出版社,2013:265-285.

(编辑:鲁利瑞)

猜你喜欢

字段单元格字节
图书馆中文图书编目外包数据质量控制分析
No.8 字节跳动将推出独立出口电商APP
流水账分类统计巧实现
玩转方格
玩转方格
No.10 “字节跳动手机”要来了?
浅谈Excel中常见统计个数函数的用法
简谈MC7字节码
CNMARC304字段和314字段责任附注方式解析
无正题名文献著录方法评述