大数据环境下高校数据分析研究
2018-01-18艾何洁刘欢刘桂香
艾何洁 刘欢 刘桂香
摘 要:近五年来,数据量呈现出爆发式增长,针对大数据的研究也层出不穷。打造“数据中国”已成为“十三五”规划的重要组成。大数据研究已成为衡量国家竞争力的重要标志。
关键词:大数据 环境 高校数据分析
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Variety(多样)、Velocity(高速)、Value(低价值密度)、Veracity(真实性)。[1]
大数据技术的战略意义是对有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。[2]
云计算服务,即云服务,是指可以拿来作为服务提供使用的云计算产品。包括云主机,云空间,云开发,云测试和综合类产品等。
对于云计算的服务类型来说,一般可分为三个层面,分别是:IaaS、PaaS和SaaS。这三个层次组成了云计算技术层面的整体架构,这其中可能包含了一些虚拟化的技术和应用、自动化的部署以及分布式计算等技术,这种技术架构的优势就是可以对外表现出非常优秀的并行计算能力以及大规模的伸缩性和灵活性等特点。
而我们平时所提及到的云服务,则是在云计算的上述技术架构支撑下的对外提供的按需分配、可计量的一种IT服务模式。这种服务模式可以替代用户本地自建的IT服务。
大数据与云计算之间的关系,可以简单理解成,云计算技术是一个容器,大数据是放在这个容器中的水,大数据是要依靠云计算技术来进行存储和计算的。
高校一直是数据生产大户。麦肯锡全球研究中心的数据报告《大数据:创新、竞争和生产力的下一个前沿》中显示,大数据是大小超出常规的数据库工具获取、存储、管理和分析能力的数据集。仅2009年,美国国家教育部某信息系统的数据库就膨胀至269P字节(1个P字节等于10亿个M字节),庞大的信息程度入选当年全美10大数据生产贡献量排名。
在我国,有很多万人以上的高校,对于高校管理层来讲,学生的学籍信息、选课、成绩单、图书借阅情况、科研系统、招生就业情况、上网时间分布、校内论坛交流、微博、微信、互联网登录、一卡通消费、门禁等都会产生大量信息数据;学校教师使用的OA系统、教师基本信息、科研系统、经费报销、薪酬管理、上课课件、视频传输、项目管理等也会产生大量信息数据;实验中心的实验室设备、机房管理,图书馆的图书管理;除此之外,还有教务系统及行政系统的设备管理、办公自动化建设和校园网建设等信息数据。这些高校正在使用的系统经过多年运营,积累了大量的基础原始数据,并且随着业务的不断发展,数据量的增长也是飞速的。如何对已有的原始数据开展深入的分析和应用,在统筹分析的基础上合理运用,加强学校的科学化管理,为学校的发展提供数据支撑。大数据的分析研究,已经成为我国高校面临的一个重要课题和开拓性机遇。
高校中的数据有很高的教学与科研价值,从2012年开始,包括华东师范大学上海财经大学、厦门大学、复旦大学等在内的一批大学开始重视数据的深度分析和应用工作。比如华东师范大学利用预警系统跟踪学生的餐饮消费数据,跟踪分析学生是否有经济困难,是否需要帮助;华东师范大学的智能实验室项目,记录实验室使用的全过程数据,形成动态表格,实现教育经费使用的集约高效。此外,北京航空航天大学、中国科学院、复旦大学等先后成立了十余个专门从事数据科学研究的机构。
一、数据深度分析和应用是辅助高校科学决策的依据
高校的数据进行分析和应用,基于预测的数据分析与应用体系成功的关键在于它们是建立在海量数据的基础之上。此外,随着高校数据分析及应用体系积累的原始数据越来越多,通过跟踪记录分析找到最好的预测模式,可以对高校运转的各领域提供决策支持,具体而言,对高校预测招生生源情况、就业情况,预测在校学生的各种需求情况、教师的科研項目管理、教职工人事信息管理以及学校的将来发展状况等方面都能起到数据支持与趋势研判的前瞻性辅助支持。
二、教学质量评估,需要科学的数据深度分析和应用
教学评估是每个高校的重要工作,也是定期必须要做的工作。我们把数据分析技术引入到教学评估系统中,提高了教学管理的科学性,增强了教学数字化建设的实际应用性。把基于海量数据挖掘的智能算法应用于教学质量评估中,从多媒体课件的使用、教师教学的效果、教师和学生的互动等因素中找出其中的联系,能为各教学单位和教务管理部门提供决策支持信息、反馈信息,促使我们更好地开展教育教学工作,提高教学水平和质量。
三、校园网管理及分析,需要数据深度分析和应用的支撑
当代是信息迅猛发展的年代,舆情研究工作对高校思想政治教育和高校教育教学环境稳定的特殊性和重要性是不言而喻。现在更是随着Web2.0时代的进一步发展,在高校网络管理当中花样百出,如校园网BBS、微博、微信等新媒体的兴起和大范围应用,“圈模式”的交流方式为校园网舆情分析和突发事件网络疏导增添了困难。所以,教育系统网络舆情走势的价值就显现了出来。
基于大数据环境下高校数据的分析和研究,体现了高校管理和高校各种应用面临着机遇与挑战并存的现状。随着“数据中国”的深入发展,高校教学和行政管理的数据化、信息化将成为不可逆转的趋势,挖掘教育教学数据深层次的价值,已经成为学校发展当中,为高层做出决策的重要依据。其次,文中所涉及到的我国高校数据发展的过程具有普遍性,结合本校实际情况,进一步推动信息化进程和尝试深度对大数据进行挖掘,还需要我们进一步的探索,找到更适合的算法。
参考文献
[1]杨瑞仙.大数据研究的文献计量分析[J].情报科学,2015,33(8):152-156.
[2]桑庆兵.大数据在高校的应用与思考[J].南通纺织职业技术学院学报(综合版),2013,13(2):84-87.