APP下载

大数据大数据时代

2013-08-21王左利

中国教育网络 2013年1期
关键词:海量结构化价值

文/王左利

非结构化数据的海量增多,为数据的挖掘提供了最好的原料,也给予了充分的挑战。

目前,高校数据库里的内容不仅多,而且结构也发生了极大改变,大量的数据是非结构化数据。据统计,全球结构化数据增长速度约为32%,而非结构化数据增速高达63%。这个趋势在高校亦然。对于传统的结构化的数据,由于已经达到一定数量,以关注其应用为主,而对于正在生长的海量非结构化数据,则要关注怎么收集、用什么方式有效管理。“学校正在掌握着越来越多活的数据,这为我们提供了新的方向——寻找某个规律背后的原因。”相关人士说。

业界人士指出,海量数据的分析将对教育信息化产生深刻的影响和冲击。“高校也要关注大数据技术的研究和应用,智谋未来。”

从沉淀的数据中发现有价值的信息,深入挖掘、综合利用、转化为知识,才是信息系统真正价值的体现,而这方面可拓展的空间几乎是不可限量的。从管理的角度来看,如何充分利用信息系统中的数据,是系统实施之后最重要的工作,也是长期的工作。 “要实现很好的数据分析,需要有两个前提条件:一是足够的数据量;二是数据必须是可用的、真实的,这就需要数据质量的保证。”

但是目前普遍存在的问题是数据质量不高。许多高校的数据分析、利用仍停留在初级水平,数据很难被发掘利用也反映了在系统建设和使用过程中的数据不准确、不精确、不一致等诸多质量问题。

专家表示,要进行数据分析,首先必须有充足的有质量的数据。之所以说现在做数据挖掘的时机是成熟的,是因为高校,尤其是一些大型高校拥有大量的教学、管理、科研等数据,这为从各个层面进行数据分析提供了信息基础。此外,最近几年移动互联网技术、微博等SNS网站的推出,使学校拥有了很多可用的、有价值的海量数据。这也意味着,要进行信息挖掘,必须充分扩展应用,才有可能掌握更多的数据。

总体来看,目前高校对信息数据的挖掘主要集中在几个方面:一、针对网络系统运行所做的数据分析;二、针对教学教务管理所做的支持;三、针对特定学生的分析;四、针对科研所做的数据分析支持。

比如,华东师范大学对校园网站数据进行分析,从而改善用户体验。浙江大学通过对资产的归纳、整理,最终形成权威、全面的资产数据,并基于资产数据提供数据查询和分析服务。这些数据分析的成果已经被真正地应用起来,能够帮助教务处更好地利用教室、实验室等资源。复旦大学则对特定的学生进行数据分析,并且得到一些非常有价值的数据。

对于数据分析的前景,大部分专家认为:前景非常好,但挑战很多。数据分析存在两个方面的关键因素。

首先,业务和技术的紧密结合非常重要。业务需求是所有数据分析的目的,做数据分析要先挖掘出分析什么,拥有了需求,高校才能有针对性地对数据进行分析,把数据深层次的价值挖掘出来,让它们为决策服务。

其次,数据分析对于技术人员的要求很高,要求他们不仅精通技术,也要熟悉校园网业务。

猜你喜欢

海量结构化价值
一种傅里叶域海量数据高速谱聚类方法
促进知识结构化的主题式复习初探
改进的非结构化对等网络动态搜索算法
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
海量快递垃圾正在“围城”——“绿色快递”势在必行
一粒米的价值
“给”的价值
一个图形所蕴含的“海量”巧题
一种海量卫星导航轨迹点地图匹配方法