大数据思维下体育传统项目数据档案系统的建设
2017-01-28张宏磊李正燕
文 / 张宏磊 李正燕
大数据思维下体育传统项目数据档案系统的建设
文 / 张宏磊 李正燕
文章在总结大数据内涵及特点的基础上,研究了大数据思维对建设体育传统项目数据档案系统的作用。结果表明,体育传统项目数据档案符合大数据的特征。在建设档案系统时,只有以构建大档案体系、大资源体系和大服务体系为指导,才能有效应对档案管理面临的挑战,提升档案的利用价值。
大数据;体育传统项目;大档案
近年来,随着信息技术的飞速发展,大数据时代已悄然来临。面对海量的数据资源,大数据可以通过其独特的方法进行挖掘和分析进而获得高质量的信息服务,给各行各业带来非常显著的影响。[1]体育传统项目数据档案是指体育传统项目,如篮球、足球等,在日常训练、比赛、科研等过程中形成的具有保存价值的各类数据文件。它们按一定的原则进行分类归档。处于大数据时代,如何提高体育传统项目数据档案的管理效率成为当务之急。本文在分析大数据内涵及特点的基础上,对如何借鉴大数据思维来实现体育传统项目数据档案的信息化建设进行研究,以期为体育传统项目数据档案系统的高效建设提供借鉴。
一、大数据的内涵及特点
近年来,随着移动互联网技术的飞速发展及智能终端等信息体的建设和普及,网络数据资源数量剧增。同时,云计算等数据处理能力的飞速发展使数据资源的属性愈加明确,价值得以充分呈现。科学技术的不断发展,便利了人们对各类数据进行快速、准确的利用。大数据应运而生,给人们生活、工作和思维带来了一次革命。[2]
(一)大数据的内涵
大数据是继云计算、物联网之后信息技术产业的又一次技术变革。目前,关于大数据的定义学界尚未形成统一意见。麦肯锡认为,大数据是指区别于传统数据的数据集合,采用传统的数据库软件工具无法在一定时间内对其内容进行采集、存储、管理和分析。著名信息学专家涂子沛认为,大数据中的“大”不仅仅局限于存储容量大,其更大的价值在于可以对海量数据进行快速、高效处理,可以从其中发现新的理论,创造新的价值,从而带来“大利润”、“大科技”、“大知识”和“大发展”。由此可见,大数据主要是指处理技术。它的意义不仅仅在于对复杂、庞大数据信息的掌握,更重要的是对数据的高效加工,通过数据加工实现信息增值。
(二)大数据特征
学界对于大数据的特征具有高度统一的认识,即大数据具有4“V”特征。首先,具有庞大的数据体量(Volume)。当前,各行业数据量剧增,数据来源和承载方式多样,采用传统的数据库软件无法对其内容进行高效管理。而大数据是一个数据体量特别庞大的数据集,已从TB级跃升为PB级,可以对数量庞大的数据进行高效管理和处理。其次,数据类型繁多(Variety)。随着传感器、社交软件、视频软件、音频软件等的出现,数据类型愈发多样和复杂。除了传统的以文本为主的结构化数据外,各种视频、音频、图片、地理位置、E-mail、博客等非结构化数据也越来越多,这对数据处理能力提出了越来越高的要求。再次,数据资源价值密度低(Value)。数据量的激增使得海量数据中有用数据比例下降显著,这给我们获取有用信息增加了难度,也对数据处理技术提出了更高要求。如何快速、准确获取有价值的信息成为亟待解决的难题。最后,数据处理高速(Velocity)。大数据可利用高性能的设备对数据进行运算,可以通过网络实时收集与处理,满足不同客户需求。[3]
二、体育传统项目数据档案的特征分析
近年来,体育传统项目不断引进先进的训练和比赛设备,数据量日益增加,数据类型愈加丰富,网络技术、计算机技术等在数据分析、处理中得到了广泛应用,使得体育传统项目数据档案呈现出大数据的基本特征。
(一)体育传统项目数据档案体量巨大
体育传统项目数据档案体量呈爆炸性激增,主要有两方面的原因。首先,数据档案的快速生产。伴随着传统体育项目参与人数的增加和诸多科学仪器的使用,数据类型更加丰富和细化,每天均有大量的数据信息产生,例如,训练中会产生训练数据、图像、音频等。其次,原有纸质体育传统项目数据档案的电子化。为了更好地保存体育传统项目数据一手档案,提升服务成效,纸质档案数字化成为必然趋势,大量的纸质档案通过扫描等技术手段形成数字档案。
(二)体育传统项目数据档案种类繁多
体育传统项目数据类型丰富多样。首先,体育传统项目种类繁多,不同类型项目数据档案有很大差异,如篮球、足球等球类项目,竞走、长跑等田径类项目等。其次,体育传统项目数据形式丰富多样,出现了文本信息等结构化数据、E-mail等半结构化数据及视频、音频、图片等非结构化数据。
(三)体育传统项目数据档案价值密度低
从体育传统项目数据档案的使用角度来看,其价值密度高低与数据总量呈反比,即随着数据档案总量的提升,其价值密度降低。体育传统项目数据档案中大量的结构化、半结构化、非结构化的数据资源,极大地增加了提取有使用价值的数据资源的难度。
(四)传统项目数据档案处理速度要求高
体育传统项目数据档案每天都有大量的数据资源不断生成,短时间形成大量的数据资源。面对大数据的传统体育档案,用户提出了更高的利用服务要求,即准确、迅速地在海量资源中找到所需的数据信息。
三、大数据时代体育传统项目数据档案面临的挑战
传统的档案管理模式主要包括收集、保管和利用三个环节,大数据时代对体育传统项目数据档案的管理模式提出了前所未有的挑战。[4]
(一)大数据对体育传统项目档案数据收集的挑战
在小数据时代,受制于存储成本和信息管理技术,人们往往不能将所有数据进行归档保存,而需要对数据保存价值进行人为鉴定,确定是否归档及保管期限。该种模式在档案收集、保管和利用中发挥了重要的作用。在大数据时代,体育传统项目数据量激增,数据类型丰富多样,传统的人为鉴别模式很难对海量数据进行科学鉴定、保存,若简单沿用必然会导致数据资源的收集不全和分类不合理。
(二)大数据对体育传统项目数据档案保管的挑战
在大数据时代,体育传统项目数据档案保管存在三个方面的挑战。首先,体育传统项目数据档案以纸质载体居多,电子档案资料较少,且通常以光盘为存储介质。大数据条件下,体育传统项目数据激增,动辄以PB、EB来计量,一般的光盘很难满足数据档案存储的要求,需要新的存储介质来替代。其次,体育传统项目数据类型呈现多样化,文本、图像、音频、影像等多种结构化、半结构化、非结构化数据不断生成,且比例逐渐增加,常见的存储介质是以结构化数据来设计的,如何解决半结构化、非结构化数据的存储,方便体育传统项目数据的挖掘和利用,成为档案工作者面临的巨大考验。再次,体育传统项目数据的体量越来越大,类型越来越丰富,数据丢失、损坏、泄露、篡改等时有发生,数据信息安全面临严峻挑战。
(三)大数据对体育传统项目数据档案利用的挑战
大数据时代,用户对体育传统项目数据档案利用需求发生了较大的变化:首先,用户不再仅仅局限于档案管理人员,运动员、教练及其训练团队也成为潜在用户;其次,存储介质多样化,档案不仅局限于纸质载体,电子档案也成为用户方便查询的档案类型;第三,数据内容个性化、多样化,用户不再单纯追求信息量的广泛,更希望从广泛信息中得到直观的、利用价值较高的信息;第四,服务便捷化,数据量的激增和竞争的激烈化,使用户对档案利用提出了高效、快捷的需求;第五,手段自主化,互联网技术的发展促使用户希望突破时空的限制,实时获取各种信息。显然,体育传统项目数据档案的利用服务明显滞后于用户需求:它们以实地查阅、单调被动服务为主,档案数据资源无法利用先进的互联网技术,仅工作时间可以服务,无法实施全天候异地查询等,致使档案利用率低下,不能发挥应有的价值。
四、大数据思维下建设体育传统项目数据档案系统的具体路径
当前,体育传统项目数据档案已呈现大数据特征,在构建档案系统时可充分利用大数据理论和技术来应对各项挑战。
(一)构建大档案体系
“大档案”是指不考虑介质和载体,把与体育传统项目相关的所有原始记录均作为档案记载,做到应收尽收。首先,扩大档案收集范围。大数据技术提供的庞大存储空间,可以突破传统存储容量的限制,与体育传统项目相关的训练比赛数据文档、视频与项目有关的网上信息资源等,不分载体、结构均被收集归档,形成体育传统项目数据档案的大数据集,以存储时间进行排练,永久保存。其次,制定数据收集标准。当前,体育传统项目数据档案受重视程度不高,信息化建设刚刚起步,缺乏统一的规范和引导,大量异构数据的存在导致档案数据整合出现瓶颈,对档案数据的共享产生了严重的阻碍作用。因此,在构建体育传统项目数据档案系统时,应制定统一的电子文件收集、格式交换等方面的管理制度,从而保障档案系统的高效、有序建设,促进异构数据的资源整合,提升数据的价值信息,实现档案大数据的共享。
(二)构建大资源体系
“大资源”是指大档案体系下的数据库中存在大量的异构数据,通过集成、整合形成完整、统一的大数据集资源库,为档案的高效利用奠定基础。这要求集成体育传统项目档案数据。在数据存储时,制定统一标准,采用数据集成方式和分而治之的策略,构建分布式存储模式,将数量巨大、种类繁多的数据有机集成,再通过建立数据存储引擎“连接器”实现各类数据间的整合分析,同时充分做好数据清洗工作,解决数据重复、残缺、错误等问题。这要求加强信息档案安全维护。在大数据时代,确保档案信息的齐全完整、原始真实和机密可用是安全工作的重点。首先,要提高档案人员的安全意识,加强安全教育和宣传培训。其次,要建立人防、物防和技防三位一体的安全防护体系,并制定相应的应激预案;最后,要最大限度地利用网络安全防护技术。硬件方面,必须加强设备的日常维护与保养,为设备的正常运行保驾护航;软件方面,必须聘请专业的网络安全技术人员进行指导,通过多重的网络安全技术,如访问权限设置、档案数据加密、安装预警设备等方法,通过设置访问权限、安装预警装置、加密档案数据、异质异地备份等手段,保障体育传统项目数据档案的安全使用。
(三)构建大服务体系
“大服务”是指从用户的角度出发,实现档案利用的多元化和开放性,主动挖掘潜在使用价值,提供智能化、网络化服务。这要求数据进一步开放化,以扩大服务对象。体育传统项目数据档案对相关部门的领导掌握大局起着决定性作用,对运动员个人的训练和比赛起着重要的指导和参考作用,对教练员制定训练和比赛计划起着重要的借鉴作用,对非专业的学生和社会人员积极参加体育传统项目、提升运动成绩具有较强的指导作用。因此,档案管理系统应积极扩大服务对象,将档案的利用价值发挥到最大限度。这要求积极运用新型的科学技术创新服务方式。在大数据时代,档案馆的主要任务转向海量数据的处理与分析方面,大数据、云计算、数据挖掘技术等先进技术的应用,可以大大提升对海量数据的分析处理效率,可以将看似无关的数据形成一个完整的数据集,从而更好地为用户提供数据挖掘和分析服务。这要求加强服务监控,提升服务质量。用户满意度是评判档案服务质量高低、服务效果优劣的考量指标,因此,全面建立服务质量监管和考核制度非常重要。
综上所述,大数据已经对各行业产生了深刻的影响,为了提升体育传统项目数据档案的利用价值,建立体育传统项目数据档案已刻不容缓。
[1]邬贺铨.大数据思维[J].科学与社会,2014,(1):1-13.
[2]孔乐佳,卢宏伟.大数据思维下的档案资源数据挖掘[J].兰台世界,2016,(17):27-29.
[3]姜亚超.基于大数据思维的档案管理工作研究[J].研究探索,2016,(8):29-31.
[4]乔瑞花.档案管理在大数据背景下面临的挑战及对策分析[J].创新科技,2015,(6):82-84.
G270.7
A
1005-9652(2017)01-0142-03
(责任编辑:虞志坚)
张宏磊(1977-),男,河北饶阳人,衡水学院体育系副教授,研究方向:民族传统体育教学与训练社会体育市场化。
李正燕(1980-),女,河北张家口人,衡水学院体育系讲师,研究方向:健美操教学与训练、民族传统体育教学与训练。