应用大数据技术开展电子编研的模式探讨
2023-04-06苏一君
文|苏一君
一、引言
随着社会生产生活和科技的发展进步,数据量开启井喷增长模式,如何在海量数据中查询到所需要的档案信息,抽取和挖掘有用的信息和知识,为企业领导层提供决策依据、为业务部门提供信息支撑、为用户提供针对性服务,才是企业所关注的,才是有大意义的,而应用大数据技术开展编研工作正是实现档案价值实体化的有效途径。
二、利用大数据技术开展档案价值挖掘的工作意义
运用大数据时代为我们提供的先进工具和各种技术手段,对原始档案信息价值进一步挖掘,使得档案工作者可以在面对海量的档案数据时,根据其类别、类型的不同,具体事物进行具体分析,发现数据与数据之间的关系,发掘档案存在的潜在利用价值,再将其按照相关专题进行分类、加工、整理和有序化重组,使一些结构复杂、关联性差的档案更加系统化、条理化,建设各类专题档案编研信息库,开发多种多样的服务方式,尽可能地去满足用户的各类利用需求,从而扩大档案在各个层面上的影响力。
三、利用大数据技术做好档案编研研究的前提条件
(一)养护档案基础数据资源,为使用者提供便利
在利用数据时,或多或少曾遇到过“发现有的数据不够用,有些数据做得不好不好用”的尴尬时刻。这样的情况,当我们开始去运营这些数据后会发现,实际上是因为数据有无数的孤岛,从而导致了数据多元化、冗余、重点不清晰、难统一等一系列影响利用的源头。档案信息资源作为一种原生态的数据资源,具有真实性、权威性等特点,使其比其他数据资源具有更高的利用价值。不过我们要想懂得利用数据,首先要开始懂得“养数据”。养数据是一项最底端、最基础、最辛苦的工作,特别是在前期开展数据清洗、整理的阶段,但是以投资的眼光长期做下去,必将收获满满。养数据具体可分为三个操作:
1.完善档案数据结构
根据企业数据资产目录,将档案数据字段信息补齐,确保数据的准确性、完整性和一致性,特别是已认定对企业有用的档案数据,尽可能的不要留白。
2.设立标准提高质量
有数据没质量是企业数据的通病,原因不外乎主/元数据定义工作以及业务数据清洗转换和分析工作未开展,现场业务数据记录不及时、不准确,这样的危害是巨大的。想要提高档案数据质量这种事情说起来也不难,就一点:重视!从端口入手严防死守。
3.加强数据入库意识
企业很多数据其实是在纸张上或者各管理系统中的,别让这些基础数据躺在外边,一定要将其归档,纳入企业数据库中。做好这件事,必须基于5年一个周期的数据需求来规划布局,并结合企业业务方向来进行思考;同时注重日常的积累,比如每天花半个小时处理关键字段,做日报表,定期出一份数据周报,看趋势,给业务同事反应现象,每月思考一下本阶段的数据,和相关档案基础数据进行对比和思考,往往能看到一些平时注意不到的问题。并且当确认好编研专题的数据范围后,一定要亲自采集所需要的档案信息,亲自进行数据加工处理,这样收集到的数据信息才真正能够转化为供编研者所使用的数据。
开展档案编研工作是为了揭开数据面纱,为用户提供价值参考,为用户工作的开展提供技术基础保障。所以在档案数据的收集环节,就要做好前期调研,有一个明确目的或者目标,这样最后到了数据分析阶段,才能对收集的档案信息“去噪”、“清洗”,显露出本质,呈现我们最终所需要的,然后进行判断,得出高质量和可靠的结果供用户使用、决策。一个企业在养数据的层面上谋划越深越前瞻性,才可能在数据驱动营运,驱动决策的路上越走越顺。
(二)加强学习,整合资源,打造一支高素质的档案编研队伍
大数据时代,数据开放、决策咨询、推送服务、个性化服务将成为档案馆服务的主要内容,这对档案工作者的个人能力提出了较高的要求。要具备高度的洞察力、创新力,有一定的计算机知识储备、学术写作能力和文献编研能力,应对海量档案信息能够加以分析、判断、汇总、归纳,建立相应的数据分析模型,将最终成果以建议、方案、报告、成果等形式呈现出来,将“死档案”变成“活数据”,体现档案信息的价值。
(三)应用大数据技术,变被动服务为主动
大数据技术的应用对档案工作模式带来的冲击是巨大的,传统“你来我查,你需我找”的工作模式,已经无法满足数据信息爆炸下用户的需求。在大数据时代,档案信息资源利用服务工作已经趋向社会化,企业档案工作者必须顺应时代更新服务观念,从传统的“被动等待用户上门,为其提供所要求的档案利用服务”变为“理清企业数据资产,捕捉用户习惯,定制档案利用服务为其主动提供”的工作模式。
想要做好档案编研选题,不仅要对用户利用档案的数据情况进行挖掘,而且还需要对档案用户的关注点和业务开展相关情况进行深度挖掘,得出分析结果,建立特定用户类型的数据模型,根据模型整合档案资源,为其定制个性化档案利用服务。可以按照政工部门关注党建类实物档案的特点,质量部门较为关注试验检验数据档案的特点,针对性的确定编研选题,为其提供个性化服务;也可以结合企业发布的战略规划、年度工作计划、市场开拓某一阶段所关注的重点,选定档案编研题目,从而制作出用户当前所想所需的编研成果,再利用大数据技术,主动及时推送给用户。
四、应用大数据技术开展电子编研的模式探讨
(一)把握企业关注重点,分析用户数据需求
大数据时代想要做好档案编研选题工作,首先要摸清楚用户需要档案来干什么,档案如何能帮助提升用户自身的业务工作。档案馆应把握企业最新发展趋势,有针对性地对档案数据进行深度挖掘和编研,创造符合本企业特色和重点业务方向的研究内容,增强编研成果的内容价值,扩大企业档案数据收集面,增强档案数据库资源的多样化,通过运用大数据技术将档案数据进行提炼、优化,选择在用户恰好需要的节点推出,从而增强用户对企业档案工作的粘度,从初期的主动推送给用户查询利用,到后期受到用户认可,主动要求定期定向提供,充分实现档案价值实体化。
(二)深度挖掘档案价值,利用大数据手段进行分析
数据信息的深度挖掘是大数据时代的主要特点,数据分析是大数据整个处理流程中最核心的部分。对档案用户来说,最关心的不是数据挖掘的深浅,不是数据分析处理过程的难易,而是对大数据分析结果的说明和呈现。对档案工作者来说,若选定建立的数据分析模型不具有代表性和利用价值,若数据分析的结果不能得到精准的展示,那么最终成果将会对档案用户产生困扰,甚至会误导用户。
在对用户需求进行测评后,首先根据需求对企业数据库进行深度资料挖掘,选定紧扣企业主营业务的档案信息建立分析模型,建立个性化数据库,把用户想要的东西、挖掘分析结果放入;然后本着“确保档案数字资源格式统一、规范、长期可读、便于共享”的原则制定收集标准,统一的录入规范,设定关键字段,避免了入库信息的杂乱无章,同时对利用率高的档案全文数字化;最后利用大数据手段实现数据分类、相关性分析、数据融合,明确不同档案数据之间的关系,得出不同档案利用形式的变化趋势,使用户可以在海量数据中快速定位到所需信息,帮助其对自身工作把控、了解,分析和预测未来趋向,进而有针对性地做出规划,从而提高档案服务质量,提升档案的使用效率与利用价值。
(三)创新档案利用形式,形成自身编研特色
结合企业实际,配合用户中心工作收集各类型档案,建立档案数据分析模型,加强信息归集共享,用信息化手段推送给用户查询利用,辅助科学决策。
五、结语
大数据是把双刃剑,让我们正确应用大数据技术手段,编研出更多高质量的档案成果,为管理层提供决策信息、为技术层提供科研支撑,进而扩大档案工作影响力,为档案事业的进一步发展做出贡献。