APP下载

企业档案信息资源开发模式研究

2018-11-07吴元伟

卷宗 2018年25期
关键词:信息提取

吴元伟

摘 要:随着信息化的不断深入和信息技术的发展,企业信息资源利用已经从文件转向数据,而企业文档部门关注的重点也从档案的原始凭证作用转移到如何快速简明地为用户提供便捷的服务。越来越多的行业将信息化手段融入了工作过程,档案管理人员不仅要利用好这部分资源以提升文档工作的效率,更要从传统档案管理模式向电子化信息化方向转变。

关键词:档案开发;表层加工;信息提取;体系加工

1 企业档案信息资源开发的模式

1.1 表层加工

表层加工即对文件的标题、作者单位、渠道、编码、版本等表层信息进行收集整理。

现在大型企业一般都配套有专门的文档管理系统或档案管理软件,大多数企业对于档案管理仍停留在被动接收这种层次,还属于“来料加工”的初级阶段,通过文档管理系统著录模块提取并录入文件和档案的表层基础信息进行加工。这种表层加工模式对档案信息资源的开发和利用处于浅层次,先期投入小,能适应几乎所有类型的文件归档工作,但也要求文档人员掌握一定的专业词汇,具备识别和归纳能力,部分前移到文件产生部门进行著录的,还会增加业务人员的工作量,所提取的信息少,不足以支撑结构化的专业化的信息资源,不易与专业化的搜索引擎匹配,即使通过OCR识别、全文检索等技术手段提高查全率,也很难提高查准率,需要用户花费较长的时间掌握文件结构和分类知识。

1.2 信息提取加工

信息提取加工一般包括两种情形,一是使文件编制过程中产生的数据直接进入文档管理系统,二是通过信息系统接口或其他工具提取数据表、数据库中的文件信息。

第一种情况典型的例子就是OA系统,在公文办理过程中,文件的标题、文号、关键词、签发部门、流转人等信息都是文件编制过程中需要编者录入或被系统记录的,当公文流转完毕后,其基本信息以及电子文件就被文档系统存储下来,稍作加工就可以作为档案保管了。第二种情况一般是在生产业务系统中。通过接口程序建立系统间的数据通道,使数据能够不经人工录入进入文档管理系统。以上两种方式可以极大地减少归档环节中的信息著录工作,同时可以将文档控制环节前移,规范数据录入的标准。后一种方式需要与各个业务系统建立数据接口,投入较大,而且文档系统只是从业务系统获取数据,没有电子签名、封装等环节,文件的真实性有效性得不到保障。

1.3 体系加工

体系加工是将企业的整个业务系统数据当做一个整体,根据业务特性进行组织、封装、清洗和传输。这种方式的最显著特点是将信息资源开发和管理的对象从文件转移到数据上来。

整个体系分为数据源、总线系统、文档管理系统、信息资源利用系统四个部分,这四个部分在某些单位可能是结合在一起的,例如文档管理系统和信息资源利用系统,为便于理解,在此我们分别论述。数据源包括了业务信息系统以及用户整理制作的数据表、小型独立数据库以及文件服务器等。

总线系统又称ESB(Enterprise Service Bus),分为数据总线和服务总线,服务总线为其他系统提供标准服务以供调用,而数据总线则可以提供基于内容的路由和过滤,具备了复杂数据的传输能力,可以提供一系列的标准接口。

狭义的文档管理系统只提供著录、移交、接收、入库和电子文件存储、索引等功能,功能强大的文档系统延伸到了文件编制、归档监督、分发、任务中心、卫星库、数字档案馆以及文档利用、信息资源集成和知识管理等方面。

信息资源利用系统往往与文档系统集成在一起,对于企业来说,最直接最集中的信息资源就是各类的文档数据和电子文件。有别于传统意义上的文档系统,信息资源利用平台是直接面向所有用户的,往往包含信息门户、档案宣传、业务指南、用户互动以及一些专题的档案资源等。

在这种模式中,难点在于对数据源的归类处理和保障文件传输过程中的真实性、合法性。

不同的数据源对于同一个概念有不同的表达,例如标题就有Name、FileName、Title等几种数据名称,需要将这些情况统一或合并起来。另外,设备维修过程的数据和财务管理的数据结构也不一样,需要分开处理。

数据很容易提取和复制,这就对档案的原始性提出了考验。电子签名虽然已经有了相应的法规并且在一些行业得到了应用,但在很多企业特别是中小企业仍然存在成本高、实施不便等困难,当前很多企业都实施双套制,电子文件在形成以后再打印成为纸质文件,这样也增加了成本,在文件归档环节也迟迟不能享受到信息化电子化所带来的红利。

在比较成熟的大型企业,可以通过数据总线来收集和处理数据,整个过程辅以电子签名、流程日志、数据审计等功能,将数据封装成为行业和法规认可的形式。以上方式既能解决数据零散不规范的问题,又能实现电子文件在线归档,节约了大量的人力,提高了工作效率,同时也能够形成企業的核心知识体系,为其他各项工作的开展和人员的培养提供一个良好的平台。

2 档案信息资源开发的趋势

2.1 电子档案成为主要对象

最近几年,随着国家大力推进“工业化、信息化”两化融合以及“互联网+”的发展战略,越来越多的企业实现了工作过程和经营管理的信息化。2017年,我国重点行业关键工序数控化率就达到了46.4%。数据来源:国家互联网信息办公室发布的《数字中国建设发展报告(2017年)》。未来几年,我国还将持续在物联网、云计算和大数据、移动互联网等方面发力,势必会带动一大批行业转型升级。随之而来的就是大量生产和经营活动所产生的纸质档案记录转化为了电子记录。相比于传统纸质档案,电子档案具有信息完整、传递方便、结构立体等特点,可以开发出多种产品和形式供广大用户使用。在很多企业,电子档案已成为档案信息资源开发的主要对象。

2.2 开发形式和成果多样

传统的档案信息资源开发成果如大事记、档案汇编、图文集等在电子档案中依然适用。依托信息技术的发展和电子档案的特性,档案人员可以开发出多种产品形式,主要趋势有:

可视化。企业档案记录中的生产数据、物料信息、进展信息、指标值等非常易于通过数据可视化技术呈现。应用比较广泛的可视化技术有D3、Bonsaijs、Gephi、Arborjs、Springy、HighCharts、Echarts等。

以用户为中心。例如消息、资源的订阅和推送以及基于用户习惯的大数据分析等都是以用户为中心,使用户能够便利地获得所需资源并筛选掉用户不关注不需要的部分。移动应用的发展也让用户从设备界面、计算机等转移到手机、平板等个人移动端上,使用场景更加丰富,对应用平台、网络和信息安全也提出了更高的要求。

中心化。中心化趋势在制造业、物流业、服务业尤为明显,制造业以产品和设备为中心,物流业以货物为中心,服务业以服务对象为中心。档案信息被开发出来后并不独立存在,而是依附在中心数据上为其提供历史趋势分析、行为分析、背景信息等,进而为企业核心业务服务。

3 结语

电子档案在归档时仍会留存很多元数据信息,有时档案本身就是一个数据集合,这种特点比之纸质档案需要人工识别是一种巨大的进步和便利。围绕这些数据和电子文件,企业开发档案信息资源可以根据实际应用场景和成本有多种选择。本文所述的表层加工、信息提取和体系加工三种模式即是根据资源形式和投入规模所做的划分,对于企业来说,往往档案管理的信息化进程与生产和经营过程信息化不同步,档案部门要适应和消化新数据和旧档案。这是一个渐进的过程,三种模式往往混合使用,逐步升级。

猜你喜欢

信息提取
建筑电气设计中BIM技术的应用研究