APP下载

数据挖掘技术在工业遗产档案资源整合中的应用

2016-03-16

文化学刊 2016年10期
关键词:遗产档案馆数据挖掘

杨 杰

(朝阳县住房和城乡规划建设局,辽宁 朝阳 122000)



【文化遗产】

数据挖掘技术在工业遗产档案资源整合中的应用

杨 杰

(朝阳县住房和城乡规划建设局,辽宁 朝阳 122000)

工业遗产档案资源分布较为分散,在用户进行查询与利用时,找到全部相关联的档案资料首先需要奔波于多个存档部门,这一过程持续时间长,耗费精力,得到一份有价值的资料也是需要经过几分周折的,所以,构建一个系统统一的工业遗产档案数据库,为利用者在短时间内迅速地查询到有价值的结果尤为必要。

数据挖掘技术;工业遗产档案;资源整合

随着计算机及网络技术的迅猛发展,各个领域已被深深地标注上了信息化的符号,不断膨胀的信息量让人们应接不暇。那么如何采用科技的技术手段,将档案资源中庞大的数据进行处理并提取出可供利用的规则和知识呢,数据挖掘技术不失为最佳选择。

一、数据挖掘技术及其应用

数据挖掘即是从海量的数据中提取需要的知识和数据。学术界给出的定义为:“从大量的、有噪声、不完全的、模糊的、随机的数据库中,提取隐含在其中的、人们预先不知道的、但又是潜在有用的信息和知识的过程”[1]。

此项技术手段已被应用于多个领域,且成果的实际的应用价值很高,对社会生产生活产生的影响很大。例如,零售业中沃尔玛的购物篮分析;公安部门的“金盾工程”;医案处方分析的大承气汤经方等等,另外,在银行业也经常运用这项技术,分析银行客户、研究需求,用以提高银行业的服务水平。

数据挖掘技术在数字档案建设方面也有相关应用。有学者“利用数据挖掘技术将档案与利用者之间、档案与各种实践活动之间以及档案之间的关系揭示出来,从而在更深层次上发挥这些档案数据的信息作用,从数据清洗方法、数据挖掘算法、数据仓库的建立等方面论述了如何将数据挖掘技术与档案工作相结合的具体思路,并提出了一个数据挖掘系统的设计思想”[2]。广州市城建档案馆通过数据挖掘技术实现了规划管理业务档案按项目分专业的关联,利用者检索到的规划管理档案可以是成套的、整合的、统一的,而对于决策者来说也是掌握了更全面更有价值的档案信息[3]。

二、工业遗产档案资源界定

工业遗产档案即是为每件工业遗产建立的档案。工业遗产,是指1840年中国近代工业产生以来,具有历史、科技、艺术、社会价值的近现代工业文化遗存,包括物质遗产和非物质遗产[4]。工业遗产档案涵盖:(1)申报单位收录的关于该工业遗产的所有档案及资料。即不可移动旧址,建筑遗存物;涉及企业历史记录的实体纸质档案,有工业企业正常运转时产生的文书档案、科技档案以及专门档案;包括生产工艺流程、手工技能、原料配方、商号、经营管理、企业文化等的非物质的东西。(2)申报过程中形成的档案。相关企业的申报材料,包括文字资料、声像资料等。如填制的《工业遗产资源调查表》《工业遗产价值评价指标体系》等表格,包括对物质、非物质遗产的描述、绘图等。(3)可确定公布为工业遗产后相关的利用与保护资料。对工业遗产按照“谁使用、谁负责、谁保护、谁受益”的管理原则,采取措施将其管理和保护的东西建档。专项规划存档,可移动实物可由档案馆等文物收藏单位予以征集收藏、陈列展示。

工业遗产档案兼具凭证价值、文化价值以及现实价值,所记录的信息对于人类了解工业文明的发展、工业文化等具有无法替代的作用。这类资源主要分布在综合档案馆、城建档案馆以及企业内部档案馆室,另外,史志办、文化遗产中心以及经济与信息化委员会等也会保存有相关资料。

三、资源整合的模型构建

构建工业遗产档案资源整合模型的目的就是要及时地解决用户的查询困难,避免获取资源的拖沓繁复问题,及时解决利用者的利用需求,需要对数据挖掘流程进行科学化处理。对于海量的数据资源来说,有一个灵活、高效的网络环境是十分重要的,科学地分析数据可以有效地解决用户与资源间的矛盾。科学合理的处理流程可以提高利用效率。效率一直是档案工作所追求的,注重征求群众意见建议,不断改进工作方法,完善窗口运行机制。数据挖掘的处理需要进行认真梳理,在研究分析的基础上和在法律法规框架内,对相关程序和流程做进一步地精简和优化,提高工作效率。科学合理的处理流程,还可以有效地节约时间,避免用户的周折,做到迅速查询,减少不必要的麻烦。

用数据挖掘技术构建档案资源的整合模式,需要注意以下几点:

1.开发环境。利用SQL Server数据库进行开发。SQL Server可以对数据进行查询,实现搜索功能,并且同步于各类工作,作出报告并完善分析数据。多用于中小型企业数据库的构建。同理可应于工业遗产档案资源数据库的构建。

2.模型构建。模型构建具体的方案图如下所示:

综合档案馆+城建档案馆+企业档案室+史志办+文化遗产中心+经济与信息化委员会→数据仓库→模式评估→可视化用户界面

3.数据预处理。对于原始数据的处理是进行科学挖掘的前提,处理的过程会花费大量的时间成本,而且经过很多过程。数据预处理的方法有数据清理、数据集成、数据变换、数据归约等,它们是将不完整、不一致的数据进行技术处理,以提高数据挖掘的质量和效率。

工业遗产档案是记录老工业区发展变迁的历史资料,它们具有着潜在无限的再生价值,通过科学技术手段整合工业遗产档案资源,让工业遗产档案焕发出前所未有的容光,这对于当地工业遗产的文化重建,对于档案资源的综合开发,甚至对于本地区软实力的增强是极具帮助性的。

[1]JiaweiHan, MiehelineKamber.数据挖掘概念与技术[M].范明. 孟小峰等译. 机械工业出版社, 2001.

[2]宇然.数据挖掘技术研究以及在档案计算机管理系统中的应用[D].沈阳工业大学硕士论文,2002.11

[3]郑向阳.数据挖掘技术及其在城建档案信息服务中的应用[J].档案学通讯,2005,(03).

[4]国家文物局.工业遗产保护和利用导则(征求意见稿)[R].办保函(2014)758号.

【责任编辑:周 丹】

G272

A

1673-7725(2016)10-0127-02

2016-09-20

杨杰(1985-),女,辽宁朝阳人,档案馆员,主要从事建设工程档案管理研究。

猜你喜欢

遗产档案馆数据挖掘
探讨人工智能与数据挖掘发展趋势
遗产怎么分
千万遗产
关于县级档案馆馆藏档案开发利用的思考
基于并行计算的大数据挖掘在电网中的应用
全省部分档案馆新馆掠影
一种基于Hadoop的大数据挖掘云服务及应用
when与while档案馆
遗产之谜
遗产