APP下载

关于计算机信息管理技术的探讨

2013-06-04王明

科技致富向导 2013年9期
关键词:探讨计算机

王明

【摘 要】随着科学技术的飞速发展,我们赢来了信息化时代,各类数据越来越丰富。如何准确地记录和传递信息,是全面、正确地利用信息,产生社会价值的重要前提。而数据挖掘技术的出现及其飞速发展,为我们组织管理海量信息,挖掘其中的价值提供了可行的路径。数据挖掘技术在计算机信息管理技术中的具体应用广泛,有进一步研究的价值。

【关键词】计算机;信息管理技术;探讨

人类的发展伴随着信息的传递,从原始社会的结绳记事到封建社会的烽火传书,信息的管理和传播贯穿人类文明进程。随着科学技术的飞速发展,我们赢来了信息化时代,信息与物质和能源共同构成了现代社会的三大支柱资源[1]。随着计算机的普及、网络技术的发展和数据库技术的成熟,人们利用信息技术生产和搜集数据的能力大幅度提高,大量的数据库被用于商业管理、政府办公、科学研究和工程开发等行业[2]。各类数据越来越丰富。如何准确地记录和传递信息,是全面、正确地利用信息,产生社会价值的重要前提。而数据挖掘技术的出现及其飞速发展,为我们组织管理海量信息,挖掘其中的价值提供了可行的路径[3]。

1.数据挖掘概念及现状

数据挖掘是一门研究从数据中寻找有价值信息的新兴学科,是从大量、有缺失的随机模糊数据中提取用户感兴趣的信息的一种应用技术。从决策科学的角度来讲,数据挖掘就是在已知的集合数据集合中建立模型以支持决策的过程。数据挖掘的过程就是从大量的数据源的集合C中发现隐含的模型P。将C定义为输入,将P定义为输出,数据挖掘就是一个从输入到输出的条件映射C=>P。挖掘的信息不仅是数据库中的数据,还可以是任何形式组织成的集合数据。既可以是结构化的标准数据,也可以是非结构化的网络资源。通过挖掘这些数据,能够进一步了解信息内在的意义。数据挖掘技术是当前计算机信息管理技术研究的热点。

数据挖掘所采用的方法多种多样,既有定量分析方法,也有定量判断的技术。其应用范围广泛,可以被用于信息的管理、组织等。它是一门前沿学科,涉及数学、计算机、人工智能等多个新兴领域。目前该领域的常用技术有人工神经网络、决策树、遗传算法、最近邻技术、规则归纳、可视化等[4]。

2.数据挖掘在计算机信息管理领域的应用

人们对信息的利用要求已经不只满足一般的信息检索和简单获取。而且还要求组织机构中的信息管理服务部门能对内容进行深入分析,从收集到的大量数据中挖掘出隐藏的、内在的、有用的知识或信息,发现数据间的想关性。为生产生活活动提供更深层次的信息服务。下面以档案管理为例介绍数据挖掘技术的具体应用。

20世纪80年代以来,计算机技术的飞速发展为信息管理提供一种全新的技术手段,使机构以前的档案作为一种信息在信息时代展露头脚。在近20年的计算机管理过程中,各个档案部门积累了大量的数字化信息,既有目录索引、原文文献,又有利用记录、查询统计等方面的信息。目前,估计存于档案数据库中的条目多达10亿条,约有1PB的数据。而相信随着后期数字化档案馆建设工作的展开,数字化的档案信息数量将飞速增长,而现有的计算机信息管理系统只能对这些信息进行简单的检索和数据统计常规分析,远远不能满足实际工作需要,使得存储于数据中的信息不能被充分利用,造成了资源的极大浪费。目前来说,数据挖掘技术存在的应用方向有以下几类:

2.1信息资源的优化建设

通过对数据库系统的查询、运行、检索请求进行挖掘分析,统计数据查询、利用情况,为进一步有针对性地补充和丰富高价值的信息资源提供决策支持。同时对用户的使用情况进行关联分析,发现各类数据库间的关联规则,优化信息管理系统的建设和布局。

通过对用户利用数据库的模式进行深入挖掘,了解用户的兴趣动态,并结合具体科研情况及现有馆藏信息,及时发现信息资源的缺漏,满足用户的需要。

通过网页内容的进一步挖掘,可以对互联网上大量的文档集合的内容进行提取、分类、群聚和关联性分析,从而从大量的互联网资源中抽取潜在的有用信息,通过对网站结构和相互关系的挖掘,找到相关专业及研究方向的权威页面,进一步方便用户的信息资源的获取。

实现信息的自动化处理。针对档案馆主要为文本数据的特点,利用文本挖掘技术实现对文本内容的自动摘要、分类。其基本思想是应用统计算法,提取与主题密切相关的语句,挖掘该文档的类别,自动生成摘要信息和主题词,以供查询[5]。

降低数字化成本。例如,系统对单位人事档案进行数据挖掘分析,发现在每一卷几十份的人事档案中用户利用数量最多的是其中的“简历”等少数几份文件。针对这个结果,在安排扫描数字化工作时,可以设计为只扫描每一卷中部分档案,可以大大减轻扫描人员的工作量,而且节省了设备开销。

预测档案之间关联关系。系统通过对用户的使用情况进行挖掘,发现用户在使用“请示”类和“报告”类文件时,50%以上还利用了“批复”类文件。针对这一现状,在提供档案利用时,当用户提出利用“请示”和“报告”文件时,我们可以主动提供“批复”类文件。取得了良好的利用效果,受到用户称赞。

2.2数据挖掘在信息服务中的应用

可以借助数据挖掘技术以完善信息结构,提升服务质量,拓展服务范围。具体包括:

提高信息的获取速度。为保证用户迅速获取所需信息,可以先搜集用户历年使用的专题集合(浏览模式)作为一个事件库,记录所有用户的浏览历史事件库,对其如下操作:

利用挖掘算法进行关联性分析,找出访问频率异常突出的专题(项目)集,利用分类算法匹配用户浏览模式和项目集,将具有相似浏览模式的用户迁移集中至一个服务器上,以降低服务器负荷和传输页面数量。

针对事件库中访问频率超过给定阈值的专题,利用关联分析建立专题间的关联规则,构件索引,当用户浏览某页时,根据设定的规则预先连接其关联页,以提高响应速度。

提供个性化信息服务。可以前瞻性的为用户提供主动响应,以发掘培养用户的使用。根据用户的兴趣提供个性化服务。具体包括:当发现新数据时,及时告知用户;当用户访问时,自动推介相关专题信息。应用兴趣模式算法判断并开发潜在用户,并转化为新用户。

3.结论

总之,数据挖掘技术的引入,提升了计算机信息管理海量资源的能力和水平,使得数据管理层次进一步深入,更好地满足人们的需要,具有巨大的经济和社会效益。但同时应当注意,数据挖掘是目前新兴的智能信息处理技术,目前的发展还暴露出许多的难题和不足,尤其是在web2.0的网络环境下,用户自己组织产生了大量的数据,此时,如何利用数据挖掘技术作为基本的数据分析模块,高度集成计算机信息管理系统、数据库系统和互联网资源,管理、挖掘和分析信息,是我们面临的机遇和挑战,有待进一步研究和探索。

【参考文献】

[1]丁永生.计算机信息管理技术研究[J].黑龙江科技信息,2011(31):93.

[2]王伟,谭媛媛.计算机信息管理技术初探[J].今日科苑,2010(12):137.

[3]田大翠,李海全,田素奇.计算机信息管理技术研究[J].才智,2011(20):72.

[4]李朝葵,凌云.数据挖掘及其在图书馆中的应用[J].情报杂志,2002(06):33-34.

[5]金梅.浅析基于数据挖掘的图书馆虚拟参考咨询服务[J].河南科技,2013(03):5.

猜你喜欢

探讨计算机
中国计算机报202007、08合刊
中国计算机报2019年48、49期合刊
中国古代的“计算机”
环境科学专业《环境生态学》课程教学改革探讨
刍议小学足球教学的训练教学方法
体育旅游产业的特征及发展策略探讨
税收筹划的效应问题
随“声”随意 欧凡OA-G10 2.4G无线耳机
一体式,趋便携雅兰仕AL-225
计算机:看我72变等3则