APP下载

Web数据挖掘技术模型分析

2014-03-15林倩瑜

吉林工程技术师范学院学报 2014年2期
关键词:数据挖掘数据库客户

林倩瑜

(集美大学诚毅学院,福建厦门361021)

Web数据挖掘是一项十分复杂且难度比较大的研究工程,这给Web数据挖掘技术发展带来很大难题和挑战,未来为了进一步开发Web数据挖掘技术模型,建立更加系统化和全面化的数据资源库,必将有新技术出现,帮助解决目前面临的挑战和难题,将Web数据挖掘技术推向一个新的里程碑。

一、Web数据挖掘技术

(一)Web数据挖掘

Web数据挖掘研究是数据挖掘技术与互联网应用研究相结合的领域,其挖掘就是指Web从文档结构和使用的集合中发现一种隐含的模式,即将文档中重要的信息资源采集,并且传输到用户端,其主要功能就是一个输入和输出功能,利用计算机编程,将输入的数据资源进行解码分析,然后通过Web服务器端口将数据资源输出,通过互联网连接端口将数据资源传输到命令始发端口。

(二)Web数据挖掘的特点

导构数据库环境,Web上每一个站点都是一个数据库资源,每一个数据源都是一个导构节点,不同的信息资源其节点也不相同,因此,每一个导构节上的信息和组织都不一样,从而能构成一个巨大的导构数据库。其次,分布式数据,在Web网页上分布着世界各地的Web服务器终端,形成分布式数据源,因而其覆盖面广。再者,半结构化,这是Web数据的最大特点,Web数据非常复杂,每一组数据之间都有一套程序编码,没有特定的模型描述,是一种非完全结构化的数据,故称之为半结构化数据。最后,其动态性强、具有多样复杂性,这种特点主要是由于Web数据库自身就是一个十分复杂且庞大的模型,数据库中有文本数据、超文本数据、图表、图像以及音频和视频等多种多样的数据资源。

(三)Web数据挖掘主要类型

目前Web数据挖掘被技术人员分为三类,即Web内容挖掘、Web结构挖掘以及Web使用记录挖掘,其中Web内容挖掘主要是指从大量的Web数据中发现信息,采集重要信息,然后将采集的数据信息资源以网页或者是链接等形式将内容传输出去。一般挖掘的内容有文本挖掘和多媒体挖掘,两者的差别就是提取方式不一样,最终展现形式也不一样。而Web结构挖掘是从Web组织结构、文档结构与其链接关系中挖掘潜在知识和模式。然后系统会对数据模式进行智能化分析。Web使用挖掘就是对数据资源经过输出方式,实现数据资源的共享,并且从Web数据中发现用户访问模式,利用互联网技术为用户提供信息服务。其具体作业流程如图1所示:

图1 Web数据挖掘基本工作流程

(四)研究Web数据挖掘技术的重要性

随着网络技术的不断发展,网络技术的普及和推广,人们生活和工作越来越离不开信息技术,网络技术发展给人们带来的便利显然可见,但是在信息资源和人类社会不断向前发展的同时,网络技术研究工作也应该不断深入,只有不断研究新技术,改造原有技术和模型,最终,才能实现可持续发展。网络技术的应用使得现代企业和社会也越来越信息化和数字化,人们将大量的信息资源储存在计算机和互联网中,而万维网中的数据资源是一个庞大的集中营,没有经过任何处理。人们即使如果想要使用万维网中的数据资源必须要通过Web数据挖掘技术,才能顺利获取自己想要的信息资源,由此可见,研究和开发Web数据挖掘技术能不断满足人们对信息的大量需求,提高万维网中信息资源使用效率,实现最大化的资源共享。

二、Web数据挖掘技术发展面临的挑战和难题

(一)传统数据库结构性能强

传统数据库结构性非常强,数据处于一种完全结构化状态,这种结构性使得数据处于一种不规则变动中,使得Web数据挖掘存在难题就是如何实现信息资源的有效和最大化共享。Web数据挖掘是从大量信息中发现具有新颖性和潜在用处的数据资源,而这种不规则运动使得数据挖掘要从大量的数据中发现隐含的规律性内容,摒弃无效资源,最终解决数据应用质量成为一大难题。

(二)导构数据库环境

Web本身就是一个数据库资源,其信息挖掘最终是实现信息资源的共享和利用,其系统模型中的数据源非常复杂,其数据库中由很多节点组成。要想进一步提高数据资源使用质量和效率,必须要进一步分析每一个节点之间的关系,但是,目前在这方面的研究工作还没有达到相关水平,只有简单的将节点的数据集合起来,然后提供给一个用户一个统一的视图。这种形式必须要解决Web数据查询问题,只有数据资源被有效利用,才能进行数据分析、集成、处理等作业。

三、Web数据挖掘模型在电子商务中的应用研究

电子商务方面的应用模型的主要功能,首先,客户分类和客户聚类,挖掘Web上的客户资源,并且根据客户咨询信息,对客户进行分类分析。并且运用聚类对客户进行分析,分析组中客户的共同特征,让企业能更好地了解客户信息和需求,向客户提供具有针对性的服务。其次,挖掘潜在客户,Web挖掘可以从客户访问信息中,利用分类技术在因特网上找到未来的潜在客户,最后,保留客户访问时间。网络上的商家数量非常之多,企业要想寻求更多的潜在客户,就需要使客户尽量停留在自己的网页上,这样才能为企业挖掘更多的客户,争取更多的利润空间。

Web数据挖掘技术在电子商务方面的应用主要是使用Web挖掘技术的开发功能,能为企业挖掘广阔的客户资源市场,能让商家知道访问者都在网页上干什么,进而企业人员能针对客户需求,提供有针对性的服务。Web数据挖掘技术模型在各行业中的应用主要就是通过理解数据和数据来源、获取相关知识与技术、整合与检查数据,同时,还能除去一些不一致或错误数据,建立模型和假设、实现数据挖掘,对数据进行测试与验证分析,最后解释应用数据资源。数据挖掘的应用涉及大量的准备工作与规划工作,注重数据预处理阶段作业,即数据净化、格式转换、变量整合以及数据表的链接,在挖掘前会做一系列的精确分析,确保最终输出的结果的精准度。精准的数据信息为企业决策提供可靠而准确的依据,提高企业决策的科学化水平。目前,随着互联网和计算机的不断普及,Web数据挖掘技术发展面临着新的挑战,而XML技术在Web数据挖掘技术模型中的应用恰好能解决这个问题,其具体应用分析如下。

四、XML技术在Web数据挖掘技术模型中的应用及未来发展趋势

(一)XML信息技术

XML技术是一种新型的数据挖掘技术,这种技术与传统的Access、Oracle和SQL Server等数据库不同,这种新型的数据库能为Web数据模型提供更强有力的数据储存和分析能力,例如:数据索引、排序、查找、相关一致性等,XML数据技术具有很多优势和特点,它操作十分简单,编码以及程序结构也非常简单,这种技术是一种传输与储存的数据,其重点内容就是数据内容,显示Web数据库中的数据,焦点是数据的外观,这种特殊性能与传统的HTML不同,能提高Web数据库数据资源传输功能,加快信息传播速度。此外XML数据挖掘技术能对标记数据进行组合,要求标记数据必须成对出现,对标记的字母大小也有严格的要求,这种特殊性能要求使得数据信息资源挖掘效率提高,并且能提升整个数据模型中信息储存的智能化,将数据库中的信息资源合理的进行分类和规划,然后利用互联网将信息传输到用户终端。XML在Web数据挖掘技术模型中的应用具有很强的优势,具有积极的推广意义。

(二)应用效果分析

其主要优势和特点就是能将Web数据模型中的资源进行共享与交换,首先这种技术非常简单,XML与Web数据模型中的半结构非常相似,在应用中不会存在很大的冲突,对数据本身进行描述,进而能精确的进行查询和模型抽取。XML能增加结构和语义信息,使得计算机和服务器能及时处理大量的数据资源,并且能对多样化的数据形式进行分析。因此,XML技术在Web数据挖掘模型中的应用能从Web服务器上下载大量的信息,减少网络业务量。其次,具有很强的灵活性,恰好针对Web数据结构性强的特点,形成优势互补。这种灵活性主要表现在XML能把不同来源的结构化数据很容易地结合在一起,进行集合和处理。再者,能提高模型的开放性,现在很多成熟软件都可以用来帮助编写、管理XML文档,如现在使用比较常见的SQL Server,可以直接从数据库中生成XML文件,加快了网络运行速度。最后,能实现跨平台交换,相互补充,XML几乎能被所有平台承认,并且允许用户自行开发,为用户提供一个完全独立的运行程序,实现资源共享,使用DTD来实现组与组或其他群体的数据交换。显而易见,XML技术已经成为正是的规范,技术开发人员能够利用XML格式标记和交换数据,并且还能进行查询,丰富Web数据挖掘技术模型的基本功能,使得Web数据挖掘技术模型能不断满足现代人们对信息的需求,推进Web数据挖掘技术模型向更好地方向发展。

(三)Web数据挖掘技术模型未来研究方向和重点

未来,Web数据挖掘技术研究重点就是进一步开发与XML技术功能互补的相关技术,开发高性能Web数据搜索引擎,完善Web数据的特征描述与监控,实现Web数据的获取与集成的科学化和规范化。这三个方面的研究将成为未来技术开发人员研究的重点,目前,XML技术的研发已经为工作人员指明方向,希望能从查询功能着手,最终研究开发出搜索功能,实加快信息获取和集成的速度,推进Web数据挖掘技术模型发展进入一个历史新的里程碑。综上所述,虽然目前,Web数据挖掘技术研究和发展处于一个瓶颈期,面临着很多挑战和困难,但是在技术人员的努力下,一种新型的XML技术被研发出来,这种技术的研发恰好能解决Web数据挖掘所面临的难题。所以,未来一种基于XML的一种新型数据挖掘技术将被广泛应用在Web数据挖掘模型建造中,这种技术的应用能极大地提高整体Web数据挖掘的整体功能,能为互联网用户提供更多数据内容,丰富数据代表的意义。基于XML技术的Web数据挖掘模型代表着互联网数据挖掘进入一个新的历史里程碑,XML技术的应用也具有积极的作用和意义,值得大面积的推广。

[1]曹步文,陈娟,喻旭东.XML与面向Web的数据挖掘技术[J].微计算机信息,2010,(24).

[2]温华菁,陈红娟.基于XML进行Web数据挖掘浅析[J].商场现代化,2009,(4).

[3]顾红其.Xml在web数据挖掘中的作用与研究[J].科技信息,2008,(27).

[4]牛志玲,曾丽娟.面向Web的数据挖掘面临的挑战[J].科技资讯,2008,(9).

[5]刘江宏,刘金瑄.基于Web的数据挖掘系统模型的探讨[J].科技信息(科学教研),2008,(23).

[6]杨丽芳.基于Web的数据挖掘技术[J].科技信息,2009,(19).

猜你喜欢

数据挖掘数据库客户
探讨人工智能与数据挖掘发展趋势
为什么你总是被客户拒绝?
如何有效跟进客户?
基于并行计算的大数据挖掘在电网中的应用
数据库
数据库
数据库
做个不打扰客户的保镖
数据库
一种基于Hadoop的大数据挖掘云服务及应用