APP下载

网络数据挖掘方法及技术分析

2016-11-14吴华芹柳静

电脑知识与技术 2016年24期

吴华芹 柳静

摘要:网络数据挖掘旨在从网络数据源中提取隐含的知识,借助传统的数据挖掘方法很难实现。网络数据挖掘注重事物之间的属性及联系,通过无数个体数据的分析和特殊算法的使用,实现模型的可视化和连接趋势。网络数据挖掘方法是传统数据挖掘方法的补充,可以很好地解决复杂的自然属性组成的问题。该文提出了社交网络数据挖掘的方法与技术,提出了相关数据分析及模型设计。

关键词:网络数据挖掘;Harr特征;AdaBoost分类

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)24-0013-02

随着信息技术的迅猛发展,人类社会大步迈入了网络时代,网络数据挖掘已成为数据挖掘中的一个重要研究课题。网络数据挖掘注重事物之间的属性及联系,通过无数个体数据的分析和特殊算法的使用,实现模型的可视化和连接趋势。运用网络数据挖掘可以很好地解决复杂的自然属性组成的问题。

1 数据挖掘技术

1.1概念

数据挖掘就是借助程序管理对海量数据进行分析归纳汇总。其挖掘程序依次为应用界面层、应用服务层和数据库层。三层结构紧密联系,互相配合完成数据挖掘任务。用户要进行数据挖掘,需要应用界面层的请求响应,请求信息反映到应用服务层后,得到允许才可以进入数据库访问,提取相关数据并进行分析。数据挖掘可以有效地对数据进行整理与分析,使之规范化与合理化,方便汇总与管理,提高了相关数据的安全性与有序性,提高了管理效率与管理水平。

1.2传统数据挖掘

1.3网络数据挖掘

网络数据挖掘是个新生事物,笼统地讲析太过抽象,所以我们就以社交网站为例来探析下网络数据挖掘。微博诞生也不过数年光景,就以之为例。微博是大家熟知的社交网站,通过社交网站的数据挖掘的管理流程,就可窥一斑而见全豹,对整个网络数据挖掘的方法与技术就都可以融会贯通了。我们可以举个例子,譬如应用面向对象的系统分析方法与设计等等。

2 网络数据挖掘方法

2.1构建数据仓库数据挖掘体系

网络技术的快速发展,对网络数据进行海选分析及综合提供了便利。以社交网站为例,如果要进行相关信息的数据挖掘,实现高质量与高效率,就要通过对海量数据的处理与整合,使用数据仓库技术及数据挖掘技术是个不错的选择。为最大限度节约时间及减少运行成本,构建数据仓库数据挖掘体系是至关重要的。一般体系结构如下图所示(图2)。构建了数据仓库体系,可以高效对数据进行管理与汇总,对相关数据进行关联分析,最后得出自己需要的信息。

2.2 网络数据挖掘分析

2.2.1 图像内容的信息挖掘

网络用户很多喜欢上传分享一些照片、视频等图像内容,对这类信息如何进行挖掘呢?人们一般运用积分图加速Harr特征来进行信息提取。

Harr特征一般分为边缘特征、斜线特征、中心特征和对角线特征四个类别。将这些特征融合在一起就可以形成新的特征模板。新的特征模板内都有白色与黑色区域,其特征值为白色像素减去黑色像素的差。

3 小结

网络数据挖掘是个技术性很强的全新课题,需要在实际电脑操作中进行不断学习与实践。本文只是简单介绍了一些常用的方法与技术,由于篇幅有限,对具体操作也只是做了简单介绍,希望能为广大朋友牵线搭桥,抛砖引玉,为今后在实际运用中做个指导。

参考文献:

[1] 林秀琴.一种改进的Snort系统模型[J].电脑知识与技术,2011(13).

[2] 付雄.基于分布式智能代理的反网络洗钱技术研究[J].计算机工程与科学,2011(7).

[3] 孙燕花,李杰,李建.基于CURE算法的网络用户行为分析[J].计算机技术与发展,2011(9).

[4] 刘梦超,肖基毅,陈荣,等.数据挖掘在用户上网行为分析中的应用研究[J].电脑知识与技术,2012(31).