APP下载

基于图像色彩分类统计的计算机行为分析算法

2015-07-13孙存良杨霏宫文策

电脑知识与技术 2015年13期
关键词:means算法行为分析

孙存良 杨霏 宫文策

摘要:目前领域内针对计算机操作行为的分析,主要通过人工桌面监控、记录按键内容、文件操作记录等方式对计算机行为进行的监控分析。该文则提出一种基于色彩图像聚类分析以及K-means算法对图形进行统计来实现行为分析判断的方法,根据色彩的种类、范围以及深度对计算机操作图像进行分类统计,以此判定出某时间点计算机正在进行的娱乐、工作以及其他操作。

关键词:彩色图像聚类算法;K-means算法;行为分析

中图分类号:TP391 文献标志码:A 文章编号:1009-3044(2015)13-0180-02

随着科学技术的不断发展、计算机应用领域的不断开拓,图像处理方法应运而生,目的是利用计算机设备将图像进行分类处理,用于智能分析图像信息。当今图像处理与识别的应用范围越来越广,但就目前的水平而言,计算机对外部的感知能力还比较薄弱,还需要投入大量人力、物力从事数字图像处理与识别的理论和应用的研究。于是各行各业对于数字图像处理技术的精确化与智能化有着更大的需求。这样的需求尤其体现在航空航天、生物医学工程、工业检测、机器人视觉、公安司法、文化艺术等领域。

而本文针对数字图像处理技术的特性,将其应用在普遍计算机操作行为的分析之中,实现了一种根据计算机操作过程中显现的图像色彩来智能分析其操作行为的创新功能。

1 算法简介

彩色图像的聚类分析以及K-means算法是本课题的关键。本文通过彩色图像聚类分析与K-means算法将图像转化为3类模块,分别为正常图像,渲染图像与灰度图像。对这3类模块同时进行遍历与聚类,计算出其影响行为分析判断的影响色块区间与影响深度区间,基于两类区间相互结合,最终依照阀值界限对原图像进行行为判断,得出操作行为分析结论。

图1为算法结果演示图。

2 算法实现

2.1获取计算机图像

获取当前窗体的大小,创建一个以当前窗体为模板的图象,创建一个位图Bitmap绘图图面,得到窗体的句柄和图像的句柄,复制土块的光栅操作码,调用API函数,实现窗体捕获。释放句柄,保存图像。本例中图像结果如图2。

2.2彩色图像聚类分析

根据行为分析图像·自定义颜色的色系,程序将获取的图像,统一转化为rgb格式,遍历图像的像素点,获取图像中色系种类与比例及色系的位置,统计主要颜色所在色系的权重。根据自定义的色彩模型,分析图像内容。

基于色彩图像的RGB格式,建立三维坐标图,其中R为X轴,G为Y轴,B为Z轴,坐标轴长度均为255,根据近似色的微小差别,将三通道色素划分为14个色系,即14个色彩区块,之后根据色彩区块的冷暖调与鲜明程度,与已有的操作行为图像结果进行匹配统计得出具体阀值。图4为划分的部分色系图。

根据彩色图像将所有像素点规划到14个色彩区块,之后遍历所有像素点将其编入类组,将同一类组的像素点进行渲染形成同一颜色,图3为渲染图。

通过反复试验经验积累,按照冷暖色调与色彩鲜明度提取出色彩区块中该色彩比例对行为分析判断结果造成影响的六类色区。构建一个影响色块区间,存放六类色区中最终对行为分析结果造成影响的像素点。统计这六类色区,当某一色区所占总像素比例超过指定阀值时(本阀值是在反复试验中经过大量已归类行为图片分析计算后归约出来的行为色彩区分界限),保存其色区像素比例致影响色块区间。图5为主色系所占比例。

2.2灰度图像聚类分析

本研究中对于灰度图像的聚类分析主要根据K-means算法进行聚类实现。

本研究所采用的K-Means聚类算法的优点主要集中在:算法快速、简单;对大数据集有较高的效率并且是可伸缩性的;时间复杂度近于线性,而且适合挖掘大规模数据集。

K-Means聚类算法的时间复杂度是O(nkt) ,其中n代表数据集中对象的数量,t代表着算法迭代的次数,k代表着簇的数目。

K-means算法具体流程为:

1)随机选取k个聚类质心点(cluster centroids)为[μ1,μ2,...,μk∈Rn]。

2)重复下面过程直到收敛

对于每一个样例i,计算其应该属于的类

[c(i)=argminj||x(i)-μj||2]

对于每一个类j,重新计算该类的质心

[μj:=i=1m1{c(i)=j}x(i)i=1m1{c(i)=j}]

在 K-means 算法中 K 的选取均有人工指定,而 K 值的选定是非常难以估计的。本文在对大量原始数据实验结果的基础上进行总结,得出当k值选定为5时,对于操作行为分析具有最佳精准度。

在 K-means 算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化。这个初始聚类中心的选择对聚类结果有较大的影响,一旦初始值选择不当,则可能无法得到有效的聚类结果。本研究中初始聚类中心,是根据彩色图像的比例最大的主色系的位置的中心来设定的。

3 算法效果

本文针对目前市面中出现率频繁的娱乐游戏、电影、办公软件、学习软件进行检测,本算法效果有着较强实用性。其中,深色系游戏与电影分析的效果显著,如《英雄联盟》、

《DOTA》、《哈利波特》。而浅色系游戏,在特定场景中分析效果会受到干扰,如《剑网三》当中对图片进行光晕处理后,其影像色彩区间受到波动。对此现象,经过大量的图片测试,对游戏类的图像进行了归纳,这对今后的算法修改提供了很好的数据矫正。

4 结束语

本文立足于图像处理技术的创新与应用,并将图像处理技术与计算机操作行为分析相结合,运用自编彩色图像聚类分析算法对图像色彩进行分类统计,构建影响色彩区间并对区间色彩进行操作行为匹配,划定区间阀值。以及引入K-means算法对图像进行灰度化处理,通过实验数据结果以及经验选择K值以适应行为分析计算,同时构建深度影响区间,对图像色彩深度进行分类,最终结合影响色彩区间划定行为分析界限。实现了智能分析计算机操作行为的创新,摆脱人工监控与识别行为。这对将来自动对计算机图像界面、行为模式分析的监控与统计提供了可观的价值。

参考文献:

[1] Parker J R. 图像处理与计算机视觉算法及应用[M]. 2版. 北京: 清华大学出版社, 2012.

[2] 赵春江. C#数字图像处理算法典型实例[M]. 北京: 人民邮电出版社, 2009.

[3] 谢凤英. 数字图像处理及应用[M]. 北京: 电子工业出版社, 2008.

[4] 费新碑. 网络界面视觉识别系统设计(WVIS)理论研究报告[J]. 科普研究, 2009(5).

[5] 王千, 王成, 冯振元,等. K-means聚类算法研究综述[J]. 电子设计工程, 2012(7).

猜你喜欢

means算法行为分析
基于K?均值与AGNES聚类算法的校园网行为分析系统研究
基于北斗卫星导航的罪犯行为分析方法
物理教师课堂教学板书与媒体呈现行为的分析与策略
SIFT算法在木材纹理分类上的应用
金融经济中的金融套利行为分析及若干研究
公开课与常态课学生学习心理和行为的表现分析
基于K—Means聚类算法入侵检测系统研究
基于Weka的Apriori算法在原油产量预测中的应用
基于HSI颜色空间的小麦粉精度自动识别研究
基于数据抽样的自动k⁃means聚类算法