APP下载

基于粗糙集的电子商务群体用户访问数据挖掘方法

2021-03-18宋晓姣胡媛媛

宁夏师范学院学报 2021年1期
关键词:粗糙集数据挖掘聚类

宋晓姣,胡媛媛

(合肥职业技术学院 信息工程与传媒学院,安徽 合肥 230000)

随着电子商务应用群体的不断增大,电子商务的群体数据的规模日益庞大,需要对电子商务群体用户访问数据完成优化挖掘处理,根据电子商务群体用户访问数据的特征提取和模糊聚类结果,提高电子商务群体用户访问的准确性和调度能力[1].相关的电子商务群体用户访问数据挖掘方法在实现电子商务的优化升级,提高电子商务的服务能力水平方面具有重要意义[2].电子商务群体用户访问数据挖掘方法研究在电子商务的发展过程中发挥重要作用.

对电子商务群体用户访问数据挖掘是建立在对电子商务群体用户访问数据的特征提取和融合分析基础上,采用联合组网特征分析,实现大数据时代电子商务群体用户访问数据特征提取和统计分析,提高信息化管理和电子商务信息的访问水平[3].传统方法中,对电子商务群体用户访问数据挖掘的方法主要有模糊聚类分析方法、粒子群挖掘方法、基于支持向量机算法的电子商务群体用户访问数据挖掘方法等[4-6],构建电子商务群体用户访问数据的融合聚类分析模型,结合自相关特征提取方法,实现电子商务群体用户访问数据挖掘,其中,采用基于空间分块特征采样的数据挖掘方法,根据用户访问数据的统计特征量实现数据挖掘,该方法在电子商务群体用户访问数据挖掘的统计分析能力不好,融合聚类分析能力不强[7].在基于分组样本检测的多元数据特征重构和挖掘方法中,该方法在大数据挖掘中存在收敛性不好和寻优控制能力不强的问题[8].针对上述问题,本文提出基于粗糙集的电子商务群体用户访问数据挖掘方法.首先构建电子商务群体用户访问数据的信息跟踪融合模型,然后通过空间欠采样的方法实现电子商务群体用户访问数据的优化聚类和信息融合分析,根据信息融合结果实现数据挖掘优化,最后进行仿真测试分析,该方法在提高电子商务群体用户访问和数据挖掘能力方面的优越性能.

1 电子商务群体用户访问数据融合和特征识别

1.1 电子商务群体用户访问数据融合

为了实现基于粗糙集的电子商务群体用户访问数据挖掘,首先构建电子商务群体用户访问数据融合模型,综合考虑类内不平衡参数分布[9],构建电子商务群体用户访问的多元数据融合跟踪识别模型,得到电子商务群体用户访问的模糊决策函数为

μ(n)=β[1-exp(α|e(n)|)],|e(n)|2>K,

(1)

式中,K为电子商务群体用户访问数据库的检测阈值,β为电子商务群体用户访问数据库的关联度水平集,e(n)为电子商务群体用户访问数据融合函数.结合动态寻优方法,进行电子商务群体用户访问数据挖掘过程中相似度特征分析,得到异构环境下电子商务群体用户访问数据的融合均方根误差,结合相空间重构方法,进行电子商务群体用户访问数据特征重组和多维重构,提高电子商务群体用户访问数据的挖掘和特征提取能力.

1.2 电子商务群体用户访问数据的分组样本检测

建立电子商务群体用户访问数据挖掘的量化分析模型,建立稀疏化的电子商务群体用户访问数据分布式融合模型[10],得到电子商务群体用户访问数据挖掘的统计函数为

(2)

式中,φ(xi)为电子商务群体用户访问数据评价的约束指标参量集,α为分布式融合系数,ξi为用户访问数据集.建立电子商务群体用户访问数据挖掘的大数据统计特征分析模型,提取电子商务群体用户访问数据的统计特征量,用ω表示电子商务群体用户访问数据挖掘的有限特征分布项,结合原始训练数据中的多维参数分布,在相邻少数类邻居节点中,得到电子商务群体用户访问数据的模糊粗糙特征集r,粗糙向量集的关联规则分布为

(3)

基于粗糙向量集的关联规则,建立电子商务群体用户访问数据挖掘的模糊决策函数,在xi的k个少数类邻居集中实现信息融合和空间结构重组.

1.3 电子商务群体用户访问数据的特征识别

建立稀疏化的电子商务群体用户访问数据分布式融合模型,将生成的新样本全部加入原始训练数据中,根据特征分布的聚类性实现对电子商务群体用户访问数据的准确挖掘[11],电子商务群体用户访问数据的特征变量φ,使得粗糙集匹配的方法,得到电子商务群体用户访问数据挖掘的寻优问题满足

(4)

在合成样本和其相邻的父代样本点之间,构建电子商务群体用户访问数据的模糊聚类模型,得到电子商务群体用户访问数据的模糊聚类函数.在模糊信息聚类中心,得到电子商务群体用户的推荐量化特征,结合隶属度集合分布,采用最优解向量融合的方法,得到电子商务群体用户访问数据挖掘的算术平均值为

(5)

2 数据挖掘优化

2.1 粗糙集特征提取

通过空间分块聚类分析方法建立电子商务群体用户访问数据的粗糙集匹配特征分布模型,根据电子商务群体用户访问数据挖掘的递归分布[12],得到数据挖掘的量化回归分析的迭代式描述如下

(6)

其中,∂为电子商务群体用户访问数据挖掘的定量递归分析的特征值,S为隶属度和非隶属度的联合估计值,且S≠0,γ为灰色关联度加权系数,构建电子商务群体用户访问数据挖掘的分段样本回归分析模型.

假设m为电子商务群体用户访问数据的关联度,得到电子商务群体用户访问数据的属性分布集为p,对电子商务群体用户访问数据进行信息重组,得到差异度函数为

(7)

式中,ε为电子商务群体用户访问数据采样的统计特征量,η为电子商务群体用户访问数据自相关特征量.构造样本数据的粗糙集特征匹配模型,根据灰色关联系数值得到粗糙集特征提取结果为

(8)

式中,Yi(t)为第t次迭代后的粗糙集特征量,Gi(t+1)为第t+1次迭代后的粗糙集关联量,建立电子商务群体用户访问数据的互信息熵检测模型.

2.2 数据挖掘输出

通过空间分块聚类分析方法建立电子商务群体用户访问数据的粗糙集匹配特征分布模型,得到子电子商务群体用户访问的联合概率密度为

(9)

其中,h为电子商务群体用户访问数据的参考性量化特征匹配函数.联合公式(8)和公式(9)数据挖掘输出过程如下.

首先,根据参考点来评估结果,实现用户访问数据的模糊聚类处理.

其次,结合电子商务群体用户访问的关联密度信息融合,得到电子商务群体用户访问数据化管理的层次化分布函数为

(10)

其中,fn为电子商务群体用户访问数据分布的相关性特征量,由此得到电子商务群体用户访问数据的模糊信息聚类检测统计特征量

(11)

最后,采用空间欠采样的方法实现电子商务群体用户访问数据的优化聚类和信息融合分析,根据信息融合结果实现数挖掘优化[13].

整体流程如图1所示.

图1 电子商务群体用户访问数据挖掘

3 仿真测试分析

为了验证本文方法在实现电子商务群体用户访问数据挖掘中的应用性能,进行仿真测试分析,电子商务群体用户访问数据的测试样本采集的长度为2000,训练数据的近邻数k取值为 0.35,粗糙集特征匹配系数为0.23,样本数据的实例集规模为150,根据上述参数设定,得到电子商务群体用户访问数据分布如图2所示.

图2 电子商务群体用户访问数据分布

以图2的数据为测试集,实现电子商务群体用户访问数据的优化挖掘,得到挖掘结果如图3所示.

图3 电子商务群体用户访问数据挖掘结果

分析图3得知,本文方法对电子商务群体用户访问数据的模糊聚类性较高,峰值输出较为明显,数据挖掘的收敛性测试如图4所示.

图4 数据挖掘的收敛性测试

分析图4得知,本文方法的收敛性较好,测试数据挖掘的精度,得到对比结果见表1,分析表1得知,该方法对电子商务群体用户访问数据挖掘的精度较高.

表1 数据挖掘的精度对比

4 结语

本文提出基于粗糙集的电子商务群体用户访问数据挖掘方法.综合考虑类内不平衡参数分布,构建电子商务群体用户访问的多元数据融合跟踪识别模型,建立稀疏化的电子商务群体用户访问数据分布式融合模型.根据电子商务群体用户访问数据挖掘的递归分布,构造样本数据的粗糙集特征匹配模型,通过空间分块聚类分析方法建立电子商务群体用户访问数据的粗糙集匹配特征分布模型,采用空间欠采样的方法实现电子商务群体用户访问数据的优化聚类挖掘.分析得知,本文方法实现电子商务群体用户访问数据挖掘的精度较高,收敛性和准确性较好.

猜你喜欢

粗糙集数据挖掘聚类
粗糙集与包络分析下舰船运行数据聚类算法
基于隶属函数的模糊覆盖粗糙集新模型
改进支持向量机在特征数据挖掘中的智能应用
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
多粒度犹豫模糊粗糙集*
粗糙集的Mallow’s Cp选择算法*
数种基于SPSS统计工具的聚类算法效率对比
面向WSN的聚类头选举与维护协议的研究综述
改进K均值聚类算法