高校市场营销中网络数据挖掘技术的应用
2021-05-26陈威
陈 威
(湖南环境生物职业技术学院,湖南 衡阳 421005)
0 引言
高校中的市场营销与其他营销模式相比综合性和应用型更强,当前社会对于市场营销合理手段的迫切需要,使其运作能力和开拓精神逐渐受到人们的重视。这就要求高校市场营销应该将知识复合和能力培养2个方面结合,使其同步发展[1]。随着当前市场竞争越来越激烈激烈,各个高校的市场营销专业都在不断探索全新的营销道路和手段,在传统高校中起决定性作用的是数据库管理系统,随着近几年来高校海量数据的增长,以及高校对数据处理的需求提升,已经无法满足当代高校市场营销的基本需要和发展[2]。因此,当前相关领域研究人员正不断地进行深入研究,寻找1种能够自动分析数据、自动分类数据,并对海量数据进行存储的方法,从这些海量数据中预测其未来的变化,并及时找出可能存在异常的事务。网络数据挖掘技术从出现以来就备受各界研究人员的重视,并逐渐成为1种具备价值意义的工程工具[3]。在对特定的用户进行挖掘的过程中,由于数据量十分庞大,因此采用传统的方式会造成计算压力的增加。而网络数据挖掘技术是1种利用分类、聚类和关联分析等手段对数据进行分析和处理的手段。因此,为了有效提高高校市场营销水平,针对上述传统高校市场营销当中数据库存在的问题,开展高校市场营销中网络数据挖掘技术的应用研究。
1 基于网络数据挖掘技术的高校市场营销设计
1.1 构建高校市场营销数据仓库
为了提升高校市场营销水平,该文在传统高校市场营销的基础上,构建高校市场营销数据仓库,为后续网络数据挖掘技术的应用提供场所。由于传统关系型数据库当中的数据通常已经被抽象化和加工过,因此大部分字段很难被用户所理解[4]。针对这一问题,为了提高数据仓库中数据的利用率,对关系型数据库当中的用户难以理解的字段赋予全新的含义,以此为终端用户和复杂数据库技术应用之间构建桥梁[5]。该文从维、测度和类,3个方面对传统高校市场营销数据库进行优化,从而建立高校市场营销数据仓库。
首先,从维的角度出发,针对传统高校市场营销数据库当中某一字段或几个字段进行提取、处理和组合,再经过过滤的方式,使数据库当中的数据资源能够更加便于被用户观察和分析,其表达式:维=y(字段),其中y为某一过滤或处理函数,利用该表达式可以对已经经过处理的数据库字段进行表达。通过对该字段进行注解或重新定义,能够让用户更加容易理解。同时,根据高校市场营销的需要,可将字段分别注解为年维、季度维等,或按照不同地区注解为国家维、地区维等。
其次,从测度的角度出发,对传统高校市场营销数据库当中的数据进行评价,通过对数据库当中的数字型字段进行过滤和集中处理,方便用户对其进行理解。其表达是为:测度=x(字段),其中x表示为1种针对数字型数据的过滤和聚集处理函数[6]。通过聚集处理函数,还可以完成对传统高校市场营销数据库中各类数据信息的统计,将每条记录的某一相同数字型字段进行统计,以此求解出不同数字型字段的平均数、最大值或最小值等。
最后,从类的角度出发。对传统高校市场营销数据库中的字段进行归类,将表现为相同维或测度的字段汇聚在1个集合当中,可以对维和测度在更大的范围内进行描述。这一划分方式,在实际应用中只具有管理层面上的意义,而并不具有实际用途。
将上述3个方面不同的字段内容,按照其相应的规则进行划分并汇总,完成对高校市场营销数据仓库的构建。
1.2 基于网络数据挖掘技术的的高校市场营销数据文本分类
在完成对高校市场营销数据仓库的构建后,为了实现对高校市场营销数据仓库中各类数据的深度挖掘,该文引入了网络数据挖掘技术,并在编程思想的基础上,引入Apriori算法,实现对无线网络环境中高校市场营销数据仓库海量数据的文本分类[7]。在分类的过程中将高校市场营销数据仓库中的所有字段内容,根据不同需要,划分为训练集和测试集。其中,训练集主要完成对高校市场营销数据仓库每一类别个数的统计,并对每一类别下特征出现的具体概率进行统计。测试集根据训练集当中的具体特征进行计算,将其最大值所属的类别作为最终结果进行分类[8]。在分类过程中,每一类别当中的特征出现概率计算公式如公式(1)所示。
式中:P为高校市场营销数据仓库中每一类别下特征出现的概率;λi为数据仓库当中具有某一特征i下的数据;n为高校市场营销数据仓库中具体特征个数;W为高校市场营销数据仓库黄精当中的海量数据。
在引入网络数据挖掘技术后,实际应用中很难达到对高校市场营销数据仓库中文本分类的要求[9]。因此,为了满足分类要求,在挖掘过程中频发出现某一特征下的数据时,为了避免出现某一类公用词汇频繁出现,引入tf-idf算法,对高校市场营销数据仓库中某1个数据的权重进行分配,其计算公式如公式(2)所示。
式中:w为高校市场营销数据仓库中某一数据的权重值;为数据仓库当中具有某一特征i下的数据;N为该数据频繁出现具体次数;d为tf-idf计算系数。
根据公式(2)计算,得出在高校市场营销数据仓库中所有数据的权重分配,将其作为基础,对高校市场营销数据仓库中的文本进行分类,从而提高分类结果的精度,并进一步加强网络数据挖掘技术的应用价值。
通过计算,得到无线网络中海量数据的权重分配,并以此为基础,对无线网络数据文本进行分类,以此能够有效提高分类结果的准确性,同时也能够进一步提高Apriori算法应用的实际意义。
1.3 无线网络环境离群点数据智能过滤
在上述相关操作的支撑下,为了提高网络数据挖掘技术的应用价值,还需要对高校市场营销数据仓库所在网络环境当中的离群点数据进行智能过滤,从而提高数据的应用价值。在这一过程当中,离群点数据智能过滤实质上就是对冗余数据的过滤。在实际操作时,根据上述文本分类,提取多种类型的字段,进行网络节点分散处理。由于在实际操作过程中,高校市场营销数据仓库中不同离群节点仅允许在本地数据库当中完成相应的计算操作。因此,还需要根据数据仓库中不同数据点所属簇组进行分析。通过对不同簇组的核心数据值进行计算,对其结果进行评估,将评估结果作为数据离群点是否为冗余数值的评价结果。以此,综合上述分析,得出数据离群点簇组心值的计算公式如公式(3)所示。
综合上述计算公式(3),评价输出的数据的最终值与全局簇中心点数值是否存在一致性。如果得出的结果一致,则说明被挖掘的数据具有一定的利用价值,不需要进行离群点数据智能过滤;反之,如果得出的结果不一致,则说明被挖掘的数据不具有利用价值,需要进行离群点数据智能过滤,以此实现对有利用价值数据的高效利用。
1.4 确定高校市场营销数据价值分布及分类
在完成该文上述论述的各项操作后,还需要确定高校市场营销数据价值分布情况,并根据其特点进行分类。表1为以某一高校的市场营销数据仓库为例的R、F、A、T 4个内容作为聚类中心的分类结果和相应的机制综合分数。
表1 R、F、A、T对应聚类中心
表1中的数据是通过对某高校市场营销数据仓库当中的各项数据将其对应的权重相乘,并带入聚类分析处理软件当中得到的结果。对表1中的R、F、A、T对应聚类中心数据结果进行分析,高校市场营销数据现阶段的各项营销行为决定了高校市场营销数据现阶段对高校自身发展的最终结果。为了完成对四纵不同数据特征更加细致化的描述,在现有数据价值分析的基础上,从多个维度出发,实现对其数据潜在价值的深入分析。结合RFAT理论,将F*A定义为,在当前阶段高校市场营销数据的总体价值。因此,F*A与高校市场营销数据当前阶段的购买频率之间存在十分密切的联系。因此,根据这一特征,再对F*R*T进行定义,将其作为数据潜在的增值实力。结合RFAT理论,将上述2种定义下的高校市场营销数据,根据高校市场营销的实际需要,将其划分为低、中、高3个不同等级的价值分布区域,其中将0~3.5的数值定义为具有低等级价值的数据;将3.5~12.5的数据定义为具有中等级价值的数据;将12.5~21.5的数据定义为具有高等级价值的数据。根据上述定义,仍然以上述某高校市场营销数据仓库中的数据为例,将其聚类后的结果进行相应的标准,并将其填写在图1当中相对应的位置上。
图1中颜色越深的区域代表其所在区域内的高校市场营销数据价值越高,反之,颜色越浅的区域代表其所在区域内的高校市场营销数据价值越低。从图1中的信息可以清晰地看出哪个区域当中的数据具有较高的营销价值,以此展现高校市场营销数据仓库数据营销价值和潜力,从而更加方便为高校数据类型选择精准营销策。在实际应用中,针对不同分布区域,高校应当提出相对应的营销策略,从而实现对高校市场营销数据仓库中各类数据的高效利用。
图1 高校市场营销数据价值分布图
2 对比实验
为了进一步验证该文提出的基于网络数据挖掘技术的高校市场营销方法在实际应用中的效果,将其与传统营销方法进行对比,完成如下对比实验。
选择某高校作为实验环境,将其近几年来市场营销历史数据作为实验样本,实验样本当中包括客户分析、产品分析和市场分析等多种分析方法得出的各项数据。分别利用该文提出的基于网络数据挖掘技术的高校市场营销,和传统营销模式分别对其各项数据进行挖掘,构建高校市场营销模型。将2种模型应用于真实的市场营销环境当中,待完成一段时间的模型运行后,将2种模型的实验结果进行记录,并利用Python3.1的开发工具,通过编程的方式完成对其结果进行定量,并绘制成实验结果对比表,见表2。
表2中P值为该文营销方法或传统营销方法中完成数据挖掘后数据集中重要数据的占比。因此,P值越大,则说明该营销方法当中的挖掘效果更强,反之,P值越小,则说明该营销方法当中的挖掘效果更弱。由表2中的实验结果可以看出,该文营销方法P值均在95.00%以上,而传统营销方法P值均未超过70.00%,因此该文营销方法P值明显高于传统营销方法。通过对比实验进一步证明,该文提出的基于网络数据挖掘技术的高校市场营销方法能够深入挖掘海量数据,并提高数据的利用率。
3 结语
该文通过开展高校市场营销中网络数据挖掘技术的应用研究,提出了1种全新的高校市场营销方法,将该方法应用于实际能够深度挖掘海量数据。在当前数据在市场营销中地位不断提升的背景下,该文提出的方法能够完成对数据信息的采集、分析、并根据分析结果提出建议。同时,该文设计的方法可根据不同领域市场营销的实际情况进行调节,不仅可以应用于高校当中,同时还可以为企业的各项决策提供帮助,因此具有更加广泛的应用效果。