产品用户评论在企业竞争情报中的应用——基于产品特征的关联规则数据挖掘
2015-04-11吉顺权
吉顺权 周 毅
(苏州大学社会学院,江苏?苏州 215123)
产品用户评论在企业竞争情报中的应用——基于产品特征的关联规则数据挖掘
吉顺权周毅
(苏州大学社会学院,江苏?苏州 215123)
〔摘要〕在总结用户评论相关研究的基础上,提出关联规则理论在用户评论挖掘中的作用,包括可以用来挖掘产品的优劣势特征及其程度大小,以及挖掘影响产品整体评价的关键特征。提出了基于产品特征关联规则数据挖掘的企业竞争情报应用模型,包含确定用户评论情报源及其采集、数据预处理及其产品特征提取、数据结构化处理及其关联规则分析和产品优劣势特征及其关键特征的对比分析四个模块。最后通过实验论证了这一模型的价值。
〔关键词〕企业;用户评论;产品特征;关联规则;数据挖掘;竞争情报
产品用户评论是用户从自我体验或自我感知角度对某产品的优点、缺点、性能、价值、使用满意度等方面所发表的意见或态度,从用户角度反映产品特征的优劣。随着交互网络和电子商务的发展与成熟,关于产品的用户评论数量正在急剧增长,作为开放的信息资源,用户评论逐渐受到电商卖家、产品企业和同行竞争企业的关注。基于用户评论的口碑营销、产品特征分析、产品企业自我分析与定位、同行竞争企业分析与发展等功能促使用户评论成为新的情报源。作为新的情报源,产品用户评论中包含丰富多样的产品信息和用户使用感受,帮助产品企业从用户视角了解自己产品的优势和劣势,进而提高产品性能,获得竞争优势[1-2]。而且产品用户评论有助于从本质上认识产品特点及对企业的影响,为企业竞争情报研究提供相关的理论支撑[3]。
关联规则由美国IBM Almaden Research Center的Rabesh Agrawal等人于1993年提出,反映一个事物与其他事物之间的相互依赖性或相互关联性,从而达到认识事物客观规律[4],利用这一方法对产品用户评论进行数据挖掘,可以快速发现用户评论中有价值的信息,对企业竞争情报工作的开展具有重要意义。
1 用户评论相关研究
目前关于用户评论(或产品评论)的研究较少,从1996-2014年相关发文量才100多篇(CNKI以“用户评论”或“产品评论”为篇名检索结果),但近三年来发文量占总发文量的80%,所以,关于用户评论的研究正处于发展阶段,而且逐渐成为众多学者关注的研究热点。用户评论相关研究主要集中在理论探讨和实践技术两个方面。在理论探讨上,主要包括用户评论的特点、价值、信息源和在企业竞争情报中的应用等方面,尤其是关于用户评论在企业竞争情报中的应用研究,已涉及行业监测、用户研究、竞争对手分析、企业战略制定等多个领域[3,5]。在实践技术上,主要包括用户评论特征提取和用户情感分析两个方面。用户评论产品特征提取主要是对提取算法进行利用和改进,如自组织映射(SOM)属性识别[6]、FP增长算法[7]、CRF挖掘方法[8]等。
理论探讨和实践技术是用户评论研究的两大重要领域,理论探讨在宏观上论证用户评论的价值和构建企业竞争情报模型,为具体实践操作提供理论指导,实践技术在微观上论证利用用户评论价值的可行性,为理论创新提供技术支撑。理论探讨中的基于用户评论的企业竞争情报模型构建和实践技术中的用户评论特征提取算法优化是目前用户评论研究的热点问题。
2 用户评论中产品特征关联规则挖掘在企业竞争情报中的作用
从用户评论相关研究中可以发现,用户评论研究已形成由理论到实践的跨学科研究体系,不但强调了用户评论在企业竞争情报中的价值,而且提供了产品特征提取和情感分析的技术支撑。然而,在应用中,关于产品优劣势特征的重要性大小以及关键产品特征的挖掘仍然处于薄弱环节,而基于用户评论的产品特征关联规则挖掘则可以弥补这一薄弱环节。
产品特征关联规则挖掘涉及的主要参数有支持度、概率和规则重要性[9]。支持度(support)是用来衡量一个项集出现的频率,它是用来对项集的限制,而非对规则的限制。概率又是关联规则的可信度(confidence),表示用户对某些规则感兴趣,但这些规则必须是高概率,而非小概率,最小概率对项集没有影响,对规则生成有影响。规则的重要性Importance(X⟹Y)=log(p(Y X)/p(Y not X)),描述了规则的关联性大小,如果Importance=0,表示X和Y没有关联性;如果Importance>0,表示X和Y正相关,X为真时,Y的概率会上升;如果Importance<0,表示X和Y负相关,X为真时,Y的概率会下降。
产品的用户评论形式多样、内容丰富,蕴藏着重要的商业价值,对企业开展竞争情报工作具有重要作用。用户评论内容不但体现了用户从自我体验或自我感知角度对产品某些特征的积极评价和消极评价,而且包含了用户对产品的整体评价,如用户评论中的星级评价和分数评价机制。因此,对用户评论中的产品特征与评价进行提取并形成记录,再运用关联规则进行数据挖掘,寻找概率高、规则重要性为正且较大的规则,从而挖掘出用户所认为的优势特征和劣势特征,以及这些特征的重要性大小。并利用用户评论的总体评价,发现影响产品整体评价的关键特征。
2.1挖掘产品的优劣势特征及其程度大小
用户评论虽然形式多样,但其内容基本都含有对产品的优势特征和劣势特征的评价。有的用户评论将优势和劣势评价分开,由多条评论文本组成,如中关村网上的产品评价;有的用户评论没有详细划分,用户直接评论,一条评论文本中既包含了优势特征也包含了劣势特征,如淘宝网上的产品评论。对这些用户评论中的产品特征进行提取,同一ID的用户评论形成优势特征和劣势特征两条记录,优势特征形成“Feature A,Feature B…⟹Positive”形式的记录,劣势特征形成“Feature A,Feature C…⟹Negative”形式的记录。然后,通过关联规则Apriori算法对产品各优势特征和劣势特征的分量和概率进行计算,挖据出概率高、重要性大的产品特征,并显示其重要性的大小,从而发现多个产品之间优势特征和劣势特征的差异,帮助企业从用户反馈的评论信息中重新了解产品的特性、功能和用户的喜好。
2.2挖掘影响产品整体评价的关键特征
用户评论中除了包含用户对产品优势特征和劣势特征的评价外,还包括用户对产品的整体评价,一般以总结性语言、产品评分以及星级评价来体现。用户对产品的整体评价以用户对产品优势特征和劣势特征的评价为基础,受优势特征和劣势特征的多少及重要性大小影响,但并不存在必然联系,而关键特征则会直接影响用户的最终评价。关键特征可能与挖掘产品优劣势特征中的最大重要性特征一致,也可能不一致,具体要看产品特征关联规则挖掘的结果。
在挖掘产品优劣势特征及其重要性大小时,同一ID的用户评论形成两条记录,而挖掘影响产品整体评价的关键特征时,同一ID的用户评论形成一条记录,其中包含了优势特征和劣势特征,但最后产品的整体评价结果“Positive”或“Negative”以用户的评分或星级评价来确定,最终形成“Feature A⟹Positive,Feature B⟹Positive,Feature C⟹Negative…⟹Positive”或者“Feature A⟹Positive,Feature B⟹Positive,Feature C⟹Negative…⟹Negative”形式的记录。然后再进行关联规则挖掘,挖掘出影响产品整体评价的关键特征。产品的关键特征是产品的核心竞争力,改善、提高产品关键特征的性能,是企业提高产品竞争优势的最佳途径。
3 基于产品特征关联规则数据挖掘的企业竞争情报应用模型
有学者认为,竞争情报系统的根本任务是以战略目标为导向对竞争数据进行有效的收集、存储、处理和维护,并不断寻找和发现环境中可能影响企业生存和发展的先兆信息[10],而除此之外,对企业自身产品数据的收集和分析也是企业竞争情报系统的重要任务。鉴于此,笔者以用户评论为情报源,提出基于产品特征关联规则数据挖掘的企业竞争情报应用模型,该模型的功能设计是对自身产品和竞争对手产品进行用户评论数据搜集分析,并利用关联规则进行用户评论数据挖掘,通过对比分析寻找产品各个特征在用户心中的地位,以及发现影响产品研发与设计上的核心问题,进而帮助企业全面了解自己产品和竞争对手产品的竞争形势。
基于产品特征关联规则数据挖掘的企业竞争情报应用模型包括4个模块,分别是确定用户评论情报源及其采集、数据预处理及其产品特征提取、数据结构化处理及其关联规则分析和产品优劣势特征及其关键特征的对比分析,如图1所示。
图1 基于产品特征关联规则数据挖掘的企业竞争情报应用模型
3.1确定用户评论情报源及其采集
在数字时代,网络是所有信息传递、加工和处理的最好载体,正成为竞争情报的一个主要来源[11],而用户评论不仅包含了产品信息,更体现了用户需求和用户满意度,而且在获取方面更加方便与廉价,所以用户评论逐渐成为竞争情报的重要来源。
作为重要的情报源,如何确定要采集的用户评论是进行产品特征关联规则数据挖掘的首要问题,用户评论的来源主要有产品评测网、产品论坛网、电子商务网以及各大社交平台,每一个网站上的用户评论都是有价值的情报信息,然而在选择用户评论情报源时需注意几点问题:(1)网站是否具有权威性。网站权威性越高,其产品介绍越详细精准,用户评论才会更加全面精确。(2)用户评论质量是否具有保障。由于网络水军的存在,用户评论的质量也参差不齐,而用户评论的质量将直接影响关联规则数据挖掘的结果,所以只有高质量的用户评论情报源才能分析得出全面可靠的产品特征信息。(3)不同产品的用户评论信息来源要一致。由于不同信息来源的评论机制不一样,所以无法进行对比分析。只有选择同一信息来源的不同产品的用户评论进行数据挖掘,才能将挖掘结果进行对比分析。而不同信息来源的用户评论可以单独进行数据挖掘与对比分析,从而达到相互验证的效果。
在确定用户评论情报源后,需对用户评论中的相关数据进行采集,具体采集信息需根据网站用户评论内容格式和企业需求来确定。
3.2数据预处理及其产品特征提取
已采集的用户评论内容是自然语言,具有多样性、模糊性和不一致性,无法直接分析,需对其进行数据预处理以及产品特征提取。
数据预处理的目的是提取有效的用户评论内容,将内容缺失、重复、异常的数据记录进行剔除,保证数据内容的有效性。在用户评论数据预处理完成后,利用相关工具或算法对用户评论内容进行产品特征的提取和用户态度的分析,其方法有ICTCLAS分词法、自组织映射(SOM)属性识别、FP增长算法、CRF挖掘方法等,可以根据需要选择。其目的是将用户评论中涉及产品的优势特征和劣势特征信息进行提取分类,若用户态度无法直接获取,还需进行用户情感分析。
3.3数据结构化处理及其关联规则分析
由于产品特征的关联规则数据挖掘包括两个方面,一方面是挖掘产品特征的优劣势及其重要性大小;另一方面是挖掘影响用户对产品整体评价的关键特征。所以,在数据结构化处理过程中需进行两个方面的处理:
(1)将产品特征进行优势特征和劣势特征的分类,即用户评论中产品特征为优势时,其对应的观点为“Positive”,产品特征为劣势时,其对应的观点为“Negative”,其数据结构化样式如表1所示。
表1 数据结构化样式(一)
(2)在产品优势特征和劣势特征分类的基础上,加入用户对产品的整体评价,整体评价的观点“Positive”或“Negative”以评分或星级评价为判断依据,其数据结构化样式如表2所示。
表2 数据结构化样式(二)
在数据结构化处理完成后,将结构化数据导入到Business Intelligence Development Studio、SAS等数据挖掘工具,利用关联规则进行数据挖掘部署,得到相关规则、规则重要性以及规则的概率等结果。
为了保证数据挖掘的有效性,需要从数据和挖掘方法两方面提供相应保障措施。在数据上,需保证其时效性。在数字时代,产品(尤其是数字产品)的更新换代速度逐步加快,用户评论有效性的时间逐渐缩短,及时采集分析用户评论数据是保证数据挖掘有效性的首要措施。在挖掘方法上要选择正确的参数设置,保证挖掘规则的科学有效,也可以通过多次挖掘,论证挖掘规则的正确性。
3.4产品优劣势特征及其关键特征的对比分析
在关联规则数据挖掘得出的规则中,选取概率高、重要性大的规则进行分析,发现优势特征、劣势特征和关键特征。同时在多个产品之间进行对比分析,发现自己产品和竞争产品的差异,为产品定位和企业决策做参考。
产品优势特征和劣势特征的对比分析可以全方位了解自己产品和竞争对手产品之间的差异,发现自己与竞争对手的擅长点和薄弱点,为今后产品设计作参考。同时,通过优劣势的对比发现用户在产品某一特征上的偏好,根据规则概率的大小了解用户偏好的覆盖面,间接进行了用户需求(偏好)的调查。
产品关键特征的对比分析可以发现产品推出后成功或者失败的关键点。任何一个产品都不可能毫无瑕疵,也不可能得到每一位用户的认可,所以产品很有可能是因为某一特征的成功而成功,也有可能是因某一特征的失败而失败,如价格、做工、性能等特征。所以,关键特征的对比分析有助于企业快速掌握产品行业用户最为关心的核心部分,若关键特征为优势,则代表产品的核心能够抓住用户需求,可以在今后产品研发上持续利用;若关键特征为劣势,则代表产品的核心并不能使用户满意,在产品研发上需特别改进。
4 实验研究
实验以Business Intelligence Development Studio为数据挖掘工具,以中关村在线中手机小米3和锤子T1的用户评论为数据挖掘对比研究对象,设计两种类型的关联规则数据挖掘模型,一类是用来挖掘产品的优势特征和劣势特征;另一类是用来挖掘影响产品整体评价的关键特征。在中关村在线小米3和锤子T1产品中的点评区里以默认排序选择前20条用户的评论作为具体的数据采集对象,选择默认排序的目的是保证所采集的小米3和锤子T1评论尽可能在时间区域和热度高低上保持一致性,从而保证对比研究的有效性。
4.1用户评论数据确定与采集
由于中关村在线手机专区是我国目前规模较大的电子产品在线评测、评论网站,具有一定的可信任性,而且中观村在线手机专区的评论信息格式较为规范,如图2所示,方便采集和分析,所以确定中关村在线手机专区中的小米3和锤子T1点评区中的用户评论为采集对象。利用数据采集器对网页中的用户评论内容进行采集,采集结果如表3所示。
图2 中关村在线手机专区用户评论采集示例
序号用户名标 题优 点缺 点总 结评分时间1的方法是否锤子手机热卖左右手是我最爱的地方…就是卖的太便宜 我感觉要是卖5000…外观和系统 设计细节 很喜欢 惟一遗憾的是现在…5〛2014/5/2310∶522种致远就是虫叔呀很少人感觉到老罗的用心良苦…细节决定成败,着重用户体验可以说是国产机中的业界良心…电池续航虽然不错但是估计年轻人是不够用的…中国人被性价比惯坏了,其实很多机器在变成国行之后为了…4.72014/5/235∶273yyh116177647个人对锤子手机的个人看法先说配置:一部手机的良好体验离不开配置的支持…手机下面三个实体键不是本人喜欢的…手机很出色,亮点也很多。可以看出锤子做了很多市场调查…52014/5/2111∶37……………………
4.2用户评论数据预处理和产品特征提取
对采集的数据进行预处理,剔除重复、无效、异常的数据,并对得到的数据进行分词处理,提取产品相关特征,如表4所示。
表4 用户评论中小米3特征提取(部分)
4.3数据结构化处理及其关联规则分析
将经过特征提取后的用户评论数据进行结构化处理,形成与关联规则挖掘需求相一致的结构化数据,如表5和表6所示。
表5 第一类型的用户评论结构化数据表(部分)
表6 第二类型的用户评论结构化数据表(部分)
在数据结构化处理结束后,将得到的4张表格(每个产品需进行两种类型的数据挖掘,一共两个产品)导入到SQL Server 2008数据库中,利用Business Intelligence Development Studio进行关联规则数据挖掘。在Business Intelligence Development Studio中建立Analysis Services项目,并与SQL Server 2008数据库进行连接,然后通过连接数据库中4张关于小米3和锤子T1用户评论的数据表建立数据源,然后再建立包含这4张数据表对象的数据源视图。
在数据源和数据源视图建立完成之后,新建本次研究的数据挖掘结构。在数据挖掘技术选择中选择Microsoft关联规则,同时选择需要进行关联规则挖掘的数据源视图。在挖掘结构建立完成之后,便可以让Business Intelligence Development Studio通过关联规则的算法对已建立的挖掘结构进行部署和处理,之后便可以浏览关联规则数据挖掘结果。
4.4实验产品优劣势特征及其关键特征的对比分析
关联规则数据挖掘得出的规则较多,为了得到概率高、重要性大的规则,笔者对最小概率和最低重要性进行了相关设置,以过滤意义不大的规则。
4.4.1产品的优劣势特征及其重要性分析
图3、图4是小米3和锤子T1用户评论第一类型关联规则挖掘得出的结果,按重要性由大到小排序。从图中可以发现,小米3手机最大的优势特征是“硬件配置”(0.398),其它比较重要的优势特征有“价格”(0.309)和“屏幕”(0.265)。小米3手机的最大劣势特征是“散热”(0.449),其它比较重要的劣势特征是“电池”(0.380)。而锤子T1手机最大的优势特征是“硬件配置”(0.489),其它比较重要的优势特征是音质(0.294)。锤子T1手机最大的劣势特征是“价格”(0.360)。
图3 小米3手机特征关联规则和依赖关系网络
图4 锤子T1手机特征关联规则和依赖关系网络
通过对比小米3和锤子T1的手机特征,可以发现两款手机在特征上的差异性,是企业需要收集的重要情报。图5显示的是高重要性规则结果,在优势特征上,小米3优势特征有硬件配置、价格、屏幕、系统软件等,锤子T1优势特征有硬件配置、音质、系统软件、外观设计和配件设置等,锤子T1手机的优势特征多于小米3,而且同样的优势特征中,锤子T1的优势特征重要性也略高于小米3。在劣势特征上,小米3劣势特征有散热和电池,锤子T1劣势特征只有价格。所以,从产品特征挖掘结果看,锤子T1的优势明显高于小米3,说明锤子T1在功能特征上更能迎合用户的需求。
图5 小米3和锤子T1手机特征对比图图表来源:笔者根据挖掘结果规则绘制
4.4.2影响产品整体评价的关键特征分析
图6是小米3和锤子T1用户评论第二类型关联规则挖掘得出的结果,按重要性由大到小排序。
影响小米3整体评价的3条最重要的规则分别是“系统软件=Positive->Opinion=Positive”(0.465)、“硬件配置=Positive->Opinion=Positive”(0.368)、“系统软件=Positive,硬件配置=Positive->Opinion=Positive”(0.301)。所以,影响小米3整体评价的关键特征是“系统软件”和“硬件配置”,而且作为优势特征的“系统软件”和“硬件配置”决定了用户对小米3的积极认可。并且在其它关联规则中同样可以发现“系统软件”和“硬件配置”对小米3整体评价的重要影响,如“电池=Negative,系统软件=Positive->Opinion=Positive”(0.239)、“价格=Negative,硬件配置=Positive->Opinion=Positive”(0.239)、“外观设计=Negative,系统软件=Positive->Opinion=Positive”(0.239)、“拍照=Negative,硬件配置=Positive->Opinion=Positive”(0.239)、“拍照=Negative,系统软件=Positive->Opinion=Positive”(0.239),这些规则说明了小米3的一些劣势特征对小米3整体评价的影响不大。
影响锤子T1整体评价的四条最重要的规则分别是“价格=Negative->Opinion=Negative”(0.380)、“外观设计=Negative,价格=Negative->Opinion=Negative”(0.322)、“外观设计=Negative->Opinion=Negative”(0.322)、“系统软件=Positive->Opinion=Positive”(0.301)。所以影响锤子T1整体评价的关键特征有“价格”、“外观设计”、“系统软件”。然而“价格”、“外观设计”作为劣势特征直接影响了用户对锤子T1的消极评价,“系统软件”虽然作为优势特征对锤子T1的整体评价也有较强影响,但其重要性不及“价格”和“外观设计”。而且在其它特征关联规则中也证明了“价格”和“外观设计”对锤子T1的决定性影响,如“图像=Positive,价格=Negative->Opinion=Negative”(0.222)、“音质=Positive,价格=Negative->Opinion=Negative”(0.222)、“音质=Positive,外观设计=Negative->Opinion=Negative”(0.222)、“图像=Positive,外观设计=Negative->Opinion=Negative”(0.222)。
综上,在整体评价上,小米3以优势关键特征“系统软件”获得用户的好评,而锤子T1以劣势关键特征“价格”失去用户的好评,所以,关键特征的优劣是能否获得用户好评的核心。
小米3和锤子T1的优劣势特征分析和关键特征分析的结果对比验证了基于产品特征的关联规则数据挖掘在企业竞争情报中的价值。第一,在产品优劣势特征及其重要性大小挖掘中,发现了小米3和锤子T1各自产品的优势特征和劣势特征数量的多少和特征的重要性大小,而且通过共同特征和差异特征的对比分析,从用户体验角度全面了解了两个产品的细节特征,以及它们在用户心中的差距,为产品细节设计提供用户偏好的数据支撑。第二,在产品关键特征挖掘中,实验结果显示,产品是否能够获得好评,受产品关键特征影响,与优劣势特征的多少没有必然的联系,而且产品关键特征并不一定是重要性最大的优势特征或劣势特征。产品关键特征受用户格外关注,能够影响用户对产品的整体评价。然而在产品被推出时,关键特征并不明确,只有在用户充分体验产品之后才能逐渐显现。所以,关键特征不具有预见性,只能够通过数据挖掘发现,并为产品的重新定义与销售策略提供指导,为今后产品的定位、设计、决策提供数据支撑。
图6 影响小米3和锤子T1整体评价的手机特征关联规则(图左:小米3,图右:锤子T1)
5 结 语
基于产品特征关联规则数据挖掘的企业竞争情报应用模型,对企业开展竞争情报工作、进行产品定位、制定战略决策具有重要意义,尤其是产品关键特征的挖掘,对企业决策具有重要参考价值。随着用户评论价值的发现,以及大数据环境下用户生成内容(微博、朋友圈等社交媒体信息)价值的利用,以网络用户生成内容为情报源的企业竞争情报研究将成为学界和业界研究的热点问题,竞争情报模型的优化设计和用户内容提取及分析算法的改进将成为今后企业竞争情报系统构建所关注的重点问题。
参考文献
[1]Hu M,Liu B.Mining and summarizing customer reviews[C]∥Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,New York:ACM Press,2004:168-177.
[2]Popescu A M,Etzioni O.Extracting product features and opinions from review[C]∥Proceedings of the Human Language Technology Conference and the Conference on Empirical Methods in Natural Language Processing,Stroudsburg,USA:Association for Computational Linguistics,2005:339-346.
[3]周珍妮,黄晓斌.网络用户评论在企业竞争情报研究中的应用[J].情报理论与实践,2012,(5):15-20.
[4]况莉莉.Microsoft关联规则在高校图书馆中的应用[J].宿州学院学报,2011,(5):109-113.
[5]施国良,程楠楠.Web环境下产品评论挖掘在企业竞争情报中的应用[J].情报杂志,2011,(11):10-14,51.
[6]余传明.从用户评论中挖掘产品属性——基于SOM的实现[J].现代图书情报技术,2009,(5):61-66.
[7]王永,张勤,杨晓洁.中文网络评论中产品特征提取方法研究[J].现代图书情报技术,2013,(12):70-73.
[8]吕品,钟珞,蔡敦波,等.基于CRF的中文评论有效性挖掘产品特征[J].计算机工程与科学,2014,(2):359-366.
[9]Zhao Hui Tang,Jamie MacLennan.数据挖掘原理与应用——SQL Server 2005数据库[M].邝祝芳,焦贤龙,高升,译.北京:清华大学出版社,2007:191-205.
[10]刘庆红,李硕,王晰巍.Web集成环境下企业竞争情报模型构建研究[J].情报科学,2006,(11):1713-1717.
[11]王军.网络竞争情报源的开发利用[J].情报科学,2004,(5):574-577.
(本文责任编辑:马卓)
Application of Product User Review in Research on Enterprise Competitive Intelligence——Association Rules Data Mining Based on Product Features
Ji ShunquanZhou Yi
(School of Society,Soochow University,Suzhou 215123,China)
〔Abstract〕On the basis of summarizing the research on user reviews,this paper put forward the significance of mining user reviews with association rules.It included mining the positive features and the negative features of the products,and mining the key features which affect the overall evaluation of products.And then this paper put forward the model of enterprise competitive intelligence which based on the association rules data mining from product features.It contained four modules of user review searching and collecting,data preprocessing and features extracting,data structured processing and association rules data mining,and positive and negative features analyzing and key features analyzing.In the end,this paper demonstrated the value of the model by experiment.
〔Key words〕enterprise;user reviews;product features;association rules;data mining;competitive intelligence
〔中图分类号〕G203;TP391;G250.25
〔文献标识码〕A
〔文章编号〕1008-0821(2015)06-0114-08
DOI:10.3969/j.issn.1008-0821.2015.06.021
作者简介:吉顺权(1990-),男,硕士研究生,研究方向:网络信息资源开发利用。
基金项目:“十二五”江苏省高校重点专业建设专项——图书情报与档案管理(项目编号:58315312)的阶段性成果之一。
收稿日期:2015-03-09
·企业情报工作·