数据驱动的产品综合评价模型研究
2021-07-22邓慧君
邓慧君 ,宋 君 ,朱 琳
(1.宁波大学 信息科学与工程学院,浙江 宁波 315211;2.宁波大学 机械工程与力学学院,浙江 宁波 315211)
一、引言
随着数字经济的发展,网络数据信息越来越丰富,数据驱动的业务岗位赋能的研究越来越受到产业和学者的重视,大数据分析的技术与方法成为科学研究与技术应用的热点。同时,基于互联大数据的社会新生态系统也正在逐步形成。国内外学者已经进行了较多的研究工作。Tony H(2009)[1]博士提出人类科学研究的“第四种范式”,即“数据探索”,用以指导和更新科学领域的研究。Boying Li等(2016)[2]便运用大数据技术对Amazon 网站的数据进行相关性分析,建立产品的评论数量、增长比率和产品销售量的相关关系。Gema Bello-Orgza 等(2016)[3]针对社会媒体大数据的快速增长,提出从数据融合和数据可视化两个方面来对其进行分析。Max Nathan 等(2015)[4]通过观测和模拟变量的组合,开发出了一种新型的文本挖掘技术。Hye-Chung Kum 等(2015)[5]引入了数据库知识发现和数据挖掘过程的概念,提出新型的知识发现和数据挖掘体系结构。Mohamed Abouelela 等(2015)[6]提出了迭代调度算法和K-short 路径算法,处理在数据密集型应用中出现的大型数据传输延迟现象。顾复等(2018)[7]针对产品生命周期评价难的问题,提出了透明公平的产品生命周期评价方法。张卫等(2019)[8]对制造服务的研究分析,提出了一种智能服务的模块化设计方法。任杉等(2018)[9]针对复杂产品生命周期数据呈现的大数据特性,提出一种生命周期大数据驱动的复杂产品智能制造服务新模式。李浩等(2018)[10]提出面向MC 的产品服务系统模块化设计框架,实现用户需求获取的规模化、快捷化及低成本。陶飞和戚庆林(2018)[11]提出在新一代信息技术与制造融合的环境下,面向服务的智能制造的实施框架。陈美(2012)[12]利用大数据技术实现交通数据的采集和处理,构建了城市公共交通管理体系。王雅琼等(2015)[13]学者提出将大数据技术应用到智慧化交通服务中,从而利用智能化交通为人们提供优质的出行服务。黄晓斌和钟辉新(2013)[14]建立了由核心功能层、支撑功能层以及表现功能层组成的企业竞争情报系统模型。唐晓波等(2018)[15]提出了基于大数据智能的竞争情报系统模型。
从学者们的研究也可以看出,由于数据源的广泛性及数据生产方式的多样性,未来数据的规模将越来越大,而且数据结构也越来越趋于复杂。因此,不同领域下大数据技术的应用将越来越能体现出它的优势与价值。另一方面,企业转型升级的压力使企业家也越来越垂涎基于大数据的企业问题解决方案,迫切需要有实践意义的大数据应用的技术与方法。
本文提出数据驱动的产品综合评价的构思,从企业内外环境中获取产品相关的数据,应用大数据分析处理技术与方法,挖掘数据背后隐藏的信息,并融入到产品综合评价过程中,建立数据驱动的产品综合评价模型,对企业产品进行综合性的量化评价。本文的研究,有助于发挥数据资源在企业业务执行中的赋能作用,提高企业产品评价的准确性与科学性,为企业转型升级及绩效提升提供参考,推动企业大数据应用的实践。
二、服务模型框架
所谓数据驱动的产品综合评价主要是指在产品与外界相互作用过程中产生一些可以表现产品与外界关联特征的数据,通过对这些数据进行挖掘,发现其中的事物关联性和隐藏模式,对产品的市场表现、市场潜力等进行量化评价,用以辅助产品优化与创新等业务活动[16-17]。
通过对收集的产品相关数据的分析研究,本文将产品综合评价分为两大维度:一是产品市场表现力的评价,二是产品技术潜力的评价,该维度是从技术角度作为前一维度的补充。综合两个维度的产品表现,可以分析和预测产品在当下及未来可能的发展走向,为企业业务决策提供参考。本文提出的数据驱动的产品综合评价服务模型如图1 所示,包括数据驱动层、数据处理与分析层、企业业务应用层、知识服务层。
(一)数据驱动层
数据资源是提供产品综合评价的基础。不仅企业的管理信息系统、产品结构数据平台系统中包括着大量的有价值的数据,大数据技术的应用使电子商务平台、专利期刊文献数据、网络论坛社区的短文都成为对企业业务有支撑作用的重要资源。本文通过网络爬虫等信息技术,将不同来源的数据信息汇聚,成为本研究框架的数据资源池,为产品综合评价提供数据基础。这些数据是动态的,按照系统规则的定义,系统可自主地进行数据的积累,以便实施基于时间维度的历史性趋势分析等。
(二)数据处理与分析层
该层主要面向企业的业务应用,从数据资源层提取相关数据并进行分析处理。因为底层的数据资源是多源、多样、无序和大量的。因而需进行常规的数据采集、数据清洗、数据的结构化和有序化处理,同时根据业务需要进行数据的集成及数据规则的构建。
(三)企业业务应用层
本文从产品的市场表现及产品的技术潜力两大维度分别展开产品的评价。首先市场表现力的维度分析,需要从用户评价的语料库中,通过大数据解析分析、主题模型研究等方法,提炼构成评价的特征维度,这个维度会随着时间及群体的变化而动态波动。特征维度建立后,需要计算统计特征维度的评价结果,之后建立各特征维度在总体评价中的权重系数,各特征维度加权求和即可获得产品的综合评价参数。研究的关键点在于权重系数的确定,本文通过特征维度所属的评价语料的总体占比的方法,确定特征维度的权重,相对于人为裁定的方法会更为科学。
产品技术潜力的评价主要是基于产品相关的技术专利及科研文献数据,探讨当前已有技术的储备水平,形成对产品更新与优化的辅助决策参考。主要是通过技术热点与空白点等专题的解析,利用技术功效矩阵方法,对产品相关的创新技术水平及产品发展潜力进行量化度量,辅助于产品综合评价。
(四)知识服务层
本文提出的产品综合评价服务的初衷是利用开放的数据资源及企业的产品数据信息,通过一套方法体系实现计算机系统的自动化处理,通过内置服务的方法,由软件平台系统直接为产品设计人员等提供产品优化及技术创新的辅助参考。因而需要将企业业务应用层的产品综合评价方法,通过聚合封装或功能细分,转化为平台系统的功能服务,包括产品专利保护的建议服务、产品优化与技术创新决策服务、知识体系维护与监控服务、知识推送与技术风险预警服务等。
三、产品市场表现力的评价
本文提出的产品综合评价模型,首先是对产品市场表现力的评价。产品价值最终是由市场来检验的,因而用户的评论数据在一定程度上反映了产品在市场上的生存能力。本文提出的数据驱动的产品市场表现力评价服务模型,如图2 所示。
图2 数据驱动的产品市场表现力的评价的服务模型
产品市场表现力评价的数据资源基础主要是包含用户评价信息的数据源,如电子商务平台、网络论坛社区系统等。当研究某类产品在市场上的总体表现时,筛选的是该类别产品的评论数据,可以通过设置筛选规则来确定,比如价格区间,或性能参数指标等。如果研究的是某一产品的市场表现时,那只需要选择与该产品相关的评论数据即可,之后的统计计量方法是一致的。数据资源准备完成后进入数据的处理阶段,包括评论数据的解词、词频统计与特征词的提取等。
核心之一是进行LDA 的主题分析,并通过与产品结构数据等信息的结合,形成用户评价语料与产品功能特征的映射关系,利用专利信息及期刊论文中包含的功能特征与描述语料的映射规则,提取建立这种映射关系,建立本研究的产品评价维度模型。该评价维度模型可以根据需要分解为两个层面,一是顶层评价特征维度,通常包括产品外观相关的特征维度、价格或性价比相关的特征维度等。顶层特征维度通常又从操作的角度细化为二层次评价特征维度,即评价特征要素集,通常语料信息中评价的都是二层次评价特征维度要素。
该部分研究的另一项核心工作,需要对语料的情感特性进行统计分析,并量化评价的结果。首先是进行评价语料的情感极性的判断,正面评价得分为正,负面评价得分为负,中性评价得分为零。本文引入了“知网情感分析用词语集”开展评价词性的判断。然而,具体评价的得分还与评语极性的强弱有关,同时还与评价人的用词习惯及评价人的权威性相关。这是本文的难点之一。
在现行的电子商务系统中,用户对产品的评价通常采用“五分制”的方式来表达的。本文通过对特定评价人的所有的评价数据进行专项统计(不仅限于某类产品),统计其评价的用词习惯、用词与评价级别的相关性,构建评价人私有的五分制“评语用词赋分表”。赋分表可由计算机系统进行自动的跟踪分析,进行不断地丰富完善。在产品评价过程中,分析评价人的评价分值( Pi)时,首先依据该评价人的“评语用词赋分表”确定,如果配对失败,从其他人的“评语用词赋分表”中进行参考,如果也没有相对应的词条,那么可作为无效评价处理。
不同的评价人的意见对产品的市场表现力的展示作用是不同的,比如常客的意见可能更准确。因而,本文提出对评价人的评价准确性,用权威性修正系数( ai)来表征。
首先,统计所有评价人采购的同类产品的数量,并按从多到少进行排序,依排序情况,按五段制形式,依次确定修正系数,即采购数量最多的前20%的人,ai=1,采购数量在前20%~40%之间的,ai=0.8,依次类推。权重系数按从大到小的次序确定。
综上的分析,某一产品特征要素的得分( Skj,k为顶层特征维度序号,j 为细分特征要素集的序号)表示为公式1 所示。
式(1)中m 为评价条目的数量,akji为第i 条评论的评价人权威性修正系数,Pkji为该评价的赋分。
依据以上的数据分析处理即可量化产品各评价维度上的评价结果。然后,如何综合确定产品最终的市场表现能力,需要对多维度特征要素的评价结果进行综合。常规的解决方案是各维度加权求和的方法。然而,权重系统的确定是科学性的关键,本文提出基于各维度统计占比的方法来解决这一问题,计算方法如公式(2)所示。
式(2)中wkj为特征要素的综合评价权重系数,vkji为特征要素的评价结果,m 为对特征要素的评价总数,n 为该产品或该类产品的所有特征要素评价的总条目数。
对各特征要素维度进行加权求和,即可获得该产品或该类产品的综合评价量化参数p,如公式(3)所示。
式(3)中r 为一级特征维度总数,t 为特征维度下的二级特征要素的总数。
通过计算不同产品的综合评价参数,即可了解不同产品的市场表现,也可进行不同产品间的横向比较,为企业决策提供参考。
四、产品技术潜力的评价
从产品的技术创新角度来讲,市场是推动技术进步的重要力量。同时,产品技术的潜力也是影响产品生命周期的重要因素。据学者研究,专利记载80%以上的技术知识[18]。而期刊论文的文献资源与专利知识间形成一种互补,因而本文基于专利及期刊文献数据,将功效图的技术方法引入到产品的技术潜力的评价过程,旨在用于发现当前产品相关的技术的热点及空白点,指导企业技术研发,并辅助决策[19-20]。本文提出的数据驱动的产品技术潜力评价的业务流程如图3 所示。
图3 数据驱动的产品技术潜力评价的业务流程
(一)技术功效矩阵的构建
驱动技术潜力评价的数据源,主要是公开的专利数据及科研文献数据,同时企业管理信息系统中记载的产品结构、功能等数据也是进行技术潜力评价不可缺少的。另外,前面提及的用词评价语料数据库也是该部分研究的重要基础。除企业管理信息系统的数据外,其他数据资源都可以通过网络爬虫等较成熟的数据获取技术来完成。
为构建技术功效矩阵,首先需要明确矩阵的行与列的维度。
本文以用户评论数据的产品评价分析作为基础,将评价的特征维度,按功能、成本、质量、价格、体验等不同类型进行归并、排序。也就是确定产品相关的功效表述有哪些。这里提及的功效表述,并不是从设计人员的角度,而是从用户的角度来阐释的,即从用户角度来说,他们更关注什么样的功效需求。这一任务采用类似前面产品特征要素提取的方法,将特征要素映射为产品的功效表达。为便于分析,功效表达按前述产品市场评价的结果为依据,进行降序排列,作为功效矩阵的列。
因为科技文献及专利数据等资源中,对于产品技术相关的表述通常体现为原理、技术、工艺、方法、工具、材料、结构等,本文将技术的表述字段,按企业擅长的次序排列,作为矩阵的行,并根据文献与专利的分析可进一步细化为二层次技术的表达。
明确了举证的行与列,采用类似前述的数据处理方法,进行语料分析、LDA 主题模型分析、聚类分析等,确定某产品相关的技术主题及功效主题,并提取技术词语料及功效词语料信息。所谓技术词语料信息表现为原理、结构、材料、理论、方法等,功效词语料信息是指技术实施后可能达到的效果。这在信息科研文献及专利数据中有比较规范的表述,因而语料信息较容易提取,可基于语义规则的方法,由计算机自动完成。根据相对应的语料坐标,可以把相关的科技文献与专利统计到矩阵的相关节点,节点的数据即为累积的科技文献及专利资源的数量。如果以各节点的累计数据的大小作半径作圆,即可得到图4 所示的老板说功效矩阵。
图4 基于科技文献与专利数据的技术功效矩阵
在这个矩阵中展示了各功效需求方面的技术储备情况,展示当前该类产品的技术领域的先进性与不足,也可以较容易地发现技术研发的热点(半径大的单元节点)及研究的空白点(半径小或没有圆点的节点)。
(二)技术潜力的评价
如前所述的分析,已经可心获得行业全貌的技术能力矩阵图,利用类似的做法也可以获得企业当前的技术功效的分布情况,与前述基于科技文献与专利分析的不同在于各节点的数据如果是企业当前正采用的相关技术、原理、方法等则当前的节点数据并保留,没有采用的节点为空白。
通过全局技术功效矩阵与企业当前技术功效矩阵的对比,可以帮助企业选择创新的机会与方向。在理论、技术、方法、工艺等不同层面所具有的先进性可以用企业当前技术水平的总体与行业总体情况的比值来评估(技术进行性指标t),即:
式(4)中tij表示企业现行技术在技术功效矩阵第i 行第j 列的技术功效方面的先进性指标,dij为第i 行第j 列的单元值(企业当前在使用技术的水平),m 与n 分别为矩阵的行数与列数。
五、产品综合评价参数
如果企业在用户关切的功能需求上,有较丰富的技术储备,则企业对产品市场表现的预期必将得到提升,评价结果的可信度将会增强。因而,本文从技术储备的角度,企业拥有的技术的先进性指标(t)作为产品市场表现力评价的修正,得出产品的综合评价参数(P),如公式5 所示。
六、结束语
本文提出了数据驱动的产品综合评价的技术与方法,试图从产品的市场表现及技术能力等多个层面进行产品的综合评价,进行了量化参数的设计和原型系统的设计开发。本研究有益于企业对产品的市场表现、技术布局等情况进行分析和判断,为产品优化更新提供重要的参考。另外,通过量化参数的方法,支持企业的快速、科学决策。同时本研究也有助于推动大数据技术方法发挥大数据的企业赋能作用。