APP下载

基于知识网络的开放式创新社区知识发现研究

2020-05-07单晓红王春稳刘晓燕

复杂系统与复杂性科学 2020年1期
关键词:帖子开放式华为

单晓红,王春稳,刘晓燕,杨 娟

(北京工业大学经济与管理学院,北京 100124)

0 引言

科技和信息化的发展使得企业边界重塑,突破边界的开放式创新模式逐步被企业认可。开放式创新社区基于群体智能等信息技术发展起来,为企业开放式创新提供了智能服务平台[1],主要开展基于互联网的大众协同、大规模协作的知识资源管理与开放式创新共享活动。企业构建开放式创新社区的根本目的是鼓励用户参与企业产品创新与研发活动,并从中获取创新资源[2]。随着社区和用户的增多,信息超载导致企业无法有效全面获取用户创新知识。由于开放式创新社区用户和知识的独特性,如何挖掘用户生成内容为创新提供帮助成为企业面临的瓶颈问题。现有研究主要从用户关注点和知识模式角度对用户创新知识进行分析,大多数仅从用户需求角度开展研究,鲜有从企业创新迫切需要的外部用户、用户需求和解决方案角度综合地分析开放式创新社区知识,从而为企业创新提供更加全面和有效的支持。因此,本文提出基于知识网络的知识发现方法,从创新需求、创新方案、创新主体角度对开放式创新社区知识资源进行整合,缓解企业知识发现的复杂性问题。

目前开放式创新社区知识发现主要从用户需求角度进行研究,学者们提出不同知识发现方法分别从需求指标[3]、知识模型[4]、需求知识网络[5-6]等角度挖掘社区中核心知识和热点知识[7-9],主要将高频词和热点词看作是创新知识。然而,简单地将知识以高频词等形式进行表达无法真正满足企业创新对大量原创性、专业性、多维性和复杂性知识的需要。因此如何从更加全面的角度发现和分析开放式创新社区知识成为企业迫切需要解决的问题。

知识发现是获取知识的有效手段,知识网络是目前开放式创新社区进行知识发现的常用方法,它是一种由知识节点及关联关系组成的网状结构[10],通过知识网络将机器难以理解的文本以知识的形式表现出来。知识网络主要通过社会网络、加权网络、超网络和本体4种方式进行构建,每种方式的特点和适用性各不相同。社会网络侧重通过中心性、中心度指标,研究知识与社会行动者[11]之间的相互关系,分析网络结构对关系形成的影响,主要用于发现领域知识。加权知识网络WKN模型[5,12]侧重度量知识点的重要程度和知识间关系强度,能够直观地分析知识结构和联系特征,一般用于热点知识和关联模式的发现。超网络主要从异质性的角度将知识划分为用户主体、文本和知识元3种要素[4],主要特点是将知识主体引入网络以发现专家用户[13]。本体为知识网络的可视化提供了工具[14-15],可以使用多种语言以机器可读的方式描述知识领域内概念、关系、属性[16-17],将异质性知识以结构化方式进行表示,具有可操作性强的特点,本体中特有“类”的概念使得将不同类型知识结合成为可能,多应用于产品设计和创新知识的管理。

综上所述,目前对于开放式创新社区知识发现的研究存在以下不足:第一,知识发现仅片面地关注用户需求,但是有效的创新不仅需要来自于用户对产品偏好和期望需求的拉动,而且需要用户灵感和创意的推动,以及创新主体的能动性和潜力,只有将三者有效整合才能实现对社区创新知识的充分利用。第二,现有的开放式创新社区知识发现方法,如社会网络、超网络、加权网络,其知识表达方式难以将不同维度的知识有机整合到同一框架,不利于创新社区中碎片化知识的集成和分析。本文从知识类型的角度出发,基于开放式创新社区的用户生成内容提出利用本体构建知识网络的方法,将创新需求、创新方案和创新主体知识进行多维分析和整合,帮助企业发现用户产品需求,突破解决方案瓶颈,筛选外部创新人才,对企业开展开放式创新和知识管理具有重要意义。

1 开放式创新社区知识网络构建

1.1 开放式创新社区知识特征

与一般在线虚拟社区不同,开放式创新社区在知识主体、知识和知识发现过程上具有特殊性,为其知识发现和应用带来了挑战。

1)开放式创新社区知识主体是外部用户:根据知识创造理论,在新产品开发过程中开放式创新社区内的知识主体是企业外部用户[11],用户在参与开放式创新社区活动时所创造的用户生成内容是企业重要的资源输入。创新社区中用户行业专业背景广泛,很多用户是相关领域的专家,拥有丰富的隐性创新知识,能够为不同领域的产品研发提供创意,具有较强的创新性和专业性。将用户进行分类管理能够最大化知识主体的集体智慧以增加企业创新的预期收益。

2)知识具有内隐性、原创性、专业性和多维性[8-9,18-19]:(1)内隐性,基于长期经验高度个人化的社区知识难以编码、储存和表达,造成知识发现困难;(2)原创性,用户通过公开方式进行独立思考后真实地发布分享创新观点,因此社区知识具有较强的原创性;(3)专业性,用户拥有专业知识背景,在认知和技术层面拥有专业知识表达能力,因此社区知识具有专业性;(4)多维性,开放式创新社区知识具有多种类型。创新需求反映了用户产品特征期望、产品偏好以及产品功能推荐等信息[20],用户根据观察、感知、使用产品提出的建议,是企业产品创新人员了解产品反馈,改善新产品设计和开发的主要依据[8],因此可以看作是事实知识;用户在参与企业创新活动过程中,不仅表达需求,而且会提出有价值的解决方案,这些解决方案往往涉及专业技能、技巧等方法,在企业以“问题导向”的开放式创新过程中,会遇到很多问题,用户创新方案可以帮助企业突破创新各阶段技术瓶颈和障碍[21],因此,创新方案可以看作是技能知识;开放式创新社区中用户是创新主体和知识的来源,创新主体拥有丰富的产品使用经验以及相关的专业知识,从事不同领域的工作,并且致力于参与到企业创新过程中。创新主体是驱动开放式创新社区运行的动力,是企业汲取创新知识的来源,因此可以看作是人际知识。

3)知识发现具有复杂性:社区内用户数量剧增,涉及领域复杂多样,知识主体的知识储备不同,创新能力具有较大差距,使得识别高价值有创新能力的用户的过程具有复杂性。社区中用户生成内容具有较强的随意性、模糊性和不确定性,从海量、碎片化、高度非结构化的用户生成内容中挖掘企业创新需求和解决方案进一步增加了知识发现的难度。因此企业对创新主体、创新需求和创新方案的多方面的需求导致企业从社区中进行知识发现的过程具有复杂性。

1.2 开放式创新社区知识网络概念模型

开放式创新社区知识的特征决定了企业利用简单的词频、分类、聚类等挖掘方法不能有效地为企业提供具有创造性的知识。企业产品创新过程实际上就是新知识创造过程,新知识是隐性和显性知识交互的产物,同时也是各种类型知识整合的结果。根据开放式创新社区中用户和知识的特征,基于本体构建开放式创新社区知识网络,其概念图如图1所示。知识网络由创新需求、创新方案和创新主体构成。从知识的内隐性、多维性角度来说,本体工具可以将异质性的创新主体、创新需求和创新方案进行结构化表达,使模糊知识清晰化,易于企业产品开发使用。

图1 知识网络概念图Fig.1 Concept diagram of Knowledge network

用户生成内容(帖子)是创新主体、创新需求和创新方案的基础,帖子具有浏览数、回复数、贡献值和积分等属性,根据浏览数和回复数等属性能够实现帖子知识质量的评估。创新主体包括行业和用户,注重从不同行业的角度分析创新主体知识。其中用户包括积分和贡献值等属性,由于用户行为数据[13]可以量化创新能力,因此利用积分和贡献值等用户属性能够实现对创新主体的创新能力评估和用户分类。行业从用户生成内容中提取,体现了用户的领域特点和行业中的创新需求。创新需求真实地描述了目前存在的产品需求问题以及期待未来企业创新的产品和服务。创新方案由方案和场景组成,主要关注不同场景下,创新方案的可行性以及适用性,是企业解决瓶颈问题,探索不同创新手段和方法的参考依据。

从知识间关联关系角度来看,创新需求来自于创新主体,反映了知识的需求关系;创新主体为企业或其他用户提供创新方案,反映知识的供给关系;创新方案可以解决创新需求,反映知识的供需匹配关系。

1.3 知识网络构建

开放式创新社区知识发现流程主要包括数据采集与预处理、创新需求和创新方案提取、帖子质量和创新主体能力评价、知识网络构建4个步骤。如图2所示,首先,用户通过开放式创新平台参与企业创新,产生的用户生成内容含有大量的内隐性知识,采集社区中用户发表的帖子,主要对帖子内容碎片化后再整合,对用户行为信息进行处理。其次,针对知识集合,利用本体建模方法构建知识网络,实现创新知识可视化分析。最后,利用知识网络,从创新主体、创新需求和创新方案3个知识类型维度对企业知识进行发现整合分析,为企业在创新过程中建立企业产品方案库、产品创新需求库和外部创新人才库完成新产品创新提供知识基础。具体详细建模步骤如下:

图2 基于本体的开放式创新社区知识网络构建Fig.2 Knowledge network of open innovation community based on ontology

1.3.1 数据采集与预处理

通过Python爬虫程序,从开放式创新社区中获取文本数据和用户数据,采集的数据包括帖子内容、帖子评论数、帖子浏览数、用户贡献值、用户积分等。

1)对帖子筛选去重、删除空缺值。

2)分句。很多优秀的开放式创新社区对用户发帖有一定格式要求,以华为产品自定义社区为例,“问鼎专家”帖子要求按照以下特征词的格式进行编辑:<行业领域>、<场景描述>、<需求/困难/挑战>、<解决方案>。为了获取不同维度的知识,将用户的每个帖子按照行业、需求、场景和方案切分成不同的句子。文本分句目前主要通过正则表达式匹配进行分割,使用的分句标识是标点符号。但通过标点符号进行分句时,不能根据文本语义内容进行分割,因此本文借助帖子的格式特征词作为分句标识根据内容进行分句。

3)应用场景属性化处理。目前,应用场景的定义和界定没有统一的标准。在社区中包含场景的句子表达复杂多样,利用现有的自然语言处理技术无法有效地提取场景知识,因此通过本体建模时将场景作为帖子的属性处理,通过观察该属性可以更清晰地分析社区知识。

1.3.2 创新需求和创新方案提取

用户对同一需求的表达各不相同,因此为了识别相同含义的需求,使企业更快速过滤模糊信息从而准确地获取创新需求,将包含需求/困难/挑战的句子利用TF-IDF算法和TextRank算法相结合的方式分别提取Top-5需求文本关键词,并采用K-means方法进行文本聚类。

通过数据分析,很多帖子题目包含建立、开发、建议等特征词,是解决方案相关知识点的高度总结概括,因此从两方面对创新方案进行提取。1)通过开发、构建、系统、基于、建设、建立、研发等特征词对帖子题目进行处理,若题目中含有以上关键词则将帖子题目进行去停用词后作为方案知识。2)若不包含上述特征词,则对其包含解决方案的句子进行处理,与创新需求提取过程类似。

1.3.3 帖子质量和创新主体能力评价

社区用户发布的帖子知识含量与质量各不相同,可以用帖子评论数和浏览数进行质量评估[23],如式(1)所示。由于评论所付出的人力成本更大,所以w1

Ps=w1B+w2C

(1)

其中,Ps为帖子得分;B为浏览数;C为评论数;w1,w2分别表示对应的权重。

通过统计帖子得分,将排名前30%[7]的帖子确定为高质量帖子,并确定高质量帖子的阈值A,企业可以通过该阈值能够快速发现知识网络中高质量的帖子,方便企业对其进一步地挖掘和提取知识。

为了准确地评价用户创新能力,根据用户行为信息,选择贡献值和积分作为用户评估指标[13],利用k-means算法对用户聚类分析,将创新主体分为4类[1]:核心创新用户、核心活跃用户、普通创新用户、普通活跃用户。使企业能够有针对性地挖掘社区创新知识,更好地对企业外部用户进行管理。

1.3.4 知识网络构建

知识网络构建是实现开放式创新社区知识发现和多维分析的基础,基于本体的知识网络构建包括4种概念的定义,部分如表1所示,根据数据信息和研究目的定义5种基本类和对象属性,为进一步体现知识的专业性定义数据属性和知识间约束条件。

表1 本体知识概念定义

2 创新社区知识发现

基于构建的知识网络能够实现概括性和全局性的知识发现,较好地呈现创新社区的创新主体、创新需求、创新方案,以及创新知识的供给、需求和匹配关系,是企业全面准确把握社区知识特征,挖掘创新知识的基础,实现了全面地刻画知识的原创性、专业性和多维性,帮助企业挖掘创新需求、提供产品研发方案和寻找领域专家的目的。

2.1 创新需求发现

随着电商互联网的发展,用户的需求呈现快速多变的特点[8],新产品创新的基本前提是在产品开发之前需要充分了解用户需求,根据用户需求才能够开发用户满意、具有市场潜力、符合市场趋势的产品。

用户通过开放式创新社区参与企业创新活动,根据产品使用体验提出针对性改进意见,为了满足自身更高的产品使用体验提出新产品的创新需求,因此企业能够通过知识发现挖掘用户生成内容,发现用户创新需求。行业领域中需求数量越多,表明目前用户越关注该行业,该行业中亟待解决的问题越多,用户更有兴趣参与到该领域的知识创造过程中。同类需求提出的用户越多,表明该需求越迫切,该类需求则为企业产品研发指明了方向。因此企业应该注重从产品行业领域的角度增加更多创新活动,从而获取更多体现未来市场发展趋势的创新需求。

2.2 创新方案发现

创新方案帮助企业解决迫切需要突破的瓶颈问题,可以为企业创新提供方向和思路。基于本体的知识网络建模方法可以将创新方案和创新需求联系起来,实现知识的供需匹配。

首先,通过搜索创新需求关键词,可以发现与特定创新需求有关的创新方案,一般一个创新需求会对应多个创新方案,问题的解决往往是多种创新方案知识间相互融合的结果。其次,创新方案知识可以为企业快速提供创新思路,减少了企业制定后备方案的时间成本,这是企业整合外部资源最直接的价值体现。最后,企业创新是一种持续性活动,因此对外部用户提出的创新方案知识加以总结归纳,形成企业创新方案知识库,缩短企业内部员工方案搜索的时间,是一种减少知识浪费的有效方法。

2.3 创新主体发现

用户作为开放式创新社区的创新主体,是企业外部重要的创意来源。用户作为社区内的知识主体,识别拥有丰富知识的创新主体有助于企业选择创新伙伴,储备创新人才。核心创新用户和核心活跃用户是两类高价值创新主体,核心创新用户是企业获取创新知识的关键用户,企业应该高度重视对他们创新知识的挖掘与管理。核心活跃用户具有较强的创新积极性,在社区中属于比较活跃的用户,企业可以将管理员或者版主的职务分派给核心活跃用户,让他们带领其他非活跃用户积极参与到企业创新过程中。通过知识网络可以获取相关行业领域的创新主体,并进一步分析不同创新主体的数量,以及该领域的创新主体特征。行业领域中的核心创新用户,是该领域的专家用户,企业应该注重与核心创新用户的互动,实现产品创新的高效研发。

3 实证研究:华为产品定义社区知识发现

3.1 交通行业圈知识网络构建

本文选取华为产品定义社区作为数据来源,采集社区中交通行业圈2017年3月-2018年12月所有问鼎专家帖子作为本文的实证数据。通过数据采集及清洗、知识提取和本体建模3个步骤构建知识网络。

将评论数的权重设置为0.67,将浏览数的权重设置为0.33[7]计算帖子质量,通过分析高质量帖的阈值设置为6.95。选取贡献值和积分这两个指标对创新主体进行分类,贡献值侧重于创新主体的创新能力,而积分更侧重于创新主体的创新参与积极性。利用自然语言处理技术对帖子依次经过分句、分词、去停用词提取关键词/句,挖掘需求、方案、场景、行业、用户多维知识,形成创新需求、方案和主体知识集合。利用本体工具Protégé定义知识类、知识对象属性和知识数据属性完成整个知识网络框架的搭建。分别设置类、对象属性和数据属性的约束条件细化知识网络中各知识点之间的关联关系。如图3所示,利用OWL语言和Eclipse平台导入知识实例,最终整个华为产品定义社区交通圈知识网络中共包含2 794个创新方案,112个创新主体,59种创新需求。

图3 华为社区交通圈知识网络Fig.3 Huawei community traffic knowledge network

3.2 华为社区创新需求知识发现分析

通过知识网络呈现的方式挖掘用户意见和创新需求,将华为社区中用户生成内容从知识的角度剖析出来,共发现交通圈59种创新需求,如图4所示。分析可知,社区创新需求基本涵盖了日常生活中交通领域的所有产品需求,可以归纳为交通工具、支付方式、智能设备、交通安全4大类。华为社区交通领域中需求数量较多,表明目前用户在出行过程中遇到很多问题,存在较多的迫切需求。比如,刷卡支付仍然是目前主流的交通支付方式,然而手机支付渐渐取而代之。社区不少用户提出能否利用人脸识别技术实现交通支付,显然这是一个创新需求。从应用价值上来看,刷脸支付可以有效解决上下车拥堵问题,尤其可以大大减少乘坐地铁进出站时间,具有较高的应用价值。从技术层面上来看,人脸识别技术已经在很多领域实现应用,诸如高校图书馆,说明已经拥有核心研发技术基础。因此,华为可以抓住此类创新需求研发适用于交通行业的人脸识别系统,在创新过程中,由于创新主体对于此类产品的需求比较迫切,用户更有兴趣参与到该领域的创新活动中,企业应该注重从产品行业领域的角度发现创新需求,从而获取更多有价值的知识。

3.3 华为社区创新方案知识发现分析

选取提出创新方案较多的“闯红灯”问题,如图5所示,有较多用户提出如何解决闯红灯问题的创新需求,说明闯红灯问题已经在交通圈引起了广泛的关注,并且涉及多个行业领域,是华为亟待解决的问题。华为会针对此问题给出解决方案,此时最快捷的方式就是通过知识网络获取解决思路和方向。分析可知,用户给出了多种创新方案来解决闯红灯问题,如建立智能信号灯、设计智能斑马线、开发交通灯定时器融合系统、安装人行横道语音提示装置等,企业将这些创新方案知识进行归纳整理,制定企业创新方案,形成企业创新方案知识库,这些创新方案知识将是企业研发产品解决问题的理论基础,是突破创新瓶颈的有力保障。为了解决“中国式过马路”问题目前上海已经在主要路口安装了类似语音提示的装置,行人过马路的时候通过语音提醒行人要遵守交通规则,这说明用户的创新方案有较高的参考价值,华为可以从中获取具有创新性的启发。同样地,同一个创新方案也可以解决其他相似的需求。随着技术的发展和知识的积累,华为可以通过不断创新实现创新主体所提出的创新方案。

图4 交通圈创新需求Fig.4 Traffic circle innovation demand

图5 闯红灯创新方案(部分)Fig.5 Innovative solutions for running red lights(partial)

3.4 华为社区创新主体知识发现分析

高价值的创新主体可以从知识质量和用户行为两个角度分析,如图6所示,圆圈的大小表示帖子得分的高低,圆圈内数字表示帖子分数。首先,分析可知核心创新主体知识质量呈现两极化分布,这是由于创新主体参与华为产品创新时侧重点不同,知识含量丰富的创新主体主要从知识输出的角度参与创新,而其他用户通过提高参与次数积累活跃度,因此忽略了创新知识的表达。其次,如图7所示,通过分析用户行为数据发现华为社区两类高价值创新主体:核心创新用户和核心活跃用户。核心创新用户主要从事人脸识别、手机NFC、物联网等领域的创新活动,这些行业都需要较多的专业性知识,因此华为在有关产品开发时,可以增加与核心创新用户的互动次数,提高创新效率的同时降低了专家获取成本。核心活跃用户则主要从事交通等这些贴近生活的行业,他们的知识原创性和专业性不足,但从行为数据可知他们在参与企业活动过程中相当活跃。华为在建立圈子、总结归纳圈子信息、发布创新公告时,可以招募核心活跃用户作为管理员,辅助华为激发高价值用户的活力。

图6 帖子质量Fig.6 Post quality

其他类型知识分析过程类似,篇幅原因,不再进行一一赘述。通过创新需求、创新方案、创新主体以及它们之间的关联关系对华为社区中的用户生成内容构建创新知识网络,从而将社区中碎片化的知识进行了整合,为华为提供了全面和直观的用户知识分析,为华为有效利用开放式创新资源提供了可靠的研究思路。

图7 核心创新主体(部分)Fig.7 Core innovation subject(partial)

4 结论

本文提出一种基于知识网络的开放式创新社区知识发现方法,可以有效挖掘和整合开放式创新社区不同类型知识,为企业产品创新提供知识供给,得出如下研究结论:

1)企业在进行开放式创新时,应结合产品创新的不同阶段,明确创新需求、创新方案、创新主体,整合不同类型知识,细化知识的提取,实现对用户及其创新知识的深入分析,增加知识发现在产品创新过程中为企业带来的预期收益。

2)知识网络能够有效地将创新需求、创新方案和创新主体三者结合起来,发挥用户知识的内在价值,体现知识的专业性和多维性。首先,企业从中可以发现用户产品需求,把握市场趋势,将产品供需相结合,为用户提供更具创新性的产品和服务。其次,企业在创新过程遇到问题时,可以在社区发布需求公告,寻求用户创新方案,激发企业创新灵感,帮助企业突破瓶颈。最后,企业应该注重稳固核心创新主体,通过增加创新活动和参与机会,引导和促进用户共享知识行为,在此基础上,企业构建外部用户人才库,维护长期创新伙伴关系,持续为企业新产品开发创造新的知识。

3)通过华为的实证研究不仅验证了构建知识网络进行知识发现的有效性,还可以发现华为交通领域的创新需求:主要是研发相关智能设备,如人脸识别支付系统、交通APP开发,在满足用户个性化需求的同时提升用户出行体验;创新方案:信号灯控制,斑马线设计以及车载系统可以为企业解决闯红灯问题提供参考,结合现有方法和工具制定企业解决方案;创新主体:“风之力”、“雪兔”等是企业核心创新主体,在导航、APP等领域具有较多的知识储备,华为可以组织这些用户参与到相关领域产品研发过程中,帮助企业克服产品创新问题。

本文局限在于仅采用了华为交通圈数据,未来通过整合华为产品定义社区的知识建立完整的知识网络,为华为产品创新提供更有效的指导。研究不同企业开放式创新社区,根据社区知识特征,整合不同类型知识,使研究结论更具普适性和说服力。

猜你喜欢

帖子开放式华为
开放式数字座舱软件平台IndiGO
现在的余华为谁写作?
赛力斯华为智选SF5
小学作文开放式教学的思考
华为没有成功,只是在成长
华为
开放式弹簧机数控系统开发
暴力老妈
高等院校开放式实验教学模式的构建与探索
情事圈点