众包研发的应用场景构建关键点与绩效模拟分析
2017-05-30陆平曹茜芮陈笑天
陆平 曹茜芮 陈笑天
摘 要:在数字经济发展的大趋势下,越来越多的企业选择把过去由内部人员承担的研发任务,以自由自愿的方式交给大众来完成。在众包研发典型案例分析基础上,总结出众包研发模式的四大应用场景,即众包竞赛场景、社区生产场景、知识管理场景、碎片整合场景。为进一步研究众包研发场景构建的关键点,构建了NK适应度景观模型对不同场景进行模拟。结果表明:任务知识交互度越高,创新绩效潜力越大;众包研发协同网络的构建,有利于提升任务求解速度;个体创新动力越大,产生最大适应度方案所需的时间越少。建议应在高知识交互度领域推广众包研发模式,探索开放式知识产权许可制度,强化平台的创新供需对接功能,完善信任机制以防范安全风险。
关键词:众包研发;数字经济;应用场景
中图分类号:F715;F274 文献标识码:A 文章编号:2095-7866 (2017) 06-001-009
工业经济论坛 URL: http//www.iereview.com.cn DOI: 10.11970/j.issn.2095-7866.2017.06.001
一、众包研发的兴起背景
1.众包研发兴起原因
在数字经济时代,互联网的发展使众包研发成为可能[1]。互联网跨越时间、空间和社会阶级,使得不同种类的群体能够打破在现实中的各类障碍,众包研发的任务分发和竞争能够在更加广泛的领域中进行。除此之外,还有三个重要原因:
(1)开源共享降低了创新资源调动成本。互联网数字经济大幅度降低交流成本并提升交流便捷程度的同时,科学研究团队的入门门槛也随着科研设备设施和知识的成本降低和获取便捷度提升而降低。随着国家一系列推动创新的措施逐渐展开,科研院所设备设施共享、众创空间公共服务机构等低成本使用高端闲置仪器给予众包团队更高的自由度,各类低成本设计、运算软件在网络的普及,也使众包研发团队拥有在设计上更优更低成本的灵活性与多样性。
(2)大规模教育形成了广泛高素质人口。长期以来的大规模高等教育使社会上有大量的拥有较高素养的受教育人口,这为广泛产生的创客团队提供了充足的人才供给。大量处于生产一线和科研一线的技术人员拥有新颖的创新点以及支撑创新点的技术,能够为众包提供理论与实践结合的专业化研究团队。
(3)梯次化需求营造了广泛的市场空间。我国正处于从不平衡发展的工业体系向智能化的工业体系转变时期,由于工业网络庞大、技术分枝多、发展水平差异大等原因,我国创新需求密集且多样化,无论是已经实现智能化的高端生产商还是依然在半手工加工的低端生产商都,具有改造提升的需求,梯次化需求给予了不同技术水准的众包研发市场空间。
2.众包研发兴起意义
众包研发在数字经济时代具有独特的优势,典型的如可以产生颠覆式创新,能够拥有在一些场景下较高的效率以及更为广泛的资源调动能力。
众包在数字经济时代可以产生颠覆式创新。由于众包研发所采取的跨部门、跨学科、跨产业乃至跨领域的创新方式[2],有利于促成不同知识和学科的碰撞和启发。以往的研发活动多属于部门内的线性研发,人员的学科背景比较单一、熟悉的领域也较聚焦,在面对新问题时下意识的沿着老路径“水多加面,面多加水”,整个技术系统难有架构上的突破。众包研发的科研团队并不是指定的人群,任何有解决分包问题能力的科研团队甚至个人都可以承担研发任务,易于促成不同学科、不同知识及不同技术的“头脑风暴”,最终排列组合成为全新的颠覆性解决方案。相比美国解决颠覆性创新问题的多学科联合研究机构美国国防高级研究计划局(DARPA),众包模式完全打破了机构、学科甚至学术地位的各种限制,完全实现“能者上”的目标,相互启发和碰撞的范围更广、频率更高,更容易产生颠覆式成果。
众包在数字经济时代拥有一些场景下的高效率。研发任务可以被快速的处理、分割、打包,且利用互联网络可以便捷地展示、谈判和分发。传统的科研任务分解分发时领导需要考虑人员能力、时间分配、转接水平和协作契合度以及各方的利益分割,众包则可以尽可能科学地将任务分割成几个包含完整任务逻辑的工作分包,不用考虑公平性和人员等问题,仅需要关注效率;同时,由于是在互联网上市场化抓取任务分包,领导需要考虑的效率问题转移到各个众包团队负责人身上,由于负责人更加了解且更容易调动自己的团队,因此比领导直接分配效率更高。由于是面向全网络发布任务包,接手任务包的是更广义的空间范围中的最适合该任务的团队,因为比在研究机构内部选拔范围广,效率自然相对要高。众包在数字经济时代是具有高性价比。相对人员福利、员工的各项保障和长期工资,众包研发模式对企业而言廉价的多,且众包的承包商为了相互竞争往往在价格或服务质量上下功夫,相比正式员工有时体现出的推诿和懈怠,众包团队的技术水平和对前沿的跟踪程度都更优。众包团队的优势是问题导向,在没有問题的时候则不由研发发起部门保有科研队伍,这有利于消除科研院所大而全、小而全的倾向,避免重复的保有同质化的科研团队,能够有效降低整个科研系统的维持成本。
众包在数字经济时代拥有更为宽泛快捷的资源调动能力。由于互联网空间的无边界性和无隔阂性,数字时代的众包研发方式调动的资源远大于研发承担单位内部资源量,且资源的深度和广度都更胜一筹。以往传统的研究机构,日常的人员和资源调动范围大多于科室内,至多扩至机构内,要调动更广泛的资源,往往需要向上一级机构请示,这一定程度上造成了学科间甚至机构间的隐形壁垒。美国为了打破此类隐形壁垒,建立了DARPA,通过将各个领域的专家集中在一个机构中,并打乱统属来打破隐形壁垒。众包研发时刻动员着全网的闲暇科研资源,以互联网将全科研体系的可用科研资源都集中在一起,完全无学科界限、无派系属性、无上下高低,以达到研究分包目的为唯一的考评结果进行任意的排列组合,其调动的是全科研体系的资源,对于每个分包,其承接者所处的领域必然是相符度相对综合性科研工作者更高的专业人员。众包经济还打破了一般的科研协同模式,采取即时发送分包即时竞争的方式,绕开了传统的竞标、政府采购、审核、层层行政批文、各级合同等繁琐过程,使整个创新的起步过程更加快捷高效。
二、众包研发模式的四类典型应用场景
1.众包竞赛场景——挖掘跨领域创新潜力
竞赛场景是指某企业为解决某项难题或实现某创新,利用互联网发布任务需求,并明确竞赛的截止日期、奖金池、奖励方式等,大众自由决定是否参与竞赛。该场景有利于突破原有的知识体系和框架,产生跨领域颠覆式创新。Merck制药公司曾在Kaggle众包平台发起过一项预测药物活性的挑战赛,参赛者需根据15种药物数据预测其生物活性,悬赏金额达到40000美元。该挑战赛吸引了全球238个团队参赛,获得了2500多个解决方案,经过评选,多伦多大学的5人研发团队最终胜出。该团队采用机器学习算法,突破了药企一直沿用的不同种类化合物的穷举测试方法。ImageNet则是每年举办大规模视觉识别挑战赛,Alex等应用深度卷积神经网络将机器图像识别的错误率由26%降至15.4%。在众包竞赛的推动下,近年来更为有效的深度学习构架相继被提出,2016年ImageNet大赛冠军解决方案的图像识别能力已超越人类,2017年的ImageNet挑战赛将转到Kaggle平台。
2.社区生产场景——大众生成内容和消费
社区生产场景是一种介于市场与企业之间的组织形式。在该场景中,由大众生成内容并消费产品。以Threadless众包服装生产为例。大众参与者可以在平台上下载T恤的设计模板和相应的设计软件,设计方案完成后提交给平台,平台组织大众对这些设计方案的潜在购买意愿进行投票,每周平台选择5个排名靠前的交付制造厂商生产,并给设计者提供2000美元现金奖励和500美元奖品,每件T恤上会标明设计者的名字。如果该版式T恤成为畅销品再次交付生产,该设计者还能获得每轮500美元的现金奖励。Goldcorp(加拿大的一个采矿公司)采用真实矿区数据在互联网上构建了一个虚拟矿区平台,并向大众公开其勘探过程,大众在平台上注册后下载软件和数据库,模拟探矿虚拟场景。该挑战赛成功吸引了1400位“虚拟探矿者”参赛,这些参赛者标示出了110多个勘测目标,其中有50%是研发部门未曾发现的新目标,探明的黄金储量超过了800万盎司。
3.知识管理场景——降低公共管理成本
为了提升公共服务水平,公共管理部门可借助大众智慧创新公共管理。在公众专利评审方面,美国积累了大量经验,早在2007年,美国专利商标局(USTPO)与纽约法学院(NYLS)就联合推出了“公众专利评审”平台,该平台允许公众参与专利审查过程。USTPO在获得专利申请人同意公开审查意见后,将专利申请文档传给NYLS,之后NYLS将专利申请文档上传至“公众专利评审”平台,在公众评议期间,平台将组织由公众组成的审查小组进行审查。在挖掘公共数据价值方面,美国华盛顿哥伦比亚特区曾举办“民主应用程序大赛”,并向参赛者公开了该城市的公共数据,最终获得超过47款应用程序。本次挑战赛的总预算约5万美元,如果政府委托企业来开发这些公共应用程序,其成本大约220万美元,总收益率达到了40多倍。这个过程仅持续一个月,缩减了相关人员的调研时间、撰写可行性报告及审查的时间。2014年,北京市在政务数据开放的基础上,举办了一次政务数据资源网应用创意大赛,吸引了103支参赛队伍,收获了86个创意方案,涉及公益、健康管理、公用交通及招生就业等多个领域。
4.碎片整合场景——汇聚大众闲置精力
为了充分利用大众的碎片化闲置精力,需要将待解决的问题进行分解与变换。一种方法是把待解决的问题嵌入人们的日常活动,使日常琐碎的活动焕发出新价值。reCAPTCHA平台将验证码图片替换成待识别字符,在用户需要输入验证码时分别显示两个词,其中之一是系统已知答案的,而另一个是需要借用人类识别能力去辨识的,只有用户把系统已知答案的字符输入正确的情形下,才会记录用户对另一个字符的辨识结果。利用这种模式,该平台借助大众力量在几个月内便完成了《纽约时报》百年存档古籍的数字化工作。Google也采用这种模式解读那些难以通过机器辨识的地图街道名及号码。另一种方法是将待解决的问题变换成一个大众易于上手的小游戏,参与者利用零碎时间在玩游戏的过程中也为科学探索贡献了自己的力量。Foldit把探寻RNA三维形状实验设计成面向大众的游戏,参与者在玩游戏的同时也在远程执行真实的实验,验证RNA分子折叠理论的相关预测。
三、众包研发应用场景构建的关键点
1.众包研发场景的共性特征
根据上述的众包竞赛、社区生产、知识管理、碎片整合应用场景,可以总结出以下几点共性特征:一是众包研发任务涉及多领域的知识交叉和交互,并且在事前不限定解决方案的知识空间;二是众包任务通常是由为数众多的异质性个体所完成,异质性主要体现在个体拥有千差万别的知识结构;三是创新活动的本质在于大量个体在知识空间中的搜索行为,知识交互和搜索行为会对研发绩效(适应度)造成影响;四是创新活动中的个体之间存在某种研发网络关系,这种网络关系也会对创新绩效产生影响。
2.眾包研发模式的虚拟计算实验
为了进一步研究上述关键共性因素对众包研发绩效的影响,可以借鉴生物进化过程,把为数众多的知识领域看作成“知识基因”,接受众包任务的个体拥有不同的知识基因组合,并且知识基因之间存在交互影响,某项众包任务相当于个体(基因组)追求更高适应度的过程。NK模型[3]最早用于研究生物基因的进化,已有一些学者将其引入经济社会学领域,我们利用NK模型构建了众包研发的模拟实验平台。NK模型中的N是基因组中的等位基因数量,K是基因之间的交互程度(0≤K≤N-1)。各等位基因的适应度取决于其自身基因状态以及影响该基因的其它K个基因的状态,基因组的综合适应度等于N个等位基因适应度的均值。为简化,通常假设每个等位基因有两种状态(0或1),基因在每种状态下的适应度是[0, 1]范围内的随机值,例如某个体用到了某领域专项知识,则设置该知识基因的状态为1。这些适应度构成了一个适应度景观(创新空间),个体(基因组)想要获得更高的适应度,需要在这个空间中不断地探索,有一种探索方式是个体每次仅改变一个基因状态(相当于使用或不使用某专项知识),如果改变后的基因组适应度有所提高,那么意味着这次改变有利于提升自身适应度,予以保留。如果基因组状态不再发生改变,演化处于均衡状态。
为比较各类因素对众包研发绩效(适应度)的影响,对NK模型的参数进行设定(见表1),对应三类关键因素,分别有2、3、3种参数取值情况,于是组合成了18种(2×3×3种)情景假设。采用Repast仿真工具箱搭建模拟计算实验环境,为使得结果较为可靠,我们针对每个情景进行了8000次模拟实验,共计做了14.4万次模拟实验。
3.众包研发应用场景构建的关键点
(1)任务知识交互度越高,创新绩效的提升潜力越大
情景s1至s9为高交互度情景,s10至s18为低交互度情景,为了剔除其他因素对研发绩效(适应度)造成的影响,把18种情景模拟结果进行两两对比。从图2中可得,在较高的知识交互度情景下,众包研发的创新绩效(适应度)普遍高于低知识交互情景。这意味着随着知识交互程度越高,创新空间变得更加起伏不平,出现局部极值的可能性越高,个体通过不断探索自身周边邻域,有可能获得较高的适应度。
为判断模拟结果之间的差异是否显著,需要进一步采用独立样本t检验,检验结果表明统计上显著地拒绝原假设,这意味着高低知识交互度对创新绩效(适应度)影响结果存在显著差别。
(2)众包研发协同网络构建,有利于提升任务求解速度
图3中比较了无关联、全连接及小世界网络对任务求解速度的影响。研究结果表明,对于知识交互程度较高的众包研发任务(情景s1至s9),在全连接网络模式下的任务求解时间要低于小世界网络和无连接情景,在小世界网络模式下的任务求解时间要低于无连接情景。而对于知识交互程度不高的众包研发任务(情景s10至s18),建立研发协同网络对于提升任务求解速度的促进作用则不那么明显。由此可见,建立研发协同网络能够提升任务求解速度,尤其是对于那些知识交互程度较高的研发任务。
(3)个体内在创新主动力越大,产生最大适应度方案所需的时间越少
个体在创新空间中的搜索行为体现了个体创新主动力,动力越强劲,则该个体越会更为积极地探寻其邻域,从而找到适应度更高的位置。图3中比较了个体采用变异近邻、邻域搜索、贪婪搜索等策略对任务求解速度的影响。研究结果表明,个体采用邻域搜索、贪婪搜索策略模式下的任务求解时间较低,并且离散程度较小,这意味着个体创新的主动力越大,这些个体中所产生的最大适应度方案用时越短。
成功的众包项目通常依赖于活跃和忠诚的虚拟社区,多层次激励以维持大众新鲜感。在吸引人们积极参与项目之前,需要理解人们参与的动机,但动机往往千差万别。有的参与者可能是想证明自己的技能水平,有的想成为舆论的焦点,有的想找到自身与前沿技术之间的差距,有的想获得金钱上的激励。国内一些众包平台的业务数量虽不断攀升,但主要以低端任务为主,难以满足高端人才的自我实现需求。由于大众参与动机呈现多样性,众包项目仅采用低层次的物质激励方式是不够的,激励需要满足马斯洛需求理论的五类层次。
(4)平台化有利于汇聚更加广泛的大众创新资源
众包研发本质上作为一种跨越专业界限、跨越社会分工界限的创新协作平台,发挥着社区功能、竞赛功能及组织合作功能。社区功能依赖于相同或不同领域的专业或非专业人士的交流,进而实现知识共享。某个机构或个人可通过在平台上发起竞赛,以增强众包研发活动的靶向性,提高创新效率。众包研发平台上的某一用户可向其他用户发起邀约,迅速组建创新团队。
四、促进我国众包研发模式应用的对策建议
1. 在知识交互程度较高的领域推广众包研发模式
眾包研发的优势在于能够将大范围知识领域(知识之间存在交互影响)的寻优问题转化成多个局部知识领域的寻优问题。大众具有异质性和多样化优势,在解决跨领域问题时,其表现通常要优于专家,如Lakhani[5]的研究表明,InnoCentive众包平台上用户的自身专业与问题所属专业的距离越远,则成功解决方案就越有可能产生。不过,要将大众智慧发挥出来,必须满足以下几个条件:一是待求解的问题所涉及的知识领域广泛,并且知识之间存在交互影响,企业内部难以用单一思路解决,需要借助众多“外脑”的力量;二是众包项目的参与者具备解决某类问题的能力,即其表达个体知识的能力不受限制;三是需要借助平台客观公正地将个体贡献进行加总或排序。
2. 强化平台的创新供需对接功能
众包研发平台通常将众包社区中任务发布者的收益最大化,或吸引大众参与程度作为绩效指标。众包研发平台更应从需求和供给两个维度发挥创新供需对接功能,从而最大程度地减少“群体性失效”和供需错配,众包项目发起者往往要面对大量的解决方案供给者,通过提高创新供需匹配效率及评审质量,能够在海量解决方案中筛选出优秀方案,从而发掘引领未来技术创新的新方向。与传统的一对一合作不同,在开放式的众包创新模式中,某项创新问题会被多个参与者同时解决,产生多个解决方案。这就需建立客观公正的评价机制,对参与者提供的方案进行准确评估,将所有符合标准的解决方案均提交给发布者,确保每一有效方案提供者都可以得到事先约定的奖励,防范发布者不支付承诺的奖励或不合理支付。
3. 任务模块化匹配大众闲置精力
为了促使大众合力解决复杂问题,需要将复杂问题转化为任务,并将任务按照模块化分解(或转化),进而与大众闲置精力相匹配。以软件众包平台(TopCoder)运作为例。在项目发起时,平台会根据项目特点进行任务分解,这项工作仅需要平台的少数员工完成。在设计环节,社区成员根据自身能力申请相应项目,平台组织大众成立评估委员会对各成员提供的设计方案进行评估,并选出各部分较优秀的设计方案。在审核和测试环节,平台发起大众对该程序进行检验测试,反复上述过程多次后,最终将成果交付客户。
4. 探索开放式的知识产权许可制度
在开放式众包知识产权许可制度下,大众智慧创造出来的成果专利可以由大众共享,允许他人对该成果进行改进,也允许利用该成果从事商业产品开发,仅需要尊重原著作权。例如,借鉴BSD开源协议,创意使用者需要尊重原作者的著作权,它允许使用者修改和重新发布作品,也允许其从事商业开发、发布和销售,仅需包含原许可协议声明。在GPL协议下,若某创意产品使用了GPL协议产品,则该创意产品必须也采用,这意味着该创意必须是开源的,即开源的传染性。
5. 完善信任机制以防范安全风险
完善众包平台自治规则,提高平台对侵权行为的发现能力和惩罚力度,建立由众包平台、第三方信用服务企业、政府等多方参与的联合信任机制。加强平台与平台、政府与平台的信用数据共享,强化对失信行为的联合惩罚力度,降低供需双方的信任成本。在第三方信用服务方面,应打破不同平台之间的边界,实现跨平台收集信任数据。
参考文献
[1] 徐航. 企业创新的众包研发探索[J]. 互联网经济, 2016(Z2):20-25.
[2] 黄娜, 覃正, 吴珍华. 众包研发网络:概念、模式与研究展望[J]. 科技进步与对策, 2015(17):12-16.
[3] Kauffman S A. The Origins of Order: Self-Organization and Selection in Evolution[J]. Journal of Evolutionary Biology, 1993, 13(1):133-144.
[4] Natalicchio A, Petruzzelli A M, Garavelli A C. Innovation problems and search for solutions in crowdsourcing platforms – A simulation approach[J]. Technovation, 2017.
[5] KarimLakhani, Garvin D A, Eric Lonstein. TopCoder (A): Developing Software through Crowdsourcing[J]. Social Science Electronic Publishing, 2011.