基于技术同心多元化的企业研发合作伙伴识别与选择
——以中药企业为例
2021-04-02丁文晴马俊红袁红梅
崔 晶,丁文晴,马俊红,袁红梅
(沈阳药科大学工商管理学院,辽宁沈阳 110016)
随着市场和技术的迅速发展,单纯依靠企业内部研发的传统做法面临着技术和业务的双重挑战[1]。技术创新具有高投入、高风险和知识结构复杂等诸多特点,加之产品生命周期缩短,顾客需求的多样性变化,单个创新主体难以拥有创新所需的全部知识资源[2]。为此,企业亟需与外界进行合作。研发合作作为一种开放式创新形式,鼓励企业与其他创新主体合作开展研发活动,积极获取新的、互补的知识与资源,提高企业的核心竞争力,以应对激烈的竞争和复杂的市场变化[3-4]。鉴于研发合作存在种种优势,研发合作伙伴的选择也变得至关重要。然而,正如顾客存在多样的个性化需求,企业对于合作伙伴的需求也因其发展战略的不同而产生变化。基于技术能力的同心多元化,是指与现有技术相关的核心能力的再生产,是一种扩展业务领域、降低研发成本的有效策略[5]。因此,本研究提出一个识别最佳研发合作伙伴的流程与框架,以满足企业基于技术同心多元化发展的需求。
1 文献综述
现有研究对合作伙伴的选择过程主要分为识别候选合作伙伴和选择最佳合作伙伴两个阶段[6]。由于选择合作伙伴是一个目标驱动的过程[7],因此不同的研究从不同的角度出发进行候选合作伙伴的识别,如Song 等[8]考虑到合作伙伴之间的资源匹配度,提出了一种基于专利组合的方法来评估潜在的R&D合作伙伴;汪雪峰等[9]通过“主语—行为—宾语”(SAO)分析挖掘具有相似研发目标的机构,分析其互相合作的可能性及可能的合作方向;Park 等[10]基于技术相似性,利用书目耦合分析和潜在语义分析提出了一个探索R&D 合作伙伴的框架;吴菲菲等[11]构建了企业跨产业研发合作伙伴选择模型,为企业识别跨产业的合作对象。在确定最佳合作伙伴方面,学者一般采用指标综合评价法以及专家意见法辅助进行选择,如Geum 等[12]从技术实力、研发开放性、研发联系和协作效果等方面构建了14 个专利指标以确定最佳的研发合作伙伴;曹勇等[13]采用专家意见赋权方法对候选者的专利组合价值进行排名以选择R&D 合作伙伴;吴菲菲等[11]利用熵权Topsis 模型确定最优的研发合作伙伴;Kang 等[14]提出了相似专利密度指数为企业识别最佳的产学合作伙伴。
但是上述研究都忽视了一个问题,即建立合作的动机是多种多样的,因此影响合作的因素也是有所不同的[15]。例如,如果一个组织的动机是基于共享研发活动的成本或增强其现有技术能力,那么具有类似研究背景的组织是更合适的选择,但是如果组织想要学习新技术或填补技术空白,则拥有互补技术的组织更适合[16]。因此,不同的企业因现阶段发展战略的不同,其对于合作伙伴的需求也是不同的,而对于一些试图尝试多元化发展的企业来说,基于技术相似性的合作伙伴选择方法可能是不适合的。故而基于已有文献存在的不足,本研究尝试提供一个有效合理的框架,从企业的现有技术能力和研发资源出发,基于技术能力同心多元化进行研发合作伙伴的选择,以帮助企业实现高效的多元化发展。
2 研究设计
2.1 研究框架
本研究提出一种基于技术同心多元化的企业研发合作伙伴识别与选择的框架与方法。首先利用关联规则挖掘目标企业的同心多元化技术领域,然后利用潜在狄利克雷分配(latent Dirichlet allocation,LDA)主题建模对候选研发合作伙伴的专利内容进行文本挖掘,将其划分为不同的技术主题,最后构建包括专业能力和合作能力两个维度的专利评价体系对候选者进行评估,以确定每个技术主题下的最佳合作伙伴。与以往研究不同,本研究提出了一个全新的框架(见图1),从目标企业的核心能力和技术资源出发,探索其有可能多元化发展的研发方向,并初步确定候选研发合作伙伴;从每个候选合作伙伴的专利内容出发,确定每个候选者的研发重点与所属技术主题;从候选者的专业能力和合作能力出发,最终确定每个技术主题的最佳合作伙伴。以期为目标企业定制可发展的技术方向和确定可开展研发合作的最佳伙伴,助力企业实现高效、长远发展。
图1 本研究设计框架
2.2 研究方法
2.2.1 关联规则
关联规则挖掘也称为“市场篮子分析”,是一种无监督的数据挖掘技术,从给定的数据集中发现项目之间的重要关系[17]。这种方法起源于对客户交易数据库的研究,以确定购买的商品之间的关联。Apriori 是关联规则的核心算法,通过扫描事务中的各个项目,构建项目间的频繁项集;设置支持度(support)、置信度(confidence)、提升度(lift)等指标用于筛选高频项目集,满足各最小阈值的频繁项目集即为关联规则。将关联规则应用到专利文本中时,可以参考市场营销案例,将一件专利看作是一个“购物篮”,专利的IPC 号码看作是购物篮中的“商品”,对整个“交易数据库”进行关联规则挖掘,就可以得到频繁出现的专利IPC 号。关联规则挖掘已被广泛应用于技术与创新管理领域,以捕获技术之间的关系,如苗红等[18]基于关联规则与信息熵探索技术融合的趋势;Kim 等[19]利用关联规则和链路预测挖掘企业产品级别的同心多元化潜在领域。本研究利用目标企业的专利数据,以IPC 分类号和专利申请号(P)构建P-IPC 矩阵,运用IBM SPSS Modeler 18.0 中的Apriori 算法进行关联规则挖掘,以确定目标企业的同心多元化技术领域,并根据关联规则挖掘结果再次进行专利检索,选择专利授权量排名靠前的专利申请人,将其确定为目标企业技术能力同心多元化的潜在合作伙伴。
2.2.2 LDA 主题建模
主题模型是一种使用概率的产生式模型来挖掘文本主题的新方法。LDA 是Blei 等[20]在2003年提出的一种统计主题模型,是近年发展起来的一种重要的提取潜在主题的建模方法。其基本假设为:每篇文档可看作若干主题的混合分布,而每个主题又可表示为关于单词的概率分布。因此可以将隐含主题看作词汇的概率分布(topic-word),单个文档可表示为这些隐含主题的概率分布(doc-topic)。这种假设也有利于大规模数据处理中的空间降维,即把文档投射到主题空间。为了更加具体全面地了解候选研发合作伙伴的主要研究领域和研究主题,本研究利用LDA 主题建模分析其专利内容。首先,从候选研发合作伙伴的专利数据抽取标题和摘要构成语料库,利用Python 语言编写代码进行LDA 主题建模;然后,由于专利文档中存在大量的无意义词以及特殊符号,为了提高结果的准确度,构建停用词表及自定义词典,借助中文分词工具——jieba 分词对语料库进行分词,并采用TF-IDF(term frequency-inverse document frequency)算法构建词频向量;最后,通过结合困惑度指数及专家意见来确定适宜的主题数目,并根据文档-主题的概率分布将每件专利划分到相应的技术主题下,实现按照研究主题对候选合作伙伴进行分类。
2.2.3 专利指标评价
一个适宜的研发合作对象不仅应在领域内具有专业的技术能力和知识基础,而且需要有与他人进行合作的能力和意识。故为了识别每个技术主题下的企业最佳研发合作伙伴,综合考虑合作伙伴的专业能力和合作能力是十分必要的。本研究借鉴Geum等[12]的研究构建专利评价指标体系对潜在合作伙伴进行评估(见表1),并采用熵权Topsis 法对每个二级评价指标进行处理,根据专业能力和技术合作能力的熵权值将所有候选合作伙伴映射到二维空间,遴选处于第一象限内专业能力和合作能力较强的候选合作伙伴作为该技术主题下的最佳合作伙伴。
对企业候选研发合作伙伴的专业能力从3 个维度进行评价:(1)技术距离,用来衡量目标企业与候选者之间技术基础的相似程度。用不同主体的专利主IPC 分类号代表其技术领域,如果目标企业与候选者之间的共同技术领域数量占两者技术领域总数的比值越大,则表明目标企业与候选者的技术距离越近,两者所拥有的技术越相似。(2)技术影响力。专利通过被引证对未来技术作出贡献而展现其技术影响力。如果在某技术主题专利被引次数前10%的专利中,候选者的专利所占比例较高,则表明该候选者在该技术主题下的技术影响力较高。(3)技术专业化,可以衡量候选者对某技术主题的投入与重视程度。用该候选者在某技术主题下专利数量占所有候选者专利数量的比值来衡量。
对企业候选研发合作伙伴的合作能力也从3 个维度进行评价:(1)技术开放性,以了解候选者发生知识转移的能力。用候选者平均共有专利权的数量来衡量,其值越高,表明该主体的技术开放性更高,更有可能与外界发生合作。(2)技术流动性,用以衡量目标企业与候选者之间的技术流动情况。表示为目标企业后向引用候选者专利的平均次数与目标企业平均后向专利引用数量的比值。(3)技术重要性。一项专利的被引次数越高,表明其技术在领域内所处地位越重要。相应的,候选合作伙伴的技术重要性表示为,目标企业专利对候选者专利的平均引用次数与该候选者专利的平均被引次数的比值,该比值越高,证明候选者的技术对目标企业更加重要。
表1 企业最佳研发合作伙伴选择指标及其具体含义
表1 (续)
3 实证研究
医药产业是具有高技术依托性的高科技产业,其创造成果倾向于通过专利进行知识产权保护;而中药作为中华民族的瑰宝,其传承与发展也面临着新的挑战。我国具有数目众多的中药企业,但这些企业大多规模较小,生产能力和研发资源都非常有限[21]。故而,本研究将上述方法用于我国中药企业进行实证分析,为其选择研发合作伙伴提供可参考的方案,助力我国中药产业实现创新发展。
选择天士力控股集团有限公司(以下简称“天士力”)作为目标企业。天士力是以大健康产业为主线,以制药业为中心,包括现代中药、化学药、生物制药和保健品、健康食品等,涵盖科研、种植、提取、制剂、营销等领域的高科技企业集团。从IncoPat 专利数据库检索天士力的所有申请发明专利,检索结果共计1 256 件(以下简称“样本专利”),检索时间截止到2019年11月22日。
3.1 挖掘目标企业同心多元化技术领域
首先,针对天士力的专利数据,利用excel 构建专利-专利分类号矩阵。由于IPC 全8 位信息过于重视技术细节,难以反映技术的群体特征,故而本研究采用大组级别IPC 构建矩阵,每件专利出现某个IPC 记为1,未出现记为0。具体矩阵示例如表2 所示。然后将专利-专利分类号矩阵导入SPSS Modeler 软件中,运行Apriori 算法进行关联规则分析,设置最低支持度阈值为4、最低置信度阈值为60%,共生成57 条规则,其中生成的支持度和置信度较高的规则如表3 所示。
表2 样本专利的专利-专利分类号矩阵示例
由表3 可知,天士力的主要研发重点在A61K36(含有来自藻类、苔藓、真菌或植物或其派生物,例如传统草药的未确定结构的药物制剂)、A61P9(治疗心血管系统疾病的药物)两个技术领域上,这个结果也与天士力的发展现状相符。天士力独家开发研制的主要用于预防和治疗心血管疾病的复方丹参滴丸,成为全球首例完成FDA Ⅲ期临床研究的复方中药制剂。
表3 样本专利的关联规则部分结果
3.2 识别候选合作伙伴
根据关联规则挖掘结果,将上述得到的IPC 对以“OR”的形式连接生成检索式,再次到IncoPat专利数据库中进行检索,限定专利申请人类型为企业、大学或科研机构,选取申请量排名靠前的50 家企业和20 家大学或科研机构,共70 家机构作为目标企业的候选研发合作伙伴,检索所有候选合作伙伴的授权专利共有6 207 件,检索时间为2019年11月27日。部分候选研发合作伙伴识别结果如表4 所示。
表4 天士力候选研发合作伙伴识别结果(部分)
表4 (续)
3.3 划分技术主题
为了更加全面具体地确定天士力潜在研发合作伙伴的现有研究主题,利用LDA 主题建模对样本专利内容进行文本挖掘。依照以上所述步骤,构建停用词表和自定义词典,运用jieba 分词工具对候选研发合作伙伴专利的标题和摘要进行预处理,利用python 语言进行LDA 主题建模,并结合困惑度指数和医药产业分类确定主题数量为5,建模结果如表5所示。
表5 天士力潜在合作伙伴LDA 主题建模结果
3.4 确定最佳合作伙伴
接下来,对每个主题下的候选者从专业能力和合作能力进行综合评价,并利用Topsis 熵权法计算出专业能力和合作能力的熵值。天士力的子公司——天士力之骄药业有限公司,以系列心脑血管中药冻干粉针、水针和大输液等剂型为重点,采用国际上最先进生产工艺技术和最新型的产品包装技术致力于中药现代化发展,因此,本研究仅选择技术主题4(脂质体冻干粉及其制备方法)下的合作伙伴进行后续的证明与论述,其余主题过程不再赘述。主题4 下天士力的所有候选研发合作伙伴的评价结果如表6 所示,其中每个候选机构的名称用阿拉伯数字代替。
表6 主题4 下天士力候选研发合作伙伴评价结果
表6 (续)
根据表6,将技术主题4 下天士力的所有候选机构映射到二维空间(见图2),并根据其评价结果的平均值分成4 个象限,其中出现在第一象限的机构为最佳研发合作伙伴。由图2 可知,主题4 下天士力的最佳研发合作伙伴有8 个,分别是上海医药工业研究院、齐鲁制药有限公司、沈阳药科大学、中国药科大学、山东罗欣药业集团股份有限公司(以下简称“罗欣药业”)、山东绿叶制药有限公司、中山大学、南京正大天晴制药有限公司。
图2 主题4 下天士力最佳候选研发合作伙伴评估的象限分布
由表7 可以看出,沈阳药科大学专业能力和合作能力的平均熵值最高,说明其在这两方面都具有良好的表现。因此,在脂质体冻干粉及其制备这一研究方向,天士力可考虑与沈阳药科大学进行合作,以实现企业中药产品向现代化发展。
表7 主题4 下天士力最佳候选研发合作伙伴评价指标熵值
4 结论与建议
不断进行技术研发、开发新产品和拓展新市场是企业在激烈的竞争环境中保持竞争优势的关键因素,但是企业往往因为自身资源有限以及市场的不确定性而难以拓展新的业务领域,故而为了降低拓展市场的风险,企业需进行同心多元化发展,并与拥有相应专业能力和合作能力的创新主体进行合作,以谋得高效共赢发展。本研究基于寻找满足企业技术能力同心多元化发展的合作伙伴,为企业扩展多元化市场及增强现有技术能力提供了一个有效的理论框架与实现方法:从企业的现有技术能力、研发资源及其发展需求出发,为其定制可多元化发展的技术领域和确定可开展研发合作的适宜对象;此外使用专利数据及Topsis 熵权法进行最佳合作伙伴的识别,有效减少了对专家的依赖;通过LDA 主题建模识别了候选合作伙伴的技术主题,可有效降低合作风险、提高合作效益。并结合中药企业天士力控股集团有限公司进行实证分析,表明该方法具有一定的理论意义和实用价值。
由于基于企业技术同心多元化的研发合作伙伴选择研究尚开始探索,故可能存在一定的不足之处,建议未来可以从以下几个方面进行深入研究:(1)结合其他类型的数据对候选合作伙伴进行综合评价;(2)利用LDA 主题模型对专利内容进行文本挖掘存在一定的误差,可以考虑使用ATM(作者-主题)模型使结果更加准确;(3)综合考虑市场、产品数据进一步挖掘目标企业的同心多元化领域。