面向企业技术创新风险管理的本体构建及应用探索*
2023-11-10宋姗姗钟永恒刘佳刘盼盼
宋姗姗 钟永恒 刘佳 刘盼盼
(1. 中国科学院武汉文献情报中心,武汉 430071;2. 中国科学院大学信息资源管理系,北京 100190;3. 科技大数据湖北省重点实验室,武汉 430071)
企业作为经济社会发展的核心主体和国家创新体系最活跃的组成部分,其技术创新能力对于实现科技成果转化、促进产业转型升级、推动经济高质量发展以及支撑国家科技自立自强至关重要[1],也在一定程度上塑造了企业在市场竞争中的优势地位,是企业生存的重要基础和持续发展的动力源泉。然而,技术创新作为一项高投入、长周期、低成功率的事业,具有机会与风险共生的特征,企业的技术创新进程也面临着一系列不稳定因素和未知风险,极易影响并阻碍企业的可持续发展[2]。由此可以断定,企业技术创新成败与对相关风险的管理水平密切相关,科学研判风险信息并由此建立全面的技术创新风险管理体系尤为关键。大数据环境下,风险信息是融合了不同来源与时空、不同结构与类型的复杂数据体系,如何有效组织融合这些多源异构、海量动态的风险大数据资源,从中获取和挖掘有价值的技术创新风险知识,从而支撑企业技术创新的前瞻决策便成为了值得关注的话题。
语义网的发展和知识组织技术的成熟为解决复杂的数据体系问题带来了新的转机,本体、关联数据、知识图谱等方法能够对大量非结构化的风险信息进行组织、重构和开发,为搭建更为科学、智能的风险管理模型与预警系统提供保障[3]。本体目前仍是语义网研究的热点,作为一种知识管理方法,本体在解决语义异构问题、实现数据集成和系统的互操作、促进知识表示与关联关系揭示等方面具有巨大的应用潜力。近年来基于本体的风险研究快速发展,且金融、应急、建筑、产业、环境等领域的风险管理实践取得了大量成果。为此,本文拟面向企业技术创新风险管理领域,一方面采用本体方法对相关文本资源进行概念抽取、科学表征与整合关联,促进领域知识集成、重用与共享;另一方面,探索该领域本体的实践应用价值,通过本体知识库的知识推理与发现功能,辅助企业精准识别和有效防范技术创新风险,提升企业的风险预警能力和智能化决策水平。
1 相关研究及理论基础
1.1 技术创新风险概念
技术创新概念是从20世纪50年代开始逐步从熊彼特创新理论中分化出来的,国内外众多学者基于不同的研究视角,赋予其不同的内涵。Freeman[4]从目的论角度,定义技术创新为“新产品、新过程、新系统和新服务的首次商业性转化”;Solow[5]从过程论角度,首倡技术创新“两步论”,即新思想的来源和以后各阶段的发展;傅家骥等[6]从系统论出发,提出“技术创新是包括科技、组织、商业和金融等一系列活动的综合行为”。本研究采用了系统论的观点。
基于此,学界对技术创新风险也形成了不同维度的概念释义,普遍认可的观点从风险来源角度出发,即技术创新的不确定性。谢科范[7]提出技术创新风险是“外部环境的不确定性、项目本身的难度与复杂性,以及企业自身能力的有限性所导致企业技术创新活动中止、撤销、失败或达不到预期经济技术指标的可能性”,并进一步将风险因素归纳为内部(技术、人才、资金和管理等风险)和外部(市场、政策等风险)两个层级。吴涛[8]认为技术创新风险定义至少应包含技术创新主体(企业)、客体(项目)与过程3个要素,且技术创新作为“设想→原型→中试→批量生产→市场化”的链状过程,相关风险也贯穿其中。也有研究从调查决策、技术开发、市场营销3个阶段出发进行技术创新风险研究[9],并结合技术创新风险因素开展矩阵分析[8]。综上,本研究将技术创新风险定义为:外部环境的不确定性、项目的复杂性以及企业自身能力的有限性导致的技术创新活动偏离预期目标的可能性及其损失。
1.2 风险管理理论
迄今为止,学术界对风险的定义仍没有定论,但“风险源于某种不确定性”这一认知已经被多个学科领域认可。而不确定性对目标可能会带来双向影响,所以也有研究将风险定义为“可能带来损失的事件或者环境”,即认为风险就是损失[10]。一般来说,风险因素、风险事件和风险损失构成了风险统一体,且三者之间存在一定的因果联系,即风险因素引发了风险事件,从而导致一系列风险损失。同时风险还具传染和非线性特征,即某一风险事件也可能会次生其他类型风险,所导致的风险损失也可能会产生新的风险因素,呈现出原生风险与次生风险的复合叠加效果,如图1所示。
图1 风险的构成要素及影响关系
风险管理理论的主要研究内容为风险产生特征及防控原理,全面风险管理是该理论发展的高级形式,强调“全过程”“全因素”“全员”和“全措施”的核心理念[11]。2006年《中央企业全面风险管理指引》提出初始信息收集、风险识别、风险策略制定、风险解决方案实施、风险管理的监督与改进是风险管理活动的5个实质性阶段[12],2017年美国COSO委员会(Committee of Sponsoring Organizations of the Treadway Commission)发布的《企业风险管理——整合战略与绩效》(Enterprise Risk Management:Integrating with Strategy and Performance)明确了全面风险管理的五大要素:治理与文化、战略与目标设定、绩效、审查与修订、信息沟通与报告[13]。总而言之,该理论的核心概念与流程框架可以为企业技术创新风险管理本体设计提供复用知识,同时还需关注风险的动态性和情景性特征,以便发挥本体模型的科学指导价值。
1.3 企业风险本体构建的相关研究
本体源于哲学领域,特指客观事物存在的本原,后在20世纪80年代引入信息科学和知识工程领域,用于描述“共享概念体系明确的、形式化的归约”。领域本体作为本体的重要类型之一,侧重于特定领域的共性知识描述,适用于知识参考体系以及知识复用框架的构建,典型构建方法有七步法、骨架法、TOVE法、KACTUS法、METHONTOLOGY法等。
已有企业风险领域的本体建模工作对本研究具有重要的参考价值。Peng等[14]基于大规模文献识别了企业在实施ERP(Enterprise Resource Planning)系统后的潜在风险,设计了业务风险、运营风险、组织风险和技术创新风险4个层面的风险本体;Tserng等[15]基于项目生命周期开发了项目风险本体,提取了在风险计划制定、风险识别、风险分析、风险响应和风险防控等阶段的重要概念;江小燕等[16]定义PPP(Public-Private Partnership)项目风险本体类涉及项目模式、风险类型、风险源、风险发生阶段、风险承担方、风险管理措施和风险后果。此外,风险还具有显著的情景相关性,因此也有研究从大量的风险事件案例入手实施本体建模:Yang等[17]通过设置企业基本信息、经营状况、相关人员和历史风险的资源描述框架,构建了面向风险事件的动态企业风险图谱;谢忠局等[18]将金融科技业务风险本体总结为4个超类,即风险特征、风险信息、风险等级和时期;刘政昊等[19]应用事理知识图谱构建了事件引发类型、事件演化周期、事件应急管理等金融突发事件类的结构层次;杨波等[20]提出企业风险领域本体知识库应包含风险事件、风险传播、风险类型、时间维度、空间维度和风险预防6个顶层概念。从现有研究来看,学界在企业风险本体构建方面已经积累一定的研究基础,但鲜有文献直接讨论技术创新风险这一主题。因此,本研究将在借鉴相关研究的基础上,聚焦企业技术创新风险管理实践,开展领域本体建模工作。
2 企业技术创新风险管理本体构建
遵循Gruber[21]提出的5项本体构建原则(明确性、一致性、可扩展性、最小承诺原则、最小编码偏差)开展面向企业技术创新风险管理的本体构建工作,并将其作为本体评价的主要参考标准,进而运用七步法实施构建活动。七步法是一种基于Protégé工具的本体构建方法,Protégé主要通过构建类、属性和实例来反映本体的类属结构,其应用已较为广泛和成熟。另外,企业技术创新基本等同于多个技术创新项目的集合[22],因此技术创新项目管理活动贯穿本体构建的全过程,而且领域专家智慧也至关重要,人机协同模式可以使本体获得更好的应用效果[23]。最终设计的企业技术创新风险管理本体构建流程如图2所示。
图2 企业技术创新风险管理本体构建流程
2.1 确定本体领域与范畴
依据本体构建过程,首先需要开展需求分析,确定本体领域与范畴。企业技术创新具有巨大的不确定性,传统单纯凭借人员经验知识来识别创新项目是否存在风险的方法存在数据收集效率低下、标准难以统一、对潜在风险把控不精准等问题。而且,目前的企业风险管理系统大多基于静态文本知识表示,系统功能也主要依托项目管理流程设计,忽视了非结构化的风险信息和动态风险事件的决策辅助作用,难以满足大数据环境下企业的技术创新风险管理需求。
本体模型面向企业技术创新风险管理领域,覆盖领域中的各种知识要素及其关系,主要目的在于利用科学模型指导企业开展技术创新风险管理活动,从语义层面对领域概念及其关联关系进行形式化说明,为知识在更多主体、组织、系统间的共享奠定基础[3]。同时,充分挖掘企业技术创新风险管理需求,对企业是否存在潜在技术创新风险行为进行识别与预判,规范企业技术创新风险管理体系设计,为企业相关管理人员提供循证式的风险决策支撑。
2.2 复用现有本体
由于企业技术创新风险本质上是多个风险事件的集合,在复用ABC本体模型、简单事件模型(SEM)的基础上,还借鉴了陈晓军等[24]、杨波等[20,25]提出的企业风险知识图谱的资源描述框架,得出本体模型的公共部分。ABC本体模型作为一种通用的事件本体模型,描述了时象类(Temporality)、具象类(Actuality)、抽象类(Abstraction)、地点类(Place)、时间类(Time)5个概念,以及事件类(Event)、状态类(Situation)、动作类(Action)、媒介类(Agent)等子概念之间的关系,具有概念清晰、轻量化、通用性好等优点[26]。SEM从事件的五要素出发,创建了事件与人物、时间和地点之间的关联,互操作性与灵活性较高[27]。通过复用上述模型可以为企业技术创新风险管理领域的本体构建提供结构化的表示形式,促进其与同领域内本体之间的知识互联与交互映射。
2.3 抽取领域核心概念
为了更好地扩充本体模型与表达领域知识结构特点,从多源异构的信息资源出发,广泛收集现有企业技术创新风险管理领域知识,用来抽取核心概念和梳理专业词汇,并将其对应到上述模型之中,对于无法匹配的概念则考虑在本体模型中添加新的类。
面向企业技术创新风险管理领域,选择了相关学术论文、科技政策、科创板企业招股说明书和年报等为信息源,借鉴梁娜等[28]提出的基于三重维度的企业风险信息抽取方法,采用改进的jieba分词工具等挖掘概念要素,并基于STKOS超级科技词表中的科技术语进行资源补充,以此获取领域概念集合及其属性关系。同时广泛收集相关风险事件的新闻报道、企业风险案例、技术创新项目风险评估报告和应急预案等,将深度学习方法的BiLSTM-CRF模型用于概念抽取任务,形成可复用的技术创新风险语料库。为保证知识的有效共享,结合相似度计算和人工校对方式进行实体消歧,确定本体中的核心概念。在继承ABC本体模型的基础上,对领域概念抽取结果进行了大致归类。部分概念抽取结果如表1所示。
表1 领域概念抽取结果(部分)
2.4 定义类及类的层次结构
基于风险管理理论涉及的关键概念和定义名称以及所抽取的领域核心概念清单,扩展ABC本体模型,实现对企业技术创新风险信息的概念化描述。在风险管理框架和领域专家的指导下,确定类的规范化表示和层次结构,最终创建了企业技术创新风险管理本体模型的8个超类和相应子类,如图3所示。
图3 企业技术创新风险管理本体模型的类及类的层级结构
(1)技术创新主体(Enterprise):ABC本体Actuality的子类Agent。企业是技术创新主体,依据其在年报“公司简介”中的信息披露格式,设置了基本情况、人员队伍、主营业务3个子类。
(2)技术创新项目(Project):由ABC本体的Actuality拓展而来。依照国家税务总局对企业研发项目类型的描述,企业的技术创新项目既可以是自主研发形式,也可以是委托研发、合作研发、集中研发以及以上方式的组合形式[29]。其中,自主研发形式面临的风险最大,但企业可以掌握整个技术创新活动的主导权,且拥有创新成果的完整知识产权。
(3)技术创新活动(Activity):由ABC本体的Actuality拓展而来。从过程论视角考察企业技术创新活动,可以将其划分为研究决策、技术开发、产品测试、生产制造和市场营销5个阶段,这是企业研发成果价值不断提升的过程,且失败率在各活动阶段不尽相同。
(4)技术创新风险因素(Risk factor):由ABC本体的Actuality拓展而来。风险因素引起或增加风险事件发生可能性或提升损失程度。根据技术创新风险的普遍定义可知,企业技术创新风险有技术、财务、人力、生产、管理、市场、政策7个类型,具体表现形式如技术成熟度低、项目资金不足、技术人才流失、难以批量生产、管理者经验不足等,如表2所示。
表2 企业技术创新风险因素及其表现形式
(5)技术创新风险事件(Risk event):ABC本体Temporality的子类Event。风险事件是使潜在的风险因素转化为现实损失的条件,是风险因素与风险损失之间的桥梁。结合SEM和风险的情景特征,界定技术创新风险事件的关键在于对其时间维度、主体维度、情境维度、传播维度信息的描述[20]。
(6)技术创新风险损失(Risk impact):ABC本体Temporality的子类Situation。技术创新风险事件与风险损失是一对多的关系,即一个风险事件可能导致多个损失结果,具体以“名词+动词”形式描述。技术创新风险事件带来的损失可分为直接损失和间接损失两种:直接损失是实质损失,例如项目终止、项目经费损失、人力成本浪费等;间接损失是派生损失,例如责任损失、口碑下降、市场竞争优势减弱、营业业绩下滑等。
(7)技术创新风险等级(Risk level):由ABC本体Abstraction拓展而来。一般依据风险发生概率(不太可能、偶然、可能、很可能)和损失程度(一般、较大、重大、特大)综合判定风险等级,依据风险矩阵的不同组合,可以将技术创新风险等级归纳为低、中、较高、极高4个子类。
(8)技术创新风险防范策略(Prevention measure):ABC本体Temporality的子类Action。对应技术创新风险的三维防范体系[11],可将风险防范策略概括为主体防范、社会分摊和政府防护,且每个策略又涉及了一系列的具体防范措施,可采用“动词+名词”的形式表示,例如增强风险意识、引进风险投资、购买科技保险、申请专利保护等。
2.5 定义类的属性及属性分面
属性是本体表达语义的关键,其不仅可以对类的各方面情况作出详细说明,还可以揭示类与类之间错综复杂的语义关联,使本体模型更具系统性和结构性。Protégé工具将属性划分为对象型和数据型两种。鉴于此,定义的企业技术创新风险管理本体模型主要属性如图4所示。
图4 企业技术创新风险管理本体模型的类的属性定义
(1)数据属性表示的是类和数据之间的数值关系,是对类的详细信息描述。以技术创新主体为例,其基本情况维度的数据属性包括企业证券代码、名称、注册时间、所在地,人员队伍维度的数据属性包括员工规模、研发人员规模,主营业务维度的数据属性包括行业类别、研发技术及产品,其中行业类别参照中国证监会发布的《上市公司行业分类指引》划分[30]。对于技术创新风险事件,时间维度的数据属性为开始时间、结束时间、持续时间,主体维度的数据属性为影响群体,情境维度的数据属性为事件描述、项目信息、活动信息,传播维度的数据属性为风险来源等。
(2)对象属性表示的是两个类之间显性和隐性的语义关联关系。例如:企业作为技术创新项目的责任主体可用“in_charge_of”表示,技术创新项目包含技术创新活动可以用“has_activity”来表达,技术创新活动和技术创新风险损失中存在的风险因素可以表示为“has_factor”,风险因素引发风险事件导致风险损失这一过程可以分别用“cause_risk”和“has_impact”连接,针对风险事件采取相应的防范策略则可以表示为“has_measure”。
属性分面定义即是对属性的性质和特征的说明,包含值类型、容许的值、基数数量等,一个属性可能会拥有多个分面特征。Protégé工具提供的属性类型包括字符型、时间型、数值型、布尔型等。以技术创新主体为例,其名称和行业类别的取值类型为字符型、注册时间和员工规模为数字型。而在描述技术创新风险等级时,发生概率和损失程度通常会有固定的多个类别,因此需要在容许的值和基数数量中进行设置。
2.6 创建本体实例
为实现对企业技术创新风险领域知识的有效揭示,在本体模型基础上添加实例,通过可视化的方式展示企业技术创新风险管理本体模型的应用情况,同时检验模型中是否存在语义冲突或矛盾的知识。选取2021年“百奥泰研发ADC药物失败”这一案例,首先大量获取该事件发生后企业官网和各新闻网站发布的相关报道,创建实例集;然后对这些非结构化文本进行信息标注与抽取,并将结果整合到所构建的本体类之中;最后利用Protégé工具开展本体实例化,共形成了80个实例,且经Protégé推理机检验得到该模型并无逻辑错误,实例可视化结果见图5。
图5 企业技术创新风险管理本体模型的实例表示(部分)
百奥泰是一家以创新药和生物类似药研发为核心的创新型生物制药企业。2021年,百奥泰披露抗肿瘤新药BAT8001的三期临床主要疗效指标未达到预设的优效目标,决定终止该项目的临床试验,此后又宣布终止新药BAT8003和BAT1306的临床开发。披露信息显示,上述项目累计投入超过3.36亿元,研发失败对公司的核心竞争力、日常经营和资金募集都产生了一定负面影响,失败原因在于市场存在同质化竞争的进度风险以及企业自身战略布局存在缺陷[31]。与此同时,百奥泰长期获得政府研发补助,涉及生物产业研发奖励资金、新药临床研究补助、知识产权资助等,补助可在一定程度上帮助其走出技术创新困境。
2.7 本体评价
本体构建不是一蹴而就的,而是一个反复迭代与螺旋上升的过程,因此本体评价必不可少。鉴于该领域本体重在指导企业技术创新风险管理实践,在本体评价上,除了要统筹考虑本体的结构和功能外,还需要尽可能满足预期的应用场景需求。为此,采用了专家评价和任务评价相结合的方法:专家主要参与本体的结构评价(本体命名明确、类和关系丰富等)与功能评价(类和关系的适用性、本体描述语言的逻辑性等);任务评价重在检验本体的一致性和可用性。通过上文的本体实例可以看出,所提模型能够清晰描述“百奥泰研发ADC药物失败”事件,较好完成了企业技术创新风险事件的知识组织任务。
结合本体构建原则和企业技术创新风险特点,设计了具体的评价指标体系(见表3),并与湖北省5位高新技术产业专家进行面谈。首先阐释了该本体的开发需求、主要概念以及构建流程,征询专家意见;随后发放本体评价的调查问卷,问卷采用李克特五级量表的方式组织,即1分表示完全不同意、2分表示比较不同意、3分表示一般同意、4分表示比较同意、5分表示完全同意;最后结合专家访谈建议和问卷评分结果进行本体调整优化。由表3可以看出,该本体在可扩展性和最小承诺原则下的评分较低,表明本体中定义的类和属性还不够丰富,扩展到不同行业领域的技术创新风险管理实践的可能性不高。
表3 企业技术创新风险管理本体模型的评价指标体系及评价结果
3 企业技术创新风险管理本体应用
为了有效运用该模型对领域知识进行组织与场景化应用,设计了涵盖事实库、规则库和案例库的本体知识库原型系统,用来统一描述企业技术创新风险管理领域的事实知识、推理规则和相关案例,从而将领域知识转化为计算机可识别、理解和推理的形式,实现企业技术创新风险信息检索、量化评估和智能预测等知识服务功能,辅助企业进行动态精准化的技术创新风险决策。本体知识库原型系统结构如图6所示。
图6 企业技术创新风险管理的本体知识库原型系统
3.1 基于语义匹配的风险信息检索
现有企业风险管理系统普遍存在信息关联性不足、难以准确获取用户需求等问题,因而将所构建的本体模型嵌入企业风险管理系统,在一定程度上实现对于相关风险信息在语义层面的揭示,进而结合语义匹配算法与用户需求关联。即当用户在知识库中给定自然语言问题时,系统后台会自动对用户需求进行语义解析和概念扩展,将其转换为结构化查询语句,依据设置好的规则和算法与知识库中储存的信息进行匹配,并为用户反馈查询结果的统计与可视化内容,便于用户快速发现风险的复杂关联特征,同时将衍生的新知识储存在知识库中[32]。若系统未匹配到相关结果,则需要借助知识推理功能或调动领域专家力量开展解析,同时记录该条需求及其解决方案。
语义检索的核心在于查询规则的构建和理解,运用Protégé工具的SPARQL Query功能,可以实现对本体知识库中所有三元组的查询。此外,该信息检索功能在考虑概念层级结构的基础上,还可以添加基于语义相似的匹配算法,其实质是将风险查询(Query)和风险信息(Concept)的文本内容表示为统一的数学向量模型,并通过计算两者在向量空间的余弦距离来衡量语义相似度,相似度阈值可以根据实际需求进行测试调整,以免遗漏重要的风险信息,计算方式如式(1)所示。
式中:Q代表风险查询向量,C代表风险信息向量;Qi表示Q在第i个维度上的分量,Ci表示C在第i个维度上的分量,即每一维语素的值。
3.2 基于风险指标的风险量化评估
将企业存在的风险隐患予以有效揭示、量化评估和平稳处置,是企业日常业务监管的重要任务之一。基于此,在知识库中可设立企业技术创新风险指标和风险触发预警规则:一方面,通过获取企业结构化数据、文本实体数据和文本特征数据等,实时计算和更新企业各个风险指标的量化结果,构建综合评估模型和企业风险画像;另一方面,基于预警规则的先验性逻辑,实现对企业技术创新风险事件的全景描述并提出预警建议[33]。
为开展对企业技术创新项目的风险评估,可以在分析技术专利、产品销售、研发投入等数据基础上,引入本体知识库构建文本评估指标,综合衡量风险的发生概率和损失程度,并依据计算结果划分风险等级。首先通过提取案例库中的相关风险案例列表,以历史发生频次代表风险发生概率,风险案例相似度的计算方法可以参考江小燕等[34]的研究,即先依据本体类提取风险案例的文本指标,进而运用最近祖先法分别计算各指标的相似度结果,最后开展加权处理。其次在衡量风险损失程度方面,不同企业的风险容忍度差异较大,因而可以结合历史风险损失与专家打分的方法量化风险损失程度。最后综合两者得出风险等级。此外,案例信息的检索结果可能分布在多个不同的风险类型之下,通过可视化风险评估结果,还可以进一步了解风险的整体分布状况,由此确定企业对技术创新风险的监管重点和防御方向。
3.3 基于知识推理的风险智能预测
知识推理是指从已有知识出发,借助本体公理或逻辑规则(Rules),深入挖掘与发现知识库所蕴含的复杂隐性知识和新的关联知识等[35]。实现该知识服务功能的关键在于定义事实推理规则,知识库储存的大量案例实例为事实规则抽取提供了良好数据基础,加上机器学习算法和领域专家的深度参与,可整合形成企业技术创新风险预测的事实规则库。
基于知识推理的企业技术创新风险预测可以采用Protégé工具的推理引擎Drools实现。Drools可以将本体知识库中的事实和规则关联起来,以获取具体问题的解决方案,同时将推理的新知识在知识库中存储。面向企业技术创新风险管理领域,当用户以实例形式在本体知识库中输入企业的风险信息时,Drools会自动搜索相匹配的推理规则完成语义推理,在一定程度上实现风险因素分析、风险事件链补充、风险指数计算、防范策略填充等,同时支持对风险事件的原因、损失、处理策略及连带影响的查询。本研究在推理规则表达上采用了语义网规则语言(Semantic Web Rule Language,SWRL),其主要形式为IF conditions THEN actions结构,以此确保案例知识与推理结果之间的语义交互,部分SWRL推理规则示例如表4所示。例如,在“百奥泰研发ADC药物失败”本体实例化后,可以发现该风险事件源于技术不成熟、技术难度大和市场竞争力不强,百奥泰可以对照该类型风险事件的防控措施,减轻风险影响。另外,本体知识库可以将该案例以个性化推荐方式提供给其他相似企业,满足其防控新药研发风险的需求。
4 结语
企业在进行技术创新风险管理时需要收集和组织大量数据资源和风险案例,构建起全面、动态、协同的技术创新风险管理体系,并运用科学的风险管理方法和工具实现对风险的有效管控。但在大数据时代,风险管理领域的文本呈现出海量碎片化和多源异构的特点,风险管理“信息孤岛”“模式割裂”和“溯源困难”等问题亟待突破。对此,本研究面向企业技术创新风险管理领域,利用文本挖掘技术进行领域概念抽取与表示,基于类和属性进行本体构建与实例展示,实现对该领域知识的结构化组织,最后提出构建企业技术创新风险管理本体知识库作为数据驱动风险决策的系统支撑,可满足风险信息检索、风险量化评估和风险智能预测的需求。
构建的本体旨在促进企业技术创新风险管理领域概念间的语义关联,对文本深层次的内容描述与表示还存在明显不足,类和关系的定义还不够完全,且所使用的语料范围较窄,可扩展性不强。因此,未来有必要选取更加广泛全面的数据,设计适用性和可扩展性更强的知识抽取方法,高效、准确地获得高质量的领域概念抽取结果,使本体模型呈现螺旋上升的进化趋势。此外,还应重视本体模型对时间、空间等复杂语义的表达,深入探索技术创新风险事件的时序演化和空间关联规律,并进一步结合知识图谱、深度学习等技术,构建与系统化应用较大体量的三元组实例知识库,更好地发挥语义技术在赋能企业技术创新风险防控中的重要价值。