APP下载

基于知识图谱及马尔可夫逻辑网的企业画像技术研究

2021-03-07雷霭荻卢浩田

电子技术与软件工程 2021年22期
关键词:马尔可夫跳槽画像

雷霭荻 卢浩田

(成都飞机工业(集团)有限责任公司 四川省成都市 610000)

企业画像技术的运用能够对企业发展中的基本信息、社会形象、股票信息、运营情况等相关情况进行系统分析,并通过相关技术以图表的方式进行呈现,具有直观性以及高时效性的特征,通过马尔可夫逻辑网以及知识图谱的运用,能够对企业发展的相关内容进行整合,促进对企业经营情况以及行业发展详情的掌握,以此进行情感提炼与热度传播分析,以此促进企业的市场决策。

1 知识图谱及马尔可夫逻辑网

1.1 大规模企业信息采集

企业知识图谱具有较大的密度,不同类型数据之间具有较为复杂的关系,整体数据量相对较小,属于垂直领域的知识图谱。从相关网站中爬取企业发展的相关信息,包括企业高管人员信息、企业成立与发展的基本信息、企业员工信息、企业发展相关社会新闻、企业持股信息、企业招聘信息、员工教育信息以及员工社交网站中的相关信息等。对搜集到的各类信息进行隐私保护与匿名化处理,在企业信息处理中,构建相应的逻辑规则,并依据具体数据,将部分规则转化为闭原子,由此生成闭马尔可夫网,针对不同的影响要素设置相应权重,通过闭马尔可夫网对相关数据进行整理分析[1]。

1.2 企业数据统计分析

对整理的各类数据进行记录分析,分析公司产品所处的不同行业,对企业市值进行划分,分析统计员工人数或者员工工作经历,构建企业信息数据集,编写爬虫,构建企业知识库,通过大规模分布式服务器,获得企业发展的相关信息,通过对数据的预处理,得出企业发展的相关数据信息。

2 企业画像技术

2.1 三层企业知识图谱

企业知识图谱可以分为三层,最下一层为企业基本实体关系图,中间一层属于实体层,最上面则属于马尔可夫逻辑网知识层面,三层图谱从下往上逐层推进,通过数据收集与人工分析,得出当前该企业发展中不同要素之间的联系,例如员工在职与离职情况[2]。

2.2 马尔可夫逻辑网及知识学习

马尔可夫网是由变量集合所构成的联合分布模型,综合运用了统计学以及概率学等相关层面的知识,该网络体系运用过程中,针对不同的元素,绑定相应的规则,由此构建软化一阶谓词逻辑规则下的硬性约束。马尔可夫逻辑网知识学习中包括参数学习与知识学习两种类型,参数学习的常见方法有判别式结构学习、判别式结构学习,指的是在确定马尔可夫逻辑网结构之下,优化学习公式参数,运用马尔可夫逻辑网构建一个关系数据库,形成一组真值闭原子的集合。该关系中,设置了证据谓词以及查询谓词,数据库对此进行分类与整理。马尔可夫逻辑网知识学习中则构建了结构合理的网络结构。马尔可夫逻辑网属于一个概率分布,覆盖范围与设计的精确性有限,通过DSL 算法得出马尔可夫逻辑。

2.3 企业知识图谱的知识推理与实验评价方法

构建针对具体细则的一阶逻辑规则,将搜集到的相关数据转化为闭原子,构成闭马尔科夫网,进行相关权重设置,依据马尔科夫网进行相关内容的推理。本文研究中,在对企业相关内容画像时,对数据集进行分类,对数据进行交叉验证,以此判断企业与个人之间的雇佣关系。

本次研究中,数据集收集了152个谓词,主要包含的内容包括企业、员工、企业评价、社交网路平台、高管以及企业招聘等多层面信息。借助pracmln包实现了 DSL 算法,运用了马尔可夫逻辑网络,能够在 Python 脚本中使用 MLN。使用用 5 折交叉验证的的方式计算谓词对精确率-召回率曲线(AUC)下的面积。以此精准测量概率估计的质量、运用 Lazy-MC-SAT 算法综合评价企业知识学习的结果。常见的查询谓词为sameCompany、ifFriend、samePerson,通过Lazy-MC-SAT 算法的运用精准预测查询谓词的数值[3]。

3 企业画像构建与应用

3.1 企业画像内容

运用马尔可夫逻辑网、企业知识库等对企业的相关信息进行整合分析,以此全方位多角度对对企业画像。主要包括企业经营基本信息、知识产权、历史信息、企业框架分析、运营现状、运营风险、人力结构分析以及企业发展相关预测等。

基本信息主要体现为企业成立的相关信息,包括企业成立资本、发展所处地、发展类型、股东情况、工商情况以及及分支机构建立情况等。知识产权内容主要包括企业经营中的专利建设情况、作者著作权、网站经营信息、商标信息等,

历史信息体现为企业经营中的历史经营数据等,企业框架体现为企业发展中的各类信息集合、员工及其职位信息、股权情况、企业构架情况等。运营情况是企业发展中的核心信息,包括企业的融资情况、产品开发情况、市场运营情况、产品市场反馈情况以及客户关系管理等。运营风险指的是企业经营活动进行过程中可能面临的市场经营风险,较为常见的表现有行政处罚、税收违法、欠税公告、市场风险、同行风险等。

3.2 企业科研情况画像

科研情况主要体现为企业发展中的市场竞争力情况,是一个企业在新产品开发中的市场竞争优势,体现了一个企业发展中的整体创新优势,通过对企业科研情况的画像,能够反映出企业的科技创新能力。将企业科研有关的各个发展项目进行总结,绘制企业科研相关的知识图谱,通过对相关数据资料的整合分析,得出企业整体科研投入情况,从企业资金投入以及员工投入两个层面进行分析,以此对企业的科研创新情况进行综合判断。

其企业员工专业类型中,电子与计算机类专业人数占比最多,其次为经管类,第三为艺术类,第四为医学类,最后为法律类。该企业员工专业类型较为丰富,上述五个专业在企业员工类型中占比约24%。从创新层面分析,该公司计算机专业人才占比 26.2%,数值略低,在技术研发层面有较大的上升改进空间,其次为经管类人才较多,显示该企业在市场开拓、产品研发、客户管理等层面具有显著优势,整体具有较多的人才储备。

分析该公司的科研经费投入情况,通过近6年的科研投入情况分析可见,该公司在2015年具有较大的科研投入,高于2016年及2017年投入数值。近几年来公司的科研经费投入整体上均有所增加,2018年科研投入达到142.4亿美元。研发支出在经营收入中占比5.36%。可见该企业科研投入整体较高,对企业的长远发展提供了必要支持与助力。

3.3 员工对企业的评价情况基础画像

企业对员工的评价反应了一个企业员工的稳定性以及对企业的认可程度。因此应当构建员工对企业评价的基础画像。在员工对企业评价较低时,可能增加员工离职率,导致企业出现员工流失现象。运用马尔科夫逻辑网对某企业 13494 名员工对企业的评价进行数据分析,得出2011-2019年间员工工作与生活之间的平衡关系、员工对公司运营的整体评价、对企业产品及销售情况的认知、对企业文化的认可情况及员工个人发展前景等时。得出图1。

图1:某公司员工评价随年份变化折线图

从图1中能够看出,从总体表现层面,该企业员工对公司的评价呈现整体上升的局面。以每一个指标满分为5分进行计算,可见员工在对事业发展前景、工作与生活的平衡以及个人事业发展前景评价等三个指标上分值低于3分,员工整体评价不高。基于以上数值分析,要求企业将关注的重点之一放在员工对发展前景的评价层面。

要求公司发展过程中,将员工个人发展情况纳入企业整体的发展体系之中,从员工对此部分的评价不高可见,公司整体发展存在一定的改进空间,未能够达到良好的发展预期,对此要求企业采取相应的发展对策,通过多项措施有效改善员工与企业发展评价下滑的现象,以此提早预防未来可能出现的员工离职现象,以此针对员工对企业的评价情况进行画像,从而掌握员工对企业的实际评价情况。

3.4 频繁跳槽的员工推理画像

员工跳槽是企业管理与运行中的常见现象,但是不利于公司职员队伍的稳定,因此对员工跳槽情况进行研究与分析,并对此进行画像。员工跳槽对企业的不良影响主要体现在影响公司正常业务的开展,容易带走公司的发展机密,容易影响其他员工的工作情绪,容易引发公司内部出现同事或者上下级跳槽的连锁反应,容易降低公司发展的市场竞争力,增加竞争对手的发展实力。

在极端情况下,可能会给公司带来较大的损失。因此在管理过程中可以结合公司工作开展的实际情况,及时发现可能跳槽的员工,并对此采取相应的补救与防范措施。例如某公司在对员工跳槽情况的研究之后,分析出其中的影响因素及其权重。其中若一个员工同公司的朋友跳槽,则该员工存在跳槽的可能性,该因素权重2.3。若一个员工居住地发生变化,则该员工跳槽存在跳槽可能性,该因素权重 1.7。若一个员工以往工作史中频繁跳槽,则该员工在跳槽可能性,权重1.1,若一个员工对公司整体的评价不高,则该员工存在跳槽可能性,权重2.7。整理员工跳槽的相关因素,通过多项因素分析,计算出可能会跳槽的员工,通过推理计算与分析,对员工可能的跳槽行为进行分析,通过统计得出相应数据,通过知识推理得出员工跳槽的可能性情况。见图2。

图2:某公司部分跳槽员工及其就职过的公司分析图

通过对跳槽员工的推理画像,能够较为真实地反映出员工跳槽情况,以此能够有效预防员工跳槽情况,减少员工跳槽率,从而减少员工跳槽对企业发展的不良影响。

4 结束语

运用知识图谱分析企业相关情况,对企业发展的相关内容进行画像,主要从企业科研方向、员工对企业的评价以及员工频繁跳槽等层面进行分析,以此对企业发展的实际情况进行解读。通过画像,较为直观地展现企业发展的实际情况,能够促进企业合作伙伴的查找、企业发展情况分析以及企业自身发展问题的自查等,以此促进企业对自身发展情况的把握,从而以此促进企业的可持续发展。

猜你喜欢

马尔可夫跳槽画像
威猛的画像
“00后”画像
画像
保费随机且带有红利支付的复合马尔可夫二项模型
基于SOP的核电厂操纵员监视过程马尔可夫模型
我该辞职吗?
公务员跳槽是好事
忙着跳槽的人
应用马尔可夫链对品牌手机市场占有率进行预测
认知无线网络中基于隐马尔可夫预测的P-CSMA协议