高校IT运维知识图谱构建及应用
2023-06-25李建青
摘 要:针对高校IT运维中出现的效率低下和服务不佳问题,文章研究设计了基于知识图谱的IT运维总体架构。通过分析运维对象、运维服务流程、运维数据、采集分析处理、运维管理等模块,构建了IT运维问答知识图谱,实现了运维场景和孤立知识点的业务应用关联,基于Neo4j和Python技术开发了IT运维问答系统,解决了运维效率低下和服务质量不佳的问题。
关键词:知识图谱;IT运维;问答系统
中图分类号:TP391 文献标识码:A 文章编号:2096-4706(2023)07-0001-06
Abstract: Aiming at the problems of inefficiency and poor service in IT operation and maintenance in colleges and universities, this paper studies and designs the overall architecture of IT operation and maintenance based on knowledge graph. Through analyzing the operation and maintenance objects, operation and maintenance service processes, operation and maintenance data, collection, analysis and processing, operation and maintenance management and other modules, the IT operation and maintenance Q&A knowledge graph is constructed, and the business application association between operation and maintenance scenarios and isolated knowledge points is realized. The IT operation and maintenance Q&A system is developed based on Neo4j and Python technology, which solves the problems of low operation and maintenance efficiency and poor service quality.
Keywords: knowledge graph; IT operation and maintenance; Q&A system
0 引 言
国家教育信息化的深入实施,加速了高校智慧校园建设的步伐[1]。以笔者所在校为例,目前该校已实现宿舍区、教学办公区及室外活动区网络全覆盖,身份认证实现一体化;学校教学、科研、管理和服务的系统建设及数据资源完成整合和集成,构建了统一的门户和校级大数据;学校业务移动化建设已完成各项业务及流程向手机端的迁移,基于大数据的学生、教师画像及分析决策逐步完成。随之产生的问题是学校IT运维工作量加大,学校网络设施、大数据、PC和移动门户、网站群、网办大厅业务系统,办事办公流程等软硬件维护、系统维护、网站维护、数据维护、流程维护在面向3万学生、2 000教工的服务中愈显不足,服务方式落后和服务时间的过长导致师生不满意度逐步上升,學校需要投入更多的人力来应对全校师生提出的各类维护需求及服务。受于事业单位人事制度的限制,学校存在IT运维服务扩大和IT人员编制紧张的矛盾,虽然通过人员兼职和学生助学的解决部分问题,但由于人员流动及数据隐私等情况,仍需探寻更佳的IT运维方案。
知识图谱作为人工智能的重要基石,一直是学术界和工业界的热点,广泛应用于电商、医疗、金融等领域[2,3]。本文尝试将知识图谱引入IT运维领域,将其作为核心探索IT运维总体架构的构建,在此基础上,探讨IT运维知识图谱的构建。基于知识图谱的IT运维体系,能将各孤立知识点通过业务环节串联后形成一个业务知识链条,为各类系统运维人员提供解决方案参考,也会提升运维效率及用户满意度[4]。同时,本文构建的IT运维知识图谱作为一种基础数据服务,为学校上层智能应用提供数据支撑,也为后续建设强大的智能运维体系提供支撑。
考虑到学校师生员工提出的很多问题及服务需求具有重复性,大部分可直接回复或一键式解决[5-8]。作为IT运维知识图谱的应用实例,本文基于Python+neo4j搭建了问答系统,作为人工客服的有益补充,能减缓一线运维人员的工作强度和压力,提高运维效率和质量。
1 IT运维总体架构
1.1 IT运维概念
IT运维管理,是指IT部门采用相关的方法、技术、手段、流程、制度和文档等,对IT软硬运行环境、IT业务系统和IT运维人员进行的综合管理[9,10]。
IT运维对象包括硬件设备、服务应用、业务系统、网络、机房动力设施、布线和运维对象采集的数据和各类日志等;运维管理涉及网络拓扑、设备、应用服务、数据存储、业务系统、目录内容、资源资产、信息安全、IT服务、流程等。
1.2 IT运维平台架构设计
IT运维平台总体架构采用分层设计,自上而下分别是统一运维门户、IT运维管理层、知识图谱方法和算法层、数据层、运维对象及数据采集层,如图1所示。
1.2.1 统一运维门户
统一运维门户是系统功能实现、人机交互的窗口,可通过大屏、3D、PC、手机等方式展现;展示内容包含业务、应用、网络、流量、巡检报告、实时监控等。
1.2.2 IT运维管理层
运维管理层实现了平台所有的业务管理功能,负责处理运维门户提出的所有服务请求,这一层中的配置部分包含了模块配置、流程引擎、分派规则管理、工作时间管理、报表设置、输出表单、集成接口和数据管理等功能,满足运维业务各种流程的管理应用和环境应用配置。
1.2.3 算法能力层
算法能力层是所有运维业务管理功能实现的算法支撑,是根据系统逻辑需要,基于知识图谱方法和数据层实现的实体三元组抽取、推理过程。基本算法有:基于规则词典和统计机器学校的实体抽取;基于马尔可夫逻辑网和深层隐含的关系抽取;基于规则与启发式算法的属性抽取;基于语义相似度和链接预测的文本相似度计算;基于传统概率模型和机器学习的实体对齐算法;基于语法语义抽取、聚类和模式匹配与分布相似度的知识加工方法;基于逻辑和图的知识推理方法等。
1.2.4 数据层
数据层是整个运维管理的基础支撑平台,包含结构化数据和非(半)结构化数据。结构化数据有基础配置数据、工单数据、CMDB数据、信息资产数据、拓扑数据、实时运行和历史数据、流程数据、环境和告警数据、业务和性能数据、案例库等;非(半)结构化数据有自助方法、实施细则、故障分析报告、故障处置预案、异常处置手册、运行管理规定、事件恢复方案、问题解决方案、操作手册与说明书、制度与规程等。
非(半)结构化数据经过实体三元组抽取,与结构化数据(整合第三方数据库)进行实体对齐,再经过本体构建和质量评估,以Neo4j图数据库存储系列运维知识图谱:概念图谱、设备实体图谱、业务逻辑图谱、案例图谱、应用图谱、解决方案图谱、组织架构图谱等。
1.2.5 运维对象及数据采集层
运维对象及数据采集层实现数据采集的全过程控制和采集数据的加工处理。在这一层,可采用K-means等聚类算法实现对监控项峰值的分类,建立预警等级划分;采用网络发现算法实现网络拓扑图;采用Nagios等开源监控系统,实现网络服务、主机可用资源和运行状态、故障、日志、主机冗余等监控功能;通过数据挖掘等数学方法,生成最佳预警方案;分析设备监控信息,生成设备性能报表;采用均方差模型,进行资源统计分析;通过聚类分析等算法,发现设备间影响依赖关系,挖掘最佳故障解决方案。
2 IT运维知识图谱构建
知识图谱构建是IT智能化运维的基础,也是核心问题之一。IT运维知识图谱属于领域知识图谱,可遵循通用知识图谱构建流程与框架,采取自顶向下的构建模式。首先,基于经过整合和底层采集的数据设计IT运维知识图谱本体,将结构化和非(半)结构化的知识通过一定的框架联系起来;然后通过信息抽取和融合技术,将实体和运维关系从原始数据中分离出来,按本体框架连接成知识图的表示形式;最后运用知识推理技术,现有知识图谱不断产生新的知识,为预测和推断服务提供支持。
2.1 知识图谱定义
知识图谱本质上是一种大型、结构化的语义知识库,以符号形式描述客观世界的概念实体事件及其之间的关系[11]。通俗讲:知识图谱是由实体、关系和属性组成的一种数据结构。
2.2 知识图谱构建
2.2.1 IT运维本体
IT运维本体包括实体类型、实体的属性类型及实体间的关系类型,即表示图结构的抽象概念结构类。IT运维知识图谱本体覆盖“用户—网络—硬件—数据—软件—服务进程”“问题—分类—工单—故障—变更—配置—知识”“用户—IT设施—场所”“设备—设备—软件—数据库—组件—知识”等连接、安装、推送、包含、访问、并列、因果、偶然的复杂、多元和多路径交互关系。
2.2.2 IT运维实体构建
IT运维知识图谱知识实体类型主要有:网管软件、数据库、中间件、统一身份认证、应用软件、业务系统、公共平台、网络安全设备、机房、IT场所、网络、预警、告警、巡检、问题、操作、故障、工单、知识、配置、资源、脚本、数据采集、监控、网络服务、事件、变更、任务、基础设施、分类、状态等。
为便于知识的统一表达理解和外部数据的融合消歧,不同类型实体的属性描述须遵从相关约束。IT运维知识图谱实体属性主要有:名称、别名、编号、版本、节点、秒请求、秒处理、并发会话、连接、缓存命中率、可用性、慢查询、阻塞、死锁、响应请求、队列、收包、发包、最大值、打开文件、Follow、Znode、Watch、密码、角色、组、权限、部门、IP、MAC、CPU核、位置、人员、操作、部门、地址、服务、CPU、内存、使用率、方向、丢包率、级别、进度、记录、下载、操作、动作、事件、申报、程度、姓名、手机、电话、邮件、活动、方法、知识、满意度、建议、通知、流程、备注、故障、详情、任务、型号、规格、原则、推送、频繁度、重要性、权值、匹配度、分数、日期、推荐、标题、附件、路径、数量、评论、收录、关键字、事务、日志、操作、报警、预警、申请、描述、操作系统、存储、网络、磁盘、流量、效率、通知、阈值、故障、合同、网址、厂商、组件、产品、状态、模块、时间、形式、方案、内容、审核、机房、预警、告警、巡检、问题、操作、工单、知识、配置、资源、脚本、协议、事件、变更、设备、类型、状态、分析、报表、报告、自助方法、手册、制度规程、案例、说明、脚本、软件、教程等数据定义。
2.2.3 IT运维知识图谱实体关系构建
实体类型定义将描述运维实体特征的相关信息形成孤立的知识节点,但这些节点间无语义关系,无法进行语义搜索及语义路径推理分析。本文通过分析、提取IT运维管理体系、运维技术架构、运维服务流程及运维文档中的线索逻辑关系,构建了IT运维知识图谱实体关系集合。
IT运维知识图谱的实体关系覆盖了“网络—硬件—数据—软件—组件—服务进程”“用户—问题—分类—工单—故障—变更—配置—知识”及“用户—IT设施—场所”之间的连接、访问、安装、推送、执行、组成、创建及描述等多路径交互关系。比如:运维架构相关的:网络—(构成、包含)—设备、设备—(连接)—设备、设备—(安装)—数据库、软件、IT设施—(位于)—场所、用户—(使用)—IT设施、设备、设备—(推送)—知识、软件—(执行)—服务进程、软件—(访问)—数据库—(包含)—组件、IT组件—(连接)—IT组件、服务器—(连接)—网络设备、服务器—(组成)—处理器,内存,硬盘,进程,服务,网卡、网络设备—(组成)—接口、CPU、内存、电源、风扇、温度、应用、中间件、数据库—(使用)—主机系统、IT服务(OA、网办大厅、网站群、统一身份认证、WELINK)—(使用)—IT组件(交换机、服务器、数据库、中间件、存储、应用系统);运维服务相关的:问题—(属于)—分类、问题—(创建)—工单、工单—(描述)—故障、故障—(涉及)变更、变更—(实施)配置、问题—(查询)—知识、故障—(相关)—软件、硬件、故障—(提出)—问题—(申请)—变更、问题—(升级)—故障、事件—(并列、因果、偶然)—事件、方案、案例—(存储)—知识、IT服务(OA、网办大厅、网站群、统一身份认证、WELINK)—(涉及)—機构、人员、角色;网络拓扑相关的:网络拓扑—(包含)—服务器、网络设备—(运行)—应用系统、业务系统—(包含)—监控—(目标)—终端、端口、链路、访问流量、上网行为等。
2.3 知识融合、加工及更新
在知识和数据正式进入知识图谱前,为避免知识重复和名称歧义,需要对所有知识数据进行去重、消歧、梳理及审核等加工处理,最终才能为运维所用。以后随着业务需求和系统功能的变化,知识图谱的知识数据也要相应进行调整和更新。
3 应用实例
3.1 IT运维问答知识图谱构建
由于在高校运维和项目实施中积累了大量的知识、经验、方案、流程、模板、详细设计、操作手册等资料,本文对这些积累在项目及技术顾问等个人手中的资料文档进行整理、规范及知识提取后构建了IT运维问答知识图谱。
基于学校具体业务需求和实际业务问题问答运维的需要,本文构建的问答知识图谱包含7个实体类型,6个关系类型和8个主属性,如图2示。运行语句:“MATCH (m)-[r]-(n) return m,r,n”后,问答知识图谱如图3所示。
运行语句:“MATCH (m:Keywords)<- [r:key_words]-(n:Maintenance) where m.name ='OA移动' return distinct n.name, n.desc, n.instructions, n.department,n.telephone, n.cause, n.area, n.correlation”,得到关于移动办公设置的相关描述内容,如图4所示。
3.2 IT运维问答实现
本文基于3.1构建的问答知识图谱,采用Python+neo4j,开发了IT运维问答系统,实现了学校师生经常咨询的关于校园网、统一门户登录、网站建设、PC应用门户、移动应用门户、网办大厅等一类常用业务如何设置、使用及办理的问答。
3.2.1 问答流程
知识图谱问答方法可采用基于规则模板的方法和基于深度学习的方法,本文综合两种方法,对问答系统进行了设计,流程如图5所示。
在问答流程中,首先建立本体库和用户词典,用户发出提问后,问答系统对问句分词、向量化后与用户词典、本体库进行匹配,将问句中直接匹配识别出或运用语义相似度算法识别出的实体类型和用户关键词进行提取,之后对问题进行分类。本文建立了8种问句类型,通过提取问句中的疑问词与用户疑问词分类词典匹配后实现分类。问答系统基于分类后提取的实体类别和实体进行解析后生成本体三元组,据此构建Cyper语句进行描述,然后发送Cyper语句到neo4j图数据库查询。然后将查询返回数据与系统匹配提取的答案模板进行整合,将最终解答回复给用户。
3.2.2 问答系统实现
本文基于3.1建立的问答知识图谱,采用上述问答流程和方法,开发了问答系统,界面如图6所示。高校师生只需在界面下方文本框中输入自己需要解答的问题,点击“SENT”提交后,系统立即给出答复。如系统匹配不到问题相关内容的答复,会给出友好提示,转向人工服务。
4 结 论
针对高校IT运维量加大与IT运维人员编制不足的矛盾问题,本文探讨了基于知识图谱的IT运维总体架构。该架构采用分层设计,自上而下分别是统一运维门户、IT运维管理层、知识图谱方法和算法层、数据层、运维对象及数据采集层。在此基础上,本文通过分析运维对象、运维服务流程、运维数据及其采集分析处理、运维管理模块等内容,构建了IT运维知识图谱:包含IT运维场景中涉及的软件、硬件、服务、流程、知识等30个实体类型、140个主属性、30个实体关系类型。知识图谱作为架构的核心,为整个运维体系提供数据和算法支撑,推进了IT运维自动化、智能化的进程。
作为应用实例,本文结合学校具体业务,构建了IT运维问答知识图谱,包含7个实体类型,6个关系类型和8个主属性。在问答知识图谱基础上,本文采用Neo4j和Python等技术开发了问答系统,实现了师生常用业务的咨询问答功能,是学校人工客服的有益补充。
参考文献:
[1] 贾志伟,秦铭谦,林勤.高校信息化运维服务模式与应用实践 [J].现代信息科技,2020,4(14):134-136.
[2] 钱双双.金融领域的知识图谱构建与应用 [D].杭州:浙江工业大学,2020.
[3] 王倩玉.领域知识图谱构建及其在财务审计的应用 [D].南京:南京审计大学,2019.
[4] 徐增林,盛泳潘,贺丽荣,等.知识图谱技术综述 [J].电子科技大学学报,2016,4(45):589-605.
[5] 巩宇,李碧薇,李德華,等.基于知识图谱的电力设备故障知识库构建方法 [J].计算机科学与技术,2021(7):72-77.
[6] 乔振浩.基于知识图谱的问答系统研究与应用 [D].哈尔滨:哈尔滨工业大学,2020.
[7] 张崇宇.基于知识图谱的自动问答系统的应用研究与实现 [D].北京:北京邮电大学,2019.
[8] 王鑫雷.基于中文知识图谱的问答系统研究 [D].大连:大连理工大学,2021.
[9] 吴慧韫.国内外高校IT运维发展状况 [J].中国教育网络,2015(7):34-36.
[10] 蒋正亮.高校IT运维知识库的业务模型设计与实现 [D].广州:暨南大学,2016.
[11] 田玲,张谨川,张晋豪,等.知识图谱综述—表示、构建、推理与知识超图理论 [J].计算机应用,2021,41(8):2161-2186.
作者简介:李建青(1972.11—),女,汉族,山西太原人,讲师,硕士研究生,研究方向:人工智能。