APP下载

人工智能中的语义分析技术及其应用

2019-12-03陈功文

电子技术与软件工程 2019年21期
关键词:结构化语义建模

文/陈功文

人工智能中的语义分析是进行自然语言的处理技术,其中包括自然语言、计算语言、认知语言等很多学科。人工智能中的语义分析技术发展迅速,尤其是深度学习技术更是发展迅猛,围棋对弈、图像识别、自动驾驶、语音识别等都进行了应用,并得到了突破性进展。语义分析的目标是进行模型和系统的有效建立,做到各个语言单位自动语义分析,进而对文本语义更好的理解。

1 语义分析技术

语义分析基础技术包括词语级、句子级和篇章级的语义分析技术。

(1)词语级语义分析是进行词汇含义理解,有词义消歧和词义表示两个方面。词义消歧是结合多义词在文本环境理解和确定词语含义。其中有词典当中词义和语料中词义消歧。要进行词典构建和上下文建模。词义表示是同义词网络中的路径信息,也是思路数字化。如今机器学习算法的不断进步和发展,词义表示方式词向量或词嵌入。其思路是利用训练把语言当中的每个词进行映射形成固定维数向量,让这些向量形成词向量空间,每个向量被看做空间中的点,同时引入距离,利用这个词间的距离进行词相似性的判断。

(2)句子级语义分析,这是结合句中词的含义、句子句法结构等信息,进行推导句子含义的表述形式。包括浅层语义分析和深层语义分析。浅层语义分析是进行语义角色标注。利用SRL找出句子核心语义角色。如今SRL是根据句法实施结果分析,就是对某个句子得出句法分析结果,再根据这个句法分析结果实现SRL。深层语义分析是把整个句子进行转化,形成形式化表示,需要知识库的支持,在知识库当中,进行实体及关系、属性进行预先定义。

(3)篇章级语义分析。是给定文本,进行自动识别篇章结构,明确其中的连接词、论元、篇章关系类别等。篇章结构可分为显式和隐式两种关系式,显式篇章连接词体现在文本当中,隐式篇章连接词不在文本中体现,能够结合上下文的语言环境进行推导。

2 对于业务建模的语义分析

2.1 DINFO-OEC平台

DINFO-OEC平台是进行非结构化大数据信息分析,具有挖掘能力,也是企业进行大数据发展战略的有效工具。大多数大数据是非结构化大数据,其业务对象和对象间关系等存在于文本中,文本内容有很多来源,有各种灵活的表达方式,具有很大歧义性,所以,不能应用BI工具等有效分析,不能对业务实施无法直接服务,体现业务的作用。非结构化大数据是进行大数据处理的重点和难点。DINFOOEC平台可以和自然语言处理相结合,实施深度学习等进行文本挖掘,多维度业务建模能力,以智能语义感知技术为基础,给非结构化大数据提供自动化处理和智能理解的能力,进行文本知识业务标签标记,实施非结构化信息转换。

DINFO-OEC平台可以实施与主流Hadoop、Spark等各大数据平台对接,以分布式存储和计算能力,挖掘复杂、大量的大数据分析,进行大量数据实时分析计算,发挥以海量历史数据为基础的交互式搜索作用。DINFO-OEC平台可以和常用商业智能系统结合,进行挖掘结构化及非结构化数据的结合分析,实施挖掘大数据分析情况下的业务创新。

2.2 业务建模

业务建模技术是进行业务与语言的不同层次建模,是根据本体论中心,进行合理规划业务知识,实施业务规则建模配置,建立形式化的业务规则。业务建模技术可以进行分离业务和非结构化数据语言表达,对业务和语言两层次实施区分建模。业务层次可以实施业务本体构建,发现和配置业务要素;语言层次实施维护和构建语言概念,建设同义词库和常用词库。

2.3 平台特点

2.3.1 面向非结构化数据建模能力

INDO-OEC业务建模,可以把各种业务规则与多样的语言表达实施统一建模,要在本体、要素、概念等三个维度实施分析挖掘模型建设,进行分离语言表达和业务描述,让业务人员对自己擅长的业务要求和业务规则实施建模,而不对自然语言的表达复杂性、歧义性、多样性等进行表达。

2.3.2 非结构化数据分析挖掘能力

平台可以进行智慧语义的感知,进行强大自然语言理解的相关算法,其中有内容分类、主题分析、实体识别、推荐引擎、聚类、语义分析、启发式搜索引擎、摘要引擎等。平台产品可以实施多种分析挖掘算法,有C计算,其中包括进行抽取概念、挖掘概念表达形式、匹配算法的概念表达式;S计算,这里有经常应用的统计挖掘算法,其中有KNN、SVM、决策树等各种算法;R计算,提供概念关联发现算法。

2.3.3 支持多语言分析挖掘能力

系统内置了各种语言分析挖掘算法。以相应的算法流程,支持多种语言,具有很好的语种扩展性好。增加新的语种,不需要进行算法修改。有进行多语种有效复能力。平台对多语种业务规则可以保持一致。维护业务规则,也就是对系统本体树的维护,只进行中文简体版本的维护,不对其他语种本提树实施维护,进而降低了维护本体树的工作量。有跨语种的建模能力。平台可以实施中文简体版应用,进行其他语种本体树书写规则。进行本体树类别维护和修改,不用对其他语种进行掌握。

2.3.4 实施大数据技术和存储平台集成能力

平台支持主流Hadoop、Map/Reduce批量计算、Spark实时计算、HDFS、Hbase、kafka等进行存取。Hadoop平台有相应的Apache Hadoop、华 为FusionInsights、IBM BigInsights、EMC Pivotal HD。可是进行架构SOA集群,和Oracle、Mysql、DB2等各种主力数据库的各种产品进行集成。

3 人工智能中的语义分析应用

3.1 在金融行业中的应用

人工智能技术在快速发展,让机器可以进行人的功能实施有效模拟,可以对客户实施批量个性化、人性化服务,进而对金融行业有重要影响,人工智能是进行银行客户沟通、客户金融需求发现的重要影响因素。它会进行新的金融产品、服务方式和渠道、授信融资、风险管理、投资决策等深入改革和创新。人工智能技术能够进行客户,可以进行各类金融交易、支持授信、金融分析决策,还会应用到风险防控、监督上,会对金融现有格局进行大幅度改革,相应的金融服务,包括银行、理财、保险、投资、借贷、投资等各方面的智能化和个性化发展。证券研报大数据云服务,是对证券业、基金业发等研究人员、分析师实施的大数据云服务。相应的系统具有SaaS服务,能够全网采集公告、研报,并实施各种事件结构化的分析,进行研报一站式的智能搜索,并挖掘以时间轴、信息锚点为基础的大数据分析。系统可以对分析师进行帮助,使其大数据角度分析研究,有效提升工作质量和效率。

3.2 在政务平台中的应用

全国三线以上城市的各级政府每年发布产业政策4万项以上,其中一线城市每年发布政策2000项以上。对于企业来说,通过智能化匹配政策无疑可以有效地解决信息不对称、成本效率等问题;对于科技服务机构来说,通过智能化匹配及信息化工具的使用,可以有效地解决向互联网+专业服务转型面临的各种问题;政府部门通过智能匹配可以实现精准扶持、智慧决策。研发政策匹配项目是以云服务为基础给企业、政府、组织开发的互联网平台。这个系统数据采集模块有自动去重、可配置和过滤垃圾等功能,以智慧语义识别技术应用到系统分析挖掘功能中,确保准确实施语义分析,从而使得政策实施定向更准。此外,系统能够结合客户需求实施政策匹配、政策定制等。

3.3 在客服行业中应用

客服行业是劳动密集行业,一些大公司需要很高的成本。应用智能机器人客服能够对重复性、简单性工作进行有效解决。可以给企业节省成本和人工费用,有效提高运营效率。神州泰岳应用的小富机器人4.0是智能客服机器人,可以进行全媒体时代智能客服。

(1)是业务场景机器人。客服、营销、外呼等各种业务具有不同场景,具有不同业务逻辑。小富4.0机器人设置了各种场景模式,实施区分设计相应知识类型及交互方式,提供具有针对性和专业性的智能化服务。

(2)实施整体业务建模,有相应的延展性。以具体场景业务理解为基础实施整体建模,有完整业务逻辑,增强了机器人可复用性和思维延展性,提高应答效率。

(3)知识类型表达系统具有差异化,实施智能引导各种会话,不是进行反复跳转预设问题。这种机器人具有知识性,有记忆能力,能够以业务逻辑为基础实施自创问答逻辑,进行进行自然。亲切的交换。

(4)知识碎片化智能加工,能够直接得到准确答案,不是得到答案范围。智能机器人有各种知识加工方式,能够对结构化、非结构化知识实施碎片化智能建立文档。可以直接对客户提问进行回馈。

4 结束语

综上所述,人工智能中的语义分析技术是现代的先进的大数据技术,是进行自然语言处理的技术,可以在各个行业中有效应用,提供工作质量和效果,实现人工智能新体验,促进各行业的不断发展和进步。

猜你喜欢

结构化语义建模
促进知识结构化的主题式复习初探
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
结构化面试方法在研究生复试中的应用
语言与语义
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
“上”与“下”语义的不对称性及其认知阐释
基于图模型的通用半结构化数据检索
认知范畴模糊与语义模糊
三元组辐射场的建模与仿真