APP下载

久其分析机器人:AI激活最强大脑

2018-03-04程梦瑶

软件和集成电路 2018年12期
关键词:分析模型引擎语义

程梦瑶

以B端用户为面向,久其小久智能分析机器人激活了久其软件多年积累的行业应用场景化优势。久其小久智能分析机器人首次将语音识别、自然语言处理与丰富的分析模型库进行结合,打造了服务于高端行业用户的AI创新样本。

设想一种场景,一家大型企业的高层决策者想查看本年度各单位销售收入的变化情况,只需要对着久其小久智能分析机器人说出想要查询或分析的内容,小久可以做到秒级响应,系统立即自动生成图、文、表格并茂的分析主题展示出来。

这种场景其实并不陌生,有很多种畅想,也有很多种实现的可能。

但在这种应用场景的背后,却需要有大量的技术手段作为支撑,如何自动进行语音识别?如何自动进行文本语义理解?如何自动从海量数据中快速检索适合的数据,并匹配合适的分析展现模型?这些问题,都成为了实现这种场景化应用的难点和痛点。

在互联网、移动互联网、物联网、传感器技术飞速发展的今天,面对海量的大数据资源,如何快速有效地获取自己想要的数据,是很多行业客户提出的自主需求。“现在很多用户的自主分析能力越来越强,在客户现场,我们经常听到客户的反馈,希望能够实现快速、智能化、自动化的数据查询和分析。”北京久其软件股份有限公司产品中心副总经理兼大数据平台事业部总经理李纪洲谈到。

从行业经验出发,使数据分析智能化、大众化

构成久其小久智能分析机器人的技术体系涵盖数据可视化、语音识别、自然语言处理、智能分析模型、大数据存储和访问、数据可视化等目前最前沿的技术领域,为了形成真正的、一站式的交互式智能分析应用,久其软件的研发团队做了多年的探索和尝试。

久其小久智能分析机器人的后端其实是通用的大数据分析平台,“做大数据平台研发,其实最早是从2009年开始的。最早我们做商业智能,也就是大家比较熟悉的BI的概念。基于久其在BI领域和分析展现方面的丰富经验,以及多年积累的BI项目经验,我们总结和积累了完善的分析模型库,针对不同行业和不同业务都设计出完善的分析模型。”李纪洲表示,正是基于这些分析模型,再结合自然语言处理能力,久其小久智能分析机器人可以满足用户绝大多数的分析场景。

智能分析模型库是久其小久智能分析机器人的核心特点之一,也融入了久其软件多年的行业经验。建立丰富的分析模型库还只是一个必不可少的基础条件,如何向用户智能地推荐合适的分析模型和展现模式,使用户在不具备分析能力的前提下仍然可以进行自主的数据分析,这才是关键所在。

“如果你能提供一些更人性化、更简化的方式,他们就可以很快上手。”李纪洲所说的“他们”代表了久其软件目前所服务的多个行业领域的政企客户,这个需求归根结底也是一种共性需求。“在这些客户群体中有着大量的数据分析展现方面的应用需求,未来都将逐步地使用久其交互式智能分析机器人进行升级和替代,使数据分析工作不再是专业人士的工作,越来越多的人可以参与到数据分析中来,使数据分析越来越智能化、大众化。”李纪洲补充道。

具体来说,久其小久智能分析机器人是如何做到的呢?久其小久智能分析机器人为用户提供了专业的分析模型推荐算法,精准地为用户推荐合适的分析模型,使用户日常的数据分析能够更轻松准确地进行。分析模型的主要分类包括:趋势分析、对比分析、占比分析、结构分析、相关性分析、排名分析、定值分析、明细查询、转化率分析、均衡性分析以及一些财务分析模型如财务预算完成情况分析、偿债能力分析、营运能力分析、盈利能力分析、发展能力分析、现金流量分析、财务杜邦分析等。

语义识别引擎:满足不同场景的解析需求

进行智能分析的前提是要获取用户的查询需求,作为一款交互式的智能分析机器人,久其小久智能分析机器人独创的自然语言处理能力构成了其坚强的后盾。

采用特征查询要素的提取识别方式对自然语言进行处理,并通过语义识别引擎定义了语义特征、识别文法,用于描述自然语言的语义特征,并解析出有用的语义要素。

“语义识别引擎构成了久其小久智能分析机器人的核心模块,这是我们自研的一块重要内容。”李纪洲谈到。

从定义上看,久其小久智能分析机器人采用的语义识别引擎是久其自主设计、研发的自然语言处理引擎。引擎解析分为两个部分:第一部分是对语句进行分词。分词采用的是训练模型和词典分词相结合的技术,既能满足对分词效率上的支持,又能处理从未遇到过的生僻词的分词场景。分词引擎采用Double Array Trie Tree的数据结构对字典进行存储,保证字典查找效率的同时,又有效地避免了内存的过多占用。

第二个部分是对分词结果进行要素的定位。引擎定义的基于语义特征识别的文法,称作F语言(即Semantic Feature Recognition Grammar)。相比于其他通用的自然语言处理引擎,F语言能够基于特定环境进行更有针对性的解析。比如F语言更关注用户录入的语句中包含的时间要素、维度要素、指标要素、分析方法等相关要素,而对于语句中辅助性的词汇,F语言可以进行忽略而不进行解析。F语言中用于描述语义结构的F脚本,可以进行修改以满足其他场景的不同解析需求,而不仅限于机器人的解析。

“目前,我们引擎最大的特点是不关注语法的细节规则,而是通过从句式中寻找关键词抽取指标。有了语义识别引擎之后,再去做数据查询、数据处理以及疏通数据集的工作。”李纪洲介绍道。

语义识别引擎从接收用户输入的语句到最终生成推荐的分析结果,有一整套完备的运转流程,包括语音识别、自然语言处理、数据实体定位、分析模型推荐、数据集生成、可视化展示等,流程的每一步都有完整的解决方案用于实现该步骤。

辅助决策者进行决策分析,为用户创造价值

从产品层面看,在对久其小久智能分析机器人进行产品定义时,就提出了要求—产品必须对用户的所有的语音请求做到“有问必答”,不管用户表达是否准确、全面。即便用户语言表达不够全面,产品也可尽可能地去猜测用户的真实意图,根据语义分析的結果给用户呈现最可能符合意图的分析结果。

如果用户语音表达含混,产品无法识别其语音,产品也可与用户语音交互,引导用户发出语音指令,且交互深度不超过3层(因为没完没了地确认响应,可能导致用户放弃对产品的使用)。

作为一款能广泛应用于各行各业并辅助决策者进行决策分析的产品,久其小久智能分析机器人将为客户创造价值,放在了首位。因此,它从四个方面对用户的价值实现进行了提升。

第一,用户体验全面升级:简洁的搜索界面、酷炫的分析结果、高效的查询响应、智能的需求理解、强大的交互能力都为用户带来了全新的操作体验。

第二,自助查询分析:以往数据分析系统都是先定义后查看的模式,配置过程复杂繁琐,大大降低了用户使用数据的效率,使用本产品用户可以根据需要随时自主地获取信息。

第三,大大降低实施成本:由于无需实施人员定义分析模型,实施周期短、见效快、成本低。

第四,自主学习:通过深度学习可以不断完善分析模型库,可以更加准确地匹配用户需求。

或许AI的价值并不仅仅在AI技术本身,而是更多地体现在用户的应用场景之中。久其软件的AI赋能,以提升用户体验、为用户创造价值为出发点,在司法、财经、交通和民生等领域已经取得了成效。

纵观国内市场,AI在各个行业、领域的渗透才刚刚开始,仍要经历一段相当长的技术溢出和效用递增阶段。AI的应用前景十分广阔,但一言以蔽之,技术只是工具,业务才是本质。

访谈实录

Q:中国大数据产业生态联盟、《软件和集成电路》杂志社

A:北京久其软件股份有限公司产品中心副总经理兼大数据平台事业部总经理李纪洲

Q:久其小久智能分析机器人的数据存储是如何进行管理的?

A:久其小久智能分析机器人的数据存储不仅限于关系型数据库,还可以存储于久其的BigDB中。BigDB是久其基于Hadoop体系打造的大数据分布式存储和处理的产品。BigDB将分布式存储的数据结构适配成类关系型数据库模型,支持满足SQL2003标准的SQL语句,使前端对BigDB的调用无缝集成。

Q:久其小久智能分析机器人是如何改善传统的分析应用产品中的不足之处的?

A:在传统的分析应用产品中,要想做好一个分析主题,用户需要了解系统内的数据结构,掌握相关的分析领域模型,熟悉对应的制表操作等,用户的使用门槛较高。通过该产品的应用,用户可以在零基础的条件下自助进行数据分析,用户仅仅用语言或者文字描述出自己想要看的东西,机器人会通过语义分析、查询要素分析、数据定位、分析模型定位等一系列的处理后,自动推荐给用户相关的图表,由用户选择。

Q:久其小久智能分析机器人在可视化方面有哪些优势?

A:久其在分析展现上拥有一套完整的可视化套件。可视化套件包括仪表盘、快速分析表、数据导航、数据地图,能将分析模型以丰富的形式展现出来。作为数据可视化套件的底层数据提供引擎,久其的数据处理引擎不仅支持满足三范式的关系型数据库的访问,还可以自动通过元数据模型以及模型之间的关系生成相应的查询语句,对数据进行关联、汇总消维等操作。

与此同时,数据处理引擎还支持在Hadoop体系下的数据存储和数据处理,满足在大规模数据分析应用上的数据处理需求。

Q:这款产品的问世可以带来哪些值?

A:久其是一家具有技术情结的公司。我们研发这款产品一方面是为了方便用户,另一方面也是为了方便我们自己。因为我们每年的项目很多,如果我们可以通过AI技术提升我们自身的实施效率和实施质量,就可以给更多用户提供更快、更好的服务。

行业应用案例

案例名称: 某建筑行业央企总裁桌面分析系统

核心特点:

整合集团全业务数据,构建建筑行业知识图谱,彻底改变了传统的数据分析模式,以更自然的语言交互方式进行数据探索分析,对用户的分析需求给出实时的结果反馈。除此之外,久其小久智能分析机器人内置了丰富的分析模型和行业知识库,与普通水平的数据分析人员相比,推送的结果更加精准。该系统的建设大大提升了用户的分析效率和质量,为用户日常的数据分析、特别是经营分析会带来了极大的便利。

应用解读:

在建设系统之前,集团领导有一次去欧洲考察,临行前信息部门在五一节期间日夜加班了一周准备数据,但在实际考察过程中却发现,所准备的数据仍然不够充分,而国内临时查询数据又耗费大量时间,根本不能及时提供。

在该系统建设之后,几乎所有的分析请求都可以在第一时间得到响应。特别是在经营分析会上,在固定的分析主题之外,领导经常会提出很多相关指标的查询需求,这些都可以通过久其小久智能分析机器人快速查询得到。

随着这些年信息化的发展,各个企业都积累了大量的数据资产,而在数据的分析上又都面临着很多问题:

1.数据繁多,“找数据”难,“找对数据”更难;

2.分析需求越来越多,而且对分析的时效性要求也越来越高,很多需求都是“马上想看”“现在就要”;

3.分析人员匮乏,企业很难招聘到足够的数据分析师。

久其小久智能分析机器人很好解决了企业数据的这些痛点问题,能够从大量的企业数据中,快速定位出所需的数据内容,并结合自身内置的模型知识库,为用户实时推送高质量的分析主题。

应用价值:

1.改进了用户的数据分析体验,可以随时、随需进行分析,实时获取分析结果,因为久其小久智能分析机器人带来的便利性,用户对总裁桌面系统的使用频度明显高于以往的数据分析系统;

2.提升了数据分析质量,久其小久智能分析机器人结合建筑行业进行了大量的数据分析模型优化,分析结果比普通的数据分析师更优;

3.减少数据分析工作量,把大量的人工数据分析工作智能化、自动化,把信息部門原有十几个人的工作缩减为三五个人完成。

猜你喜欢

分析模型引擎语义
点燃企业发展的“引擎”
打造信息化建设的“党建引擎”
韩国语“容入-离析”关系表达及认知语义解释
基于语义的在线协作会话学习投入自动分析模型及应用研究
车坛往事4:引擎进化之屡次失败的蒸汽机车
基于大规模弹幕数据监听和情感分类的舆情分析模型
基于Hadoop的商业数据可视化分析模型的研究
One Engine Left只剩下一个引擎