小富机器人:“富二代”智能机器人
2017-12-26
人工智能已经历了五六十年的跌宕起伏,如今已经迎来了大发展时期,目前我国针对人工智能未来发展也制定了相关规划。我认为人工智能在未来5至20年的发展过程中,将在市场上取得非常大的进步。如今的智能机器人发展,可以从两个市场角度进行分析:第一,针对相应的消费群体。目前在市场中针对儿童教育和聊天机器人的种类非常广泛。第二,针对专业领域群体。服务型机器人,无论在服务行业、企业、公共事务和公检法等领域,也都有很大的发展空间。而专业领域服务型机器人,普遍采用的技术手段包括机器学习、深度学习和增强学习等。
为什么要强调专业领域?因为专业领域与消费领域相比,最大的区别在于,专业领域的服务型机器人语料并不丰富,不像聊天机器人可以获取大量的语料,并利用计算能力、CPU、GPU和算法等技术手段,形成语言智能机器人。但是在专业服务领域,对应答的精准度要求较高,同时专业服务领域机器人也存在语料匮乏等情况,虽然我们广泛地采用了深度学习等方法,也取得了一些成果,但对于开发专业服务领域机器人,我们还有很长的路要走。
专业服务领域机器人不仅面临准确率的挑战,同时还面临应用场景单一化的挑战。目前在市场中充斥着很多客服机器人,作为一个企业,我们为客户提供服务的同时,希望通过智能服务机器人主动进行外呼功能,来获取新的销售机会。但是由于外呼业务场景和传统客服业务场景的差别较大,如果运用机器人在传统的客服场景中进行外呼,很难满足企业需求。
无论是消费领域的机器人还是专业服务领域的机器人,面临的最重要问题是知识加工。知识加工是一个非常核心的工作,针对专业服务机器人而言,知识加工很大程度上依赖人工的问答方式,这使得维护机器人的代价高昂,同时随着业务的发展和新产品的推出,也使得知识加工过程非常艰难。
如何解决此类问题?目前神州泰岳除采用深度学习等方法外,还引入专有中文信息处理理论基础,二者合一同时对语义进行处理,我们将此项技术称之为“智慧语义”。语言存在歧义性,同一个词可能表达不同的概念,而同一个语言含义也存在多种表达方式,这都给自然语言处理带来极大困难。针对这些方面的问题,我们在底层进行了很多基础工作,我们将一些常用词汇,在不同的领域中所表达的概念进行机器编码,并把相同的词汇在不同的应用场景所表达的含义进行区分,最后我们针对编码进行语义概念计算,得出不同场景中相应的语义。
用传统的自然语言处理的方法,对语义进行处理,会得到不同的句法分析,而不同的句法分析也会得出不同的语义,这就给语言处理带来了语言歧义问题。我们通过底层概念,使每个语义形成一个网络,并使不同的语义表达方式形成不同的网络,通过语义算法把语义进行统一,这样就可以甄别在不同环境下的语义,所表达的含义是是否一样。
我们基于对市场的研究和现有的技术储备,在设计机器人时,第一采用了场景化设计。使机器人在上线部署之后,可以支持客服、外呼以及營销等场景的应用,使用户在一次性投入后可直接应对不同的服务场景,来满足企业用户需求。第二我们在设计机器人时的侧重点是知识加工,知识的自动加工一直是我们努力的方向,目前虽然不是所有知识都可以通过技术手段进行加工,但是一些较为基本的知识,完全可以进行自动加工。我们将不同的场景进行关联,当客户进行咨询和投诉时,会通过客服等手段进行联系,在咨询和投诉的情况下,企业可能会在其中发现潜在的销售机会,这时我们需要在营销场景中,为企业用户推出相应的营销资料。
而且同一个语义的表达方式非常之多,在诸多的表达方式中,很多情况下只是在阐述同一个问题。过传统的方式,是把可能发生的语义全部罗列出来,然后进行匹配。当我们提出问题后,机器人会寻找相应的答案进行回复,但通过概念计算的方式,直接提取语言中的概念,机器人不用进行相应的语言匹配操作,就会直接推出答案给我们。
目前我们在语言智能机器人方面,取得了三个方面的进步。第一,准确率方面,由于我们采用概念计算的语义认知技术,相对传统语义分析的准确率要高。第二,在实施企业专业服务机器人时,我们不需要运用人工知识加工技术进行维护。第三,机器人的一次性实施可以支持多个场景应用,在增加了实施效率的同时,降低了运营成本,这是我们的优势。
虽然在语言智能机器人方面我们取得了一些成绩,但我们也对自己的后续发展进行了规划。第一,我们希望运用“多模态”的场景对技术进行支持。所谓多模态,就是在支持文字的情况下,还要支持语音、图像、视频等。第二,我们现在虽然满足了客服、营销、外呼等场景的应用,同时我们也在积极开发其他领域的场景应用。endprint