神州泰岳人工智能认知+
2017-06-05
对于当前人工智能和大数据发展的这个阶段,我们认为有两个挑战:技术创新和场景创新,当然大家提到的大数据应用的创新是一个关键的阶段。
在人工智能领域,分成两个方面,一方面是感知智能,有视觉识别和语音识别两个方向。另外,人工智能中比较挑战的领域是认知智能,因为认知智能背后的自然语言的语义识别技术比较难。当然,如果技术创新没有一个很好的基础,会导致场景创新没有那么大的力量。因此,我们知道大数据分析的很多应用并没有得到长足的进步,这是与技术创新有一定关系的。而当技术创新有了很好的进步时,大数据需要在垂直行业寻找更好的创新场景,垂直行业的场景创新依然很重要,在场景领域很难做出平台级的产品。
现在,机器学习以深度学习为代表已经成为一个算法基础。人工智能本身包括深度学习,它的历史有五六十年。为什么现在我们认为它有很大的应用价值,或者是有了很大的进步?
我认为有两个原因:第一是大数据的发展,为整个人工智能提供了支持,人工智能在整个机器学习的过程中需要有樣本、需要有可学习的数据,大数据使得这些可学习的样本更加丰富。第二是算力的发展,没有当前如此大的算力,同样的深度学习需要的周期,可能是我们无法承受的。
整个深度学习,在数据丰富以及算力这两个维度的支持下,使得感知智能发展取得了很大的成就。如果作为创业的选择,能在这些领域找到一定的场景挖掘,我认为是一件很有价值且很值得做的事。
为什么这样说?我认为有几个先天的优势:机器学习算法各位都可以学、可以掌握,是一个普惠的资源。而GPU带来的算力的提升,只要你有资本投入,这些事情都可以轻松地完成。另外,大数据的发展使得我们获取样本数据的困难在降低,加之政府逐步开放数据,因此数据的获取并不难。
综上几点所述,此时来做“众创”是一个很好的机会,从现实情况看,做场景创新的创业公司越来越多。
从认知角度考虑,我们认为认知智能在深度学习方面是达不到预期效果的。尤其是在行业领域深度学习还将面临三个挑战:缺乏足够丰富的样本数据,算法训练、调优、测试困难;来自中文歧义性的挑战,相同的含义不一样的表达,或者相同的表达不一样的含义;应答结果专业性的要求,应答准确性不可让步。
在神州泰岳,在智能认知领域有我们自己的技术:基于概念计算的智慧语义认知技术,这是一个自由的流派。
从具体的几个方面来看,我们要做概念识别,比如手里拿一个杯子,大家看到杯子时的概念是一样的,但语言不一样。有人叫杯子,有人叫茶具,有人叫杯具,如果说“杯具”,有可能是不好的意思。所以,我们通过符号化的表示,来表达真实的意思。此外我们可以实现多语种支持,而不需要分别处理。
应用创新和技术创新的支持不能简单粗暴,我们推出了非结构化大数据的文本分析挖掘平台,这个平台通过建模帮助大家实现很好的创新。并且,这个平台也是目前业界首款完全面向行业建模的平台。
基于这个平台,你在进行大数据创新的时候,不需要语料、不需要通过CPU,我们每秒处理15万汉字,大大降低了大数据的创新成本。基于这个理念,神州泰岳提出了“语义云”这一概念。我们会向各个行业输出,方便大家应用。
举例来看,我们做了一个智脑系统,就是报案分析,机器可以根据报案的信息进行分析,比如案件发生的时间、判断并识别案件中的关键信息等。目前,北京市公安系统已经在真正应用。
接下来,我们看一下这套系统的“疗效”,针对入室盗窃案情分析,北京市去年入室抢盗案件有22710起,串并规则19个,续串案总量2400起。依据分析线索,经过人工研判,实现串并案35个,每个串并案涉及10起左右案件,总计研判涉及未破案件362起,结果属实;使用引导式串并,发现3个串并案,共涉及27个案件,经研判属实;自动续串3起,经人工分析之后,确实属于续串案件。针对电信诈骗案情分析,分析案件总量7375起,实现串并总量765串。
总结下,神州泰岳人工智能认知+的三大战略理念是:
技术创新战略,以“平台化”策略驱动核心技术研发,围绕语义认知主题,开放语义认知平台“泰岳语义云”,吸引更多行业合作伙伴,共同打造语义认知生态链。
工具创新战略,以“智能化”策略驱动人工智能应用产品研发,围绕行业应用,以文字为载体,需要深度语义认知技术的应用场景,推出系列的智能化应用产品。
场景创新策略,以“云计算”策略驱动非结构化大数据应用产品研发,继续整合行业知识,在原有基础云服务基础上,挖掘行业应用内涵,推出系列大数据云服务产品。比如“智媒”腾讯智慧传播管理平台、证券研报分析云等。(根据演讲内容整理,未经本人审核)