浅谈人工智能算法进展及AI应用
2017-09-04管昊
管昊
摘 要:人工智能算法不断发展创新,学习层级也不断增加,在金融、医疗、电商零售、教育、语音识别等众多领域得到应用。
关键词:智能算法
近年人工智能算法在不断创新,取得一次次进步,由原来简单的逻辑回归算法、线性回归算法等简单数理统计算法发展为CNN等复杂的智能算法。随着算法的不断复杂化,其应用前景也越来越广,众多算法已经在语音识别、金融、医疗等领域应用。
1 算法最新进展
1.1 FSMN改善语音实时交互延时问题
双向RNN算法作为当前在语音识别系统广泛应用的主流算法,在语音信息处理工程中面临一个较大瓶颈:要成功利用未来信息,需要获得完整语音段,导致在语音实时交互过程中存在较长时延,不能及时满足语音实时交互需求。
前馈型序列记忆网络,由输入层、隐含层、记忆模块和输出层构成,较传统的深度神经网络算法不同之处在于在隐含层旁新增“记忆模块”。该“记忆模块”用于存储对判断当前语音有用的历史信息和未来信息。较传统的循环反馈的RNN,该记忆模块通过前馈反馈结构实现记忆功能。它的记忆模块其优势在于:
传统双向RNN算法对当前语音帧的判断需待语音输入结束后才能开始,而它对未来信息的记忆,仅需延迟有限时长即可实现记忆。而该算法在训练过程会出现指数衰减的梯度消失现象,而这将导致其对信息记忆量十分有限,而它基于前馈时序展开结构的记忆网络,在训练过程中梯度沿着记忆模块与隐含层的连接权重往回传给各个时刻即可解决简单RNN的梯度消失问题,达到长时记忆能力;
1.2 DFCNN让卷积神经网络“听得更多”
卷积神经网络算法当前广泛用于图像识别领域,但由于其所用卷积层数较少,导致“表达能力”受限,在其他应用领域运用较小,如语音识别领域。而它作为CNN的特殊形式,通过使用大量卷积层直接对整句语音信号建模,克服传统算法无法解读较长语言和表达能力有限的弱点,更好地表达语言的长时相关性。
它对语音识别的处理,首先通过每帧语音进行傅里叶变换,再将时间和频率作为图像的两个维度,然后通过一定数量的卷积层和池化层的组合,对整句语音进行建模,输出单元直接与最终的识別结果相对,较目前RNN-CTC系统实现了15%的性能提升。
1.3 迁移学习扩宽深度学习算法应用边界
近年,国内外研究者在训练深度神经网络、学习输入到输出的精准映射上取得长足进步。但监督学习算法在某一领域或某一特定问题上建立起的模型是基于一定的时长和大量已标记数据的前提下实现的。当在缺乏大量标记数据的情况下,或者迁移到某一新领域情况下,监督学习的算法表现一般,要么无法得出可靠模型,要么需要较长时间和大量已标记数据来建模。
迁移学习目标在于将某一环境中学到的知识用来帮助新环境中的学习任务,即通过将原先学到的知识应用到新的环境里,而在新环境下仅需少量新的标记数据,建立起高效可靠的新模型,从而提升当前深度学习算法的泛化能力。迁移学习的众多优点,可推动监督学习算法在未来商业得到更为广泛的应用。
2 算法最新应用
2.1 智能算法在云计算领域应用
谷歌致力于更瘦、更绿的云计算数据平台。在14年,它通过安装智能温度和照明控制以及采用先进的冷却技术而非机械冷却器,最小化能量损失,使其数据中心的耗电量比全球数据中心平均水平低50%。对比自身,它现在的数据处理性能是5年前的3.5倍,而能耗保持原有水平。
通过18个月的模型研发与测试,Deep Mind联合谷歌云的研发团队成功为数据中心节省了40%的冷却能耗,其中一个试点已经达到了PUE的最低点,未来该技术可应用于提高发电转换效率、减少半导体生产的能量和用水量。
2.2 智能算法在电商零售领域应用
目前,国内零售业现约有40余家人工智能创业公司,针对电商领域实现的功能主要有客服、实时定价促销、搜索、销售预测等。
客服机器人是京东自主研发的人工智能系统,它通过自然语言处理、深度神经网络、用户画像等技术,能够完成全天候、无限量的用户服务,涵盖售前咨询、售后服务等电子商务的各个环节。它在部分品类的售前咨询满意度甚至超过了人工客服,16年全年节省成本超过亿元。它不仅是人工智能的前瞻应用,更是打破了传统客服固有模式。
2.3 智能算法在教育领域应用
人工智能在教育领域的应用同样值得关注,AI将改变在线教育的场景,使得在线教育在形式上更贴近不同用户的个性化需求。
智学网是科大讯飞面向学校日常作业、考试及学习评价需求推出的个性化教育系统化。系统基于科大讯飞全球领先的人工智能核心技术,能够实现教与学全场景动态数据的采集与分析,深度挖掘数据价值,帮助教育管理者高效决策、教师针对性教育、学生个性化学习,实现家校互联,帮助家长实时了解孩子的学习情况。
2.4 智能算法在智能呼叫中心服务领域的应用
智能呼叫中心系统完全通过自然交互的形式工作,更人性化也更节约时间,据统计国内智能IVR市场规模达150亿。
Salesforce将AI应用于呼叫中心服务。它的呼叫中心解决方案是一款能够让企业为每一位客户提供全天候、更快捷、多渠道支持的企业服务产品。作为CRM巨头,公司在近期公开了产品的一系列性能,它将通过基于上下文的案例背景和以前的通信服务代理列表响应,来提高工具生产力,帮助呼叫中心平台用户更好地为顾客服务。
2.5 智能算法在语音识别领域的应用
语音识别技术将语音中包含的文字信息“提取”出来,相当于给机器安装上“耳朵”,使其具备“能听”的功能。目前商用化的智能语音助手包括了谷歌、苹果、科大讯飞的开放平台等,各大语音助手呈现出与其背后商业生态体系相对应的特点。endprint
晓译翻译机—科大讯飞的第一款同声翻译机。它基于深度神经网络算法上的创新和突破,搭载语音合成与识别引擎、口语翻译引擎等功能模块,翻译机具有易用性、稳定性、安全性等特点。翻译机不仅通晓英文,还精通我国少数民族的语言,目前,它已在新疆“大展身手”,拥有汉维翻译的能力。未来,翻译机还将拓展更多语种的应用场景,包含汉藏、汉蒙、中日等其他小语种。它目前正处于前期试点阶段,该项产品还有望应用于外交领域。
2.6 智能算法在金融风控领域的應用
算法交易是指通过电脑程序按照指定规则进行证券交易的方法。这些交易规则通过超越人类速度、频率及认知范围获得超额收益。随着人工智能技术的进步,算法交易从简单的技术指标分析方法演变为复杂的综合体系分析方法。
算法通过用户画像、舆情分析和预测等交易模型,以神经网络算法、聚类算法、增强算法和传统回归算法为底层算法,分别实现了机器视觉听觉、降维分析、自然语言处理和模式识别等人工智能功能。
舆情分析技术是一门利用机器学习和自然语言分析技术对海量互联网信息进行感情色彩分析的技术。带有舆情分析功能的AI辅助交易系统往往可以在接收到新闻的瞬间做出较快判断,为交易赢得宝贵时间。
Capital打造选股机器人Krystal。它是一个可以在海量金融数据流中甄别微小非随机模式的数学模型。通过8年的研究与开发,它学习了69个月的金融数据,进行了一万两千余次模拟交易和一千余次实盘交易,交易结果证明其在实盘运用中的有效性。13年底KFL发布AI基金,截至16年3月总回报为-7.1%,低于纳斯达克的22%回报率。目前该基金资产规模为220万美元。
2.7 智能算法在医疗领域应用
IBM认知智能的核心在于对非结构化数据的理解,即医嘱、图像等信息。而医疗行业中的非结构化数据包含了绝大多数的信息量。它在医疗方面的应用主要为癌症的诊断和治疗,同时正逐步加强与高校和科研机构的研究发展,大力发展大数据在肿瘤药物和精准医疗的应用。16年它健康应用还涵盖了很多其他的领域:糖尿病等慢病、大健康、医疗影像、体外检测、精准医疗、机器人、疾病研究治疗。
参考文献:
[1]智能投资研究院.深度学习在语音技术的前沿应用[J].
[2]陈秋喜.16年认知计算业Watson分析报告[J].endprint