“百度一下”的未来
2019-06-11王潇阳
王潇阳
作为搜索引擎的代名词,“百度一下”已经在人民日常生活中发挥着无可取代的作用,而深度学习技术的诞生与发展则为“百度一下”的未来发展提供了巨大的技术支撑,文章从此出发,首先对“百度一下”及其发展前景做了简要的描述,然后探讨了深度学习技术的内涵与价值,并分析了其应用现状,继而以深度学习技术的应用前景为分析内容,指出了其在文本领域、图像领域、音频领域、视频领域的应用前景。
网络信息时代的到来极大地改变了人类社会生产生活的方式,特别是在信息搜集领域,搜索引擎取代了传统的文献查阅,成为人们信息获取的主要方式。百度作为我国市场份额最大的搜索引擎网站,“百度一下”也成为网络搜索的代名词。深度学习技术属于人工智能的范畴,是机器学习领域的重要分支,是相对于传统的浅度学习,即仅包含单层非线性变换的浅层学习结构而言的新型学习结构,具有广阔的发展前景与强大的应用价值,是实现人工智能的有效路径,深度学习将简单的特征进行组合,成为高层次的特征,从而实现对特定数据或者实际对象抽象表达的目标。百度于2012年引入深度学习技术,以此来实现深度神经网络,并取得了不错的应用成果,从未来的发展前景而言,深度学习技术与“百度一下”的融合将更加紧密。
1 “百度一下”及其发展前景
“百度一下”是百度网站2007年推出的广告语,全称为“百度一下,你就知道”,指代在百度网站中对某个词语进行搜索。随着信息技术的迅猛发展,“百度一下”逐渐成为网络搜索的代名词,从广义的角度来说,凡事借助搜索引擎进行搜索,均可以视作“百度一下”,而从狭义的角度而言,则专指代以百度为搜索引擎的网络搜索。由于百度在中国搜索引擎市场份额巨大,占比在80%以上,“百度一下”的广义含义与狭义含義具有很大的重合性。“百度一下”很大程度上改变了人们信息的获取方式,使网络成为现代人信息的主要来源,在具备海量数据以及便捷性、个性化服务优势的同时,“百度一下”也存在不少问题,比如信息泛滥导致的可靠性下降,又如依附效应导致的思维碎片化等。深度学习技术的诞生与发展为“百度一下”的未来发展提供了重要的支撑,2012年百度公司引入了深度学习技术,并在多个领域取得了重要的突破,就以图片搜索为例,传统的搜索方式为隐文搜索,用户借助图片的主要文字信息,比如“故宫”搜索出故宫的图片,而深度学习技术使得以图搜图成为常见的搜索方式,用户只需拍摄图片,并上传百度搜索,就可以迅速找出类似的图片,深度学习技术极大地提升“百度一下”的效率与价值,对“百度一下”的发展有着重要意义。
2 深度学习技术
2.1 深度学习技术的内涵、优势
深度学习最早由Hinton教授于2006年提出,属于人工智能领域的新技术。此后又有很多科学家和学者深入研究,很多研究表明,根据学习深度的不同,机器学习可以分为浅度学习与深度学习两大类型,浅度学习是最为传统我们所普遍认知的学习模式,仅仅包含单层非线性变换的浅层学习结构,在信息技术不断发展,数据呈指数级增长的今天其现状和性能已经越来越难以满足社会发展的需求。深度学习的概念由此提出,所谓深度学习,指的是计算机以人脑的多层抽象机制为基础,借助神经网络来模拟人脑的学习过程。具体而言,便是构建具有很多隐藏的机器学习模型以及海量训练数据的机器学习方法。现代意义上的深度学习涉及到多门学科,典型的代数学、统计学、微积分、概率论等,主要借助设计和研发一些有助于计算机自动学习的算法来实现机器深度学习的目标。与传统的浅度学习相比,深度学习有着非常突出的优势,可以很好地化解浅度学习中存在的维数灾难现象。不仅有效解决了局部最优的问题,且其内部训练,或者说自主学习的过程不依赖样本标签信息,应用领域非常广阔,特别是在非线性自然信号的处理中更是如此,常见的有语音识别、图像识别、自然语言处理等。正是深度学习技术不可多得的优势,使得其成为百度等搜索引擎发展完善的重要技术支撑。
2.2 深度学习技术的应用现状
深度学习技术作为人工智能的分支,有着非常广泛的应用领域,但从当前的应用现状而言,受各种因素的影响,情形并不容乐观,或者说,深度学习技术的应用价值并没有得到有效的发挥,首先,训练模式优化问题。监督学习是深度学习模型训练的主要方式,此种学习方式离不开大量人工标准的训练样本,存在费时费力的问题,与人工智能的初衷违背,且训练样本的规模会影响到模型的应用精度;其次,理论创新问题。现阶段,大部分深度学习模型所以来的理论,都是卷积神经网络等最为基本的神经网络结构的叠加或混合,在复杂数据结构、数据关系的处理中不具备优势;最后,规模应用问题。相比于科研工作中的火热性,深度学习技术在实际的应用研究中仍然处于起步阶段,并没有规模化地应用于日常生活中,即便是技术较为成熟的领域,比如语音识别、图像识别等,也离普遍应用有一段距离。
3 深度学习技术的应用前景
3.1 文本领域的应用
文本领域是深度学习技术应用较为广泛的领域之一,并且,随着深度学习技术的不断发展,近年来,有关文本领域的研究也大都集中于深度学习的应用上。作为国内市场份额最大的搜索引擎,百度文本数量巨大,且每天以海量的速度递增,大规模文本分析是深度学习技术应用最为重要的内容。相关研究表明,在MATLAB平台上,基于浅层结构RSM的DBN模型可以有效地利用20-newgroups文档集进行训练与测试,研究结果清楚地表示,基于浅层结构RSM的DBN模型在大规模文本分析中具有可行性,为后续相关应用的开展奠定了技术基础与应用路径。文本分类是搜索引擎中的难点所在,特别是在文本海量递增的宏观环境下,如何有效地开展文本分类,提升文本分类的精确度与准确度,关系到搜索引擎未来的发展态势,对此,深度学习技术同样有着很好的应用价值。以知乎实验数据为依托的测试结果显示,基于深度学习技术的模型在文本分类的准确度上有显著的进步,特别是对于长文本而言,分类准确度高达98.06%,而对于分类难度更高的短文本,准确度也超过了90%。
3.2 图像领域的应用
对“百度一下”而言,图像领域的应用是深度学习技术应用的重要领域,一来,百度图片作为百度搜索引擎的重要功能,在满足社会图片搜索中发挥着重要的作用,二来,百度搜索正从单一的文字搜索向多元的文字、语音、图像搜索发展与延伸,拍照搜图已经成为现代搜索的重要方式。在图像识别的应用中,卷积神经网络是应用得比较早的深度学习技术,在人脸识别以及其他特征较为明显的图像识别,比如车牌识别、花草树木识别中有着特殊的优势,并诞生了不少行之有效的模型,比如谷歌公司的GoogleNet模型就是基于卷积神经网络的典型模型。深度学习技术在图像领域的应用有着很强的拓展性,尤其是在遥感图像的获取、识别中有着重要意义,这为“百度一下”服务道路交通以及地形探测均有着很好的作用。有研究者构建了深度卷积神经网络模型(DCNN),用来进行遥感水体的识别,实验借助无人机来获取遥感图像,然后以支持向量机法以及面向对象法作为对比的方法,对比结果显示,与其他模型相比,深度卷积神经网络模型的识别效果更佳,是图像领域应用的有效模型。
3.3 音频领域的应用
语音识别是“百度一下”中的重要內容,在语音搜索成为常态的今天,如何有效地提升语音识别的质量成为深度学习技术应用的关键。信息技术的迅猛发展在提高社会生活便捷度的同时,也带来了海量的数据,海量数据的有效利用成为“百度一下”当前的重点所在。在大数据时代,传统的语音识别机制已经越来越难以满足人们的搜索需求,因为传统语音识别一方面在孤立语音的识别中存在着很大的缺陷,难以准确地将孤立语音识别出来,比如一个字、一个词,或者一种声响,另一方面,传统语音识别存在较高的错误率,影响识别的效果。深度学习技术的应用为语音识别的发展与完善提供了新的思路。举例而言,针对传统的混合高斯-隐马尔科夫(GMM-HMM)模型中存在的问题,相关研究者进行了改革,用深度神经网络(DNN)替换了传统的GMM,构建了新的DNN-HMM模型,与混合高斯-隐马尔科夫模型相比,结合了深度学习技术的模型在词汇识别的准确率上有了极大地提升。不仅如此,深度自动编码器(DAE)在孤立语音识别中的应用表明,深度学习技术可以有效提升语音识别的适应性,使其满足孤立语音的识别需要。
3.4 视频领域的应用
多元化发展与综合化运用是“百度一下”未来发展的主要趋势,视频领域的应用则是深度学习技术推动“百度一下”发展的重要领域。从当前深度学习技术的应用现状而言,目标跟踪以及交通监管是视频应用中的重点。此处,深度自动编码器已然有强大的应用机制。基于稀疏约束的DAE模型,能够以非监督训练监督式微调的方法来对模型进行训练,进而在目标追踪中予以应用,比如正在行走的人物或汽车等。仿生眼监控系统的研发与应用对深度学习技术在视频领域中的应用起到了很好的推动作用。有研究人员在GooleNet模型的基础上进行了改进与重构的工作,构建一个三分类的卷积神经网络模型,使深度学习技术得以成功地应用于仿生眼监控系统中,能够有效地对道路交通状况进行识别。视频应用作为目标追踪的主要方式,在实际的使用中存在一些难点,比如在长距离、多目标的追踪中很容易出现混乱乃至丢失追踪目标的现象,而基于深度学习技术的卷积神经网络辅助跟踪法可以有效地弥补此一不足,提升复杂环境下目标追踪的准确度。
4 结语
机器的深度学习是学科交叉融合的产物,主要以人工智能为研究对象,是探讨机器模拟人脑学习的技术,它的核心目标是使机器具有类似于人类那种自我学习、自我发展的能力,从而使自身的性能更加完善,更好地被人类应用于社会实践中,产生更大的影响和效益。百度一下的普及和深入人心是一场突破和开始,百度一下也越来越完善,语音输入、图片输入、智能区分等,在这些基础之上可以明显的遇见,深度学习技术的提倡和发展对“百度一下”的未来发展将产生越来越重要影响,深度学习的理念和延伸将成为“百度一下”未来发展的核心推动力。
(作者单位:台州路桥中学)