APP下载

人工智能改变搜索引擎优化的速度超乎想象

2016-11-14约翰·兰普顿

飞碟探索 2016年11期
关键词:搜索引擎深层人工智能

约翰·兰普顿

现在,人人都对谷歌的人工智能系统有所耳闻,这款人工智能计算系统是迄今美国加州山景城最新、最尖端的计算技术。然而,许多人或许并没有意识到该系统改变搜索引擎、优化行业的速度之快。本文将借助一些实例,说明当原有的搜索引擎优化程序不再有效时,若要在商业领域赢得搜索引擎优化战役、站在领军者的行列,应当采取哪些措施。

那么,什么是人工智能?

总体而言,人工智能可分为三类:

1.狭义人工智能:针对特定任务设计的人工智能程序(例如在国际象棋比赛中击败世界冠军的人工智能程序)。

2.通用人工智能:可执行任何任务的人工智能程序。一旦人工智能程序如同人类一般执行各项任务,我们便将其认定为通用人工智能。

3.超级人工智能:任务执行能力普遍高于一般水平(超出了普通人的能力)。

目前提及的谷歌人工智能系统和谷歌现行的机器计算法,都属于狭义人工智能。

事实上,狭义人工智能技术问世已经有一段时间了。你可曾想过,电子邮件系统中的垃圾邮件过滤程序就属于狭义人工智能的范畴。下面将介绍几种我比较青睐的人工智能技术程序:谷歌翻译、IBM沃森计算系统、由亚马逊出品的“向顾客推荐产品”的酷炫程序、自动驾车程序,当然了,还有倍受青睐的谷歌人工智能系统。

狭义人工智能具备多种运算方法,正如佩德罗·多明戈斯在《主算法》一书中所言,试图打造完美ANI程序的数据科学家可大体分为五大“阵营”:符号学家、联系论者、进化论者、贝叶斯统计学者和类比学家。

谷歌人工智能系统正是联系论者的结晶。他们认为,知识以编码的形式存储于大脑神经元之间。而人工智能系统采用的具体策略正是这些专家所称的反向传播技术,也被称作深层强化学习技术。

联系论者声称,这种策略具备从一切原始数据获取知识的能力,正因如此,它具备将知识汲取过程自动化的能力。很显然,谷歌在这一点上持相同看法。2014年1月26日,谷歌宣布收购深层强化学习技术,在本质上,这项技术实属反向传播产品。

因此,在谈论人工智能系统技术的时候,我们可以告诉人们它包含狭义人工智能的一项特殊技术,即反向传播技术,或者深层强化学习技术。既然我们已经解决了“什么是人工智能”的问题,那么接下来的问题便是,这一领域的进展如何?更重要的是,人工智能系统究竟是如何改变搜索引擎的?

技术(和人工智能)的迅猛发展

蒂姆·厄班在他的文章《人工智能变革:超级人工智能之路》中对科技发展做出的解释比其他解释都要略深一筹。

回顾历史,就会发现技术进步的曲线如图1所示。

但是,正如厄班所言,在现实中,个人无法看清图像上所处位置右边的上升趋势(也就是未来的上升趋势)。因此,图2所示才是图中人当时的真实感觉。

也就是说,人类力图预测未来的时候,总是低估了未来的种种可能性。这是因为他们往往着眼于所处位置左边的图景,而不是右边的未来趋势。

然而,现实情况是,随着时间的推移,人类的发展进程越来越快。雷·库兹韦尔将这种趋势称为“加速循环法则”。这一原创理论背后的科学原理在于:与不太发达的社会相比,由于发达社会更为先进,因此能以更快的速率继续向前发展。当然啦,人工智能的发展和目前先进技术的增长速度也是如此。

目前的计算资源也体现了这种越来越快的速度,我们可以清楚地看到,并能直接感受到,高级运算和计算机都获益于“加速循环法则”。更加令人震惊的是:在未来某个节点,一台节约型电脑的运算能力不仅会超过个人,而且会超过全人类运算能力的总和。

事实上,按照现在的趋势看来,我们将能在2025年左右实现通用人工智能(AGI)。很明显,技术发展的速度越来越快,从许多方面来看,大多数人都会对此措手不及。

超智能的崛起

正如上文所述,谷歌的人工智能系统只是一种狭义人工智能形式。这意味着,尽管狭义人工智能程序在某一特定领域超越了个人,却只属于相对较弱的人工智能形式。

然而,这种“弱势”人工智能很可能轻易地转化为某种令我们手足无措的事物,而且转化速度之快出乎我们的预料。

你可以从图3中清楚地看到,尽管在某一特定任务中属于超智能等级,但是在多数情况下,谷歌的人工智能系统在智力等级量表中所处的级别是:相当不够智能。

但是,如果将“加速循环法则”应用于人工智能后会发生什么?蒂姆·厄班带领我们体验了一场思想实验之旅:

“即使人工智能在智力方面不断地接近人类,但在我们看来,它也只是比原来聪明了一点儿,这就和我们看待动物是一样的。当人工智能的智力水平终于达到人类最低水平的时候(即尼克·博斯特伦所说的“村野白痴”水平),我们通常的反应是:“哇哦,就像个傻瓜一样。简直太可爱了!”现在唯一确定的是,在宏大的智力图谱上,从“村野白痴”到“爱因斯坦”,人类智力图谱的范围实际上十分狭窄。所以说,只要达到“村野白痴”的智力水平,就可以声称人工智能成了通用人工智能,或许突然之间它会比爱因斯坦更加聪明,但我们无法预知究竟会发生什么。

那么,对搜索引擎优化行业和我们身边的人工智能而言,这种趋势究竟意味着什么呢?

搜索引擎优化发生了永久性的变革

在预测未来之前,不妨先谈谈人工智能系统改变搜索引擎优化的方式。我曾与斯科特·斯托弗促膝交谈,他是我在卡耐基梅隆大学的校友、朋友,市场策划公司的现任首席技术官,也是创始人之一,这家公司为全球500强企业搜索引擎优化团队提供搜索引擎模型。作为一名搜索引擎工程师,他对过去的10年有着独特的见解,而大部分搜索引擎行业的专业人士并未意识到这些。谈到谷歌公司开始将重点放在人工智能领域时,他为搜索引擎优化行业提了几点建议。

1.如今使用的回归分析存在严重缺陷

目前,回归分析是搜索引擎优化行业最大的缺陷。每当谷歌的排名榜发生较大的变化时,很多预言家便应运而生。通常毫无例外的是,一些数据科学家和搜索引擎优化行业知名公司的首席技术官就会信誓旦旦地断言,谷歌排名最近出现的变化“确有缘由”。他们通常所做的分析包括追溯事件发生前数月间的排名数据,然后查看各家网站的排名发生了怎样的变化。

这些数据科学家利用回归分析法时,都是指出受到影响(正面或负面)的一种具体类型的网站,并且得出十分确定的结论,认为谷歌最新的计算方法变化转型来自这些网站分享的具体类型算法(内容或反向链接等)。

然而,目前谷歌的运行方式已经不是这样了。作为一款机器学习法或深层强化学习法产品,谷歌人工智能系统的运行机制截然不同。

谷歌公司内部仍有许多核心算法。人工智能系统的工作任务在于:充分了解这些核心算法如何混合搭配才能更适用于不同类型的搜索结果。例如,在某些搜索结果中,人工智能系统或许知道最重要的信号是标签标题。

增加对标签标题匹配算法的关注度,可能会带来更好的搜索体验。然而,换一种搜索结果后,同一信号带来的搜索体验或许根本谈不上良好,甚至是极其糟糕的。因此,在另一种垂直搜索中,也许另一种算法,即网页排名更有效。

这也就意味着,针对不同的搜索结果,谷歌都会提供截然不同的混合运算法。现在我们终于明白,脱离搜索结果所处的大环境后,针对各个网站进行的回归分析为什么存在极大的缺陷。

正因如此,当今的回归分析必须借助特定的搜索结果来进行。斯托弗提出了一种搜索建模路径,可以衡量谷歌的计算法发生的变化。首先,对于特定的关键字搜索,可以通过快照的方式,拍下之前搜索引擎模型的调整情况。然后,在发现排名变化之后,重新调整搜索引擎模型,显示出前后两种搜索引擎模型设置的变量。通过此种方法,在排名发生变化的时候,我们就可以清楚地看到哪种算法升级了,哪种降级了。

2.人类力图预测未来时,总是低估未来的种种可能性

了解了这类相关知识后,我们可以致力改进搜索引擎优化的特定部分,针对不同的搜索结果搜索相关网站。但是,这种方法将不会(也无法)适用于其他搜索结果。这是因为人工智能系统依据搜索结果(或关键字)进行搜索。顾名思义,是为每个搜索结果量身定做的最佳算法。

3.进行市场定位,避免错误分类

谷歌意识到,可以教给全新的深层强化学习系统如何辨别“好”网站与“坏”网站。针对各种搜索结果,谷歌会权衡并提供不同的算法。同样,谷歌公司认识到,每个垂直搜索中都包含“好”网站和“坏”网站。毫无疑问,这是因为不同的垂直搜索拥有的客户关系管理系统不同、模板不同,整体数据结构也不同。

人工智能系统的运行,实际上等于是学会在各种环境中进行正确的“设置”。正如你已经猜到的那般,这种设置完全依赖于操作过程中的垂直搜索。因此,举个例子来说,谷歌知道医疗健康服务网是医疗行业中的知名网站,在排名时想将其置于搜索结果目录的顶部。任何类似于医疗健康服务网站点结构的网站都将被归入“好”网站之列。同理,在医疗业搜索中,任何类似于垃圾网站结构的网站都会被划入“坏”网站之列。

人工智能系统借助深层强化学习能力,对“好”网站和“坏”网站进行分类汇总。设想一下,假如有一家网站不加归类地杂糅各行各业的内容,将会出现什么情况呢?

首先,对于深层强化学习系统如何运行的问题,仍必须对诸多细节进行讨论。在将网站区分为“好”与“坏”两个阵营之前,人工智能系统必须确定所有网站的具体类型。尽管耐克官网或者医疗健康服务网上都拥有各种各样的次级类别,但其总体类型显而易见,因此这类网站很容易区分。

但是如何区分涵盖多种不同类型内容的那些网站呢?比如指南型系列网站,此类网站涵盖的信息种类繁多、庞杂。针对这种情况,深层强化学习系统根本无能为力。那么谷歌对这些网站采用了哪些数据呢?回答是:看起来可能很随意。谷歌可能会选择其中的某种信息类型。对于维基百科等知名网站,谷歌可能会放弃分类过程,以确保深层强化学习过程不会降低现有的搜索体验感受(即所谓的“大而无当”)。

4.搜索引擎优化将会极度专业化

但对不太知名的网站来说,这意味着什么呢?很有可能,机械学习程序会自动对所有网站进行分类,之后再将其与其他网站进行比较。可以说,指南型系列网站看起来近似于医疗健康服务网。太棒了,不是吗?

如果分类程序认为一家网站属于鞋类网站,那么就会将其与耐克的官网(而非医疗健康服务网)进行比较。结果这家网站的结构看起来很像垃圾鞋类网站,因此这种无所不包的网站可能被轻易地标记为垃圾网站。如果操作指南型网站涵盖不同领域,那么就很容易使每种类型都仿佛接近本行业内领先的样子,一定要进行市场定位。

5.反向链接令人不安

现在,让我们来看看反向链接受到了什么样的影响。基于上述分类程序,坚持“链接近邻”原则尤为重要,如果垂直搜索中的同类反向链接配置有所出入,人工智能系统便会即刻感知到。

仍然以上述的例子为证。假设一家公司拥有一个鞋类网站。根据我们的常识,人工智能系统的深层强化学习系统会尝试将其各个方面与最佳鞋类网站或最差鞋类网站进行比较。因此,顺理成章,这家网站的反向链接配置会与最佳或最差网站的反向链接配置进行对比。

我们也可以这样说,信誉良好的鞋类网站拥有来自相关临近领域的反向链接,即运动类网站、保健类网站和时尚类网站。

目前,该公司的搜索引擎优化团队决定开始从近邻中寻求反向链接,并增添了新的近邻——汽车业,这是由于公司的首席执行官之前与汽车业有关系。该公司的设计十分“巧妙”,他们在汽车网站上构建了一个交叉销售网页,“买车签约即送新鞋”,点击后就会链接到该公司的新款鞋。完全不着痕迹,不是吗?

人工智能系统将会注意到这一点,注意到这种反向链接配置看起来与信誉良好的鞋类网站截然不同。而更糟糕的是,大量垃圾鞋类网站也有汽车网站的反向链接配置。哇!

就这样,在不了解“正确”的反向链接配置是什么的情况下,人工智能系统已经对搜索引擎的搜索结果做出了“好”与“坏”的判断。新的售鞋网站已经被标记为垃圾网站,浏览量开始暴跌。

搜索引擎优化和人工智能的未来前景

正如我们在讨论加速循环法则时谈到的那样,人工智能系统和其他人工智能将会在未来某个时刻超越人脑。而现在,无人知晓科技将引领我们走向何方。

不过,有些事情是确定无疑的:

任何竞争激烈的关键字设置都需要自检;

大多数网站将需要进行市场定位,防止被错误分类;

所有网站都应该模仿本领域内一流网站的结构和要素。

在某些方面,深层强化学习方法使搜索引擎优化变得更加简单。人工智能系统及同类技术几乎与人脑相当,它们遵循的规则十分简洁明了:不再出现漏洞。

在其他方面,前路略为坎坷。搜索引擎优化领域将极度专业化,分析学和大数据成为日常运营的基本准则。对任何不熟悉这些方法的搜索引擎优化而言,还有很多工作要做,需要奋力猛追。而对拥有相应技能的技术人员来说,数目可观的薪金指日可待。

猜你喜欢

搜索引擎深层人工智能
考虑各向异性渗流的重力坝深层抗滑稳定分析
人工智能与就业
SAM系统对TDCS数据的优化处理与深层应用
对“医患失去信任”的深层忧虑
网络搜索引擎亟待规范
Nutch搜索引擎在网络舆情管控中的应用
基于Nutch的医疗搜索引擎的研究与开发
广告主与搜索引擎的双向博弈分析
电视节目低俗化的深层反思