最昂贵的方程式
2009-07-06黄自昌
黄自昌
大家知道,可口可乐是美国文化的象征,它几乎征服了全世界,100多年来创造了巨大的财富。不过,成就可口可乐传奇的却是一个小小的配方。据称,这个配方价值40亿美金。可口可乐公司老板自负地说,假如一场大火烧毁了公司,凭着这个配方,他们第二天就会又有一个可口可乐公司。不过,现在有一样东西比可口可乐的配方还要保密。其价值更是难以估量,它就是著名的搜索引擎谷歌的核心算法Page Rank。
20世纪90年代初期,互联网方兴未艾,新网站如雨后春笋般涌现。面对浩如烟海的网页内容,网民们要找到自己所需要的内容,真像大海捞针一样。他们急需一个工具,帮助他们在网络上找到有用的内容,于是,雅虎应运而生,给网民们带来了很大的便利,受到了廣泛的欢迎。随后,其他一些搜索引擎如Altavista、Ex-cite、LyCOS等相继推出。这些搜索引擎虽然能够帮助用户找到有价值的信息,但也有一些不足,比如搜索自动化程度不高,难以适应网络爆炸式发展的局面:搜索结果的质量不尽如人意,往往是一长串毫不相干的结果,没有任何一个搜索引擎能对搜索结果进行科学准确的分类排序。
此时,谷歌公司的创办者拉里·佩奇和塞吉·布林,正在斯坦福大学读书。雅虎的飞速发展让他们看到了网络搜索的前景,他们坚信,搜索引擎会对整个世界产生影响。于是他们把大部分精力都放到了网络搜索的研究上,决心开发出一个更好的搜索引擎。
佩奇和布林分析研究了现有的搜索引擎和许多学术著作,他们发现,这些搜索技术都局限于网页内部,局限于对网页内容的分析和评价,而对于海量的网络数据这是很难做到的。佩奇逐渐认识到,应该跳出网页内容,寻找一种更客观、更简单的评判标准。在此基础上,佩奇提出了一个革命性的想法,这种想法是谷歌搜索引擎的核心。
作为谷歌搜索引擎的核心内容,它的原理却很简单,它受到了学术论文评价方法的启发。一般情况下人们认为,一篇论文被引用的次数越多。它的权威性就越高。在网络上也是这样。网络上的引用就是链接,如果一个网页被很多其他网页所链接,说明它受到了普遍的承认和信赖。通俗地说,每个链接都好像是对页面的一次投票,被链接得越多,就意味着获得的选票越多,说明这个网页更有价值,应该被排在前面。佩奇还对来自不同网页的链接给予区别对待,被重要网站链接,说明这个网页更有价值,正像被名家引用表明论文更有权威一样。
按照这个原理,佩奇和布林设计出了复杂的算法,用一系列方程式来计算网页的价值和排名,这些方程式考虑了众多的影响因素,使佩奇的原始想法得到了很好的实现,它第一次使人们可以迅速地在互联网中进行搜索并找到有用的结果。这些方程式是谷歌的核心机密,世界上没有几个人知道,被称为最昂贵的方程式。他们把这些方程式的集合命名为Page Rank(网页等级排名),其中不仅嵌入了拉里·佩奇(Larry Page)的名字,还表明了这些方程式的功用。
算法有了,还需要为搜索引擎起一个响亮的名字。佩奇的同事肖恩建议叫“coogol”,它的意思是10的100次方,表示互联网信息无穷无尽的特点,也喻示搜索引擎挑战极限的能力。可是枉后来注册的时候,不擅长拼写的肖恩却写成了“Google”。对于这个因失误而产生的名字,佩奇十分嘻欢。同“雅虎”和“亚马逊”一样,这个名字很有互联网公司的气质。
1997年9月15日,“google.com”正式注册。凭着独特的算法,谷歌成了互联网搜索领域的霸主。目前Coogle旗下雇员有两万人,市值达1500亿美元。