搜索引擎中的SEO理论与实践
2010-05-08楼新远
张 楠,楼新远
(西南交通大学 信息科学与技术学院,成都 610031)
互联网上的信息非常庞大,复杂,对于检索者就像一个Maze迷宫一般。时至今日,它依然还在以非常惊人的速度膨胀着,正是由于诞生了搜索引擎这样的技术,万维网复杂的局面才被打破,帮助大家找到重要的而且也是自己需要的信息,它已经逐渐成为人们查询资料、获取信息的高效、便捷的方式。
随着搜索引擎的广泛使用,以针对搜索引擎的原理和特点,设计对它友好的网页,以提升被检索的机会为研究内容,产生了搜索引擎优化(SEO)技术。人们使用搜索引擎查找自己需要的Web挖掘、计算机应用。
1 SEO技术
SEO(search engine optimization)的中文意思就是搜索引擎优化。主要工作是通过了解各类搜索引擎如何抓取互联网页面、如何进行索引以及如何确定其对某一特定关键词的搜索结果排名等技术,来对网页进行相关的优化,使其提高搜索引擎排名,让目标用户找到自己,从而提高网站访问量。
1.1 SEO优化公式
SEO=∫Clock dt=∫(C1+L2+K3+O4)dt
(1)C=content,L=link,K=keywords,O=
others。SEO就是一个长期的对“时间”积分过程,内容是核心。
(2)C1:丰富的内容是第1位的要素,按照原创、伪原创、转载依次排列内容的重要性满足用户体验。
(3)L2:链接的合理与丰富是第2位的要素,合理有效的内部链接与丰富的外部链接同等重要,而外部链接中高度相关性高PR值页面尤为重要。
(4)K3:关键字因素是第3位的重要因素,包括:合理的Title、Description、Keywords、页面关键字及相关关键字的密度与合理布局。
(5)O4:其它因素,比如:域名、站龄、服务器、网站架构、排版、Url、地图等。
这个公式把SEO很概括的阐述了,把SEO优化需要注意到的问题,都考虑进去了。根据这个公式,结合具体的实际操作来讨论SEO搜索引擎优化的具体步骤。
1.2 搜索引擎的工作原理
SEO是对网站开展针对搜索引擎的优化工作,因此了解搜索引擎的工作原理有利于优化工作的开展[1]。搜索引擎通过一个称之为Spider的程序从一个网页或者多个网页出发,逐步遍历网上的文件。Spider首先解析网页的HTML代码,查找该页面内的超链接,然后根据超链接搜索网页,并建立关键词与其所在位置的对照表。搜索引擎为搜索到的网页建立索引并存入数据库中。当用户输入要搜索的关键字时,搜索引擎根据输入的关键字从数据库中查找匹配的网页,并将结果返回给用户。
2 SEO的优化流程
选择服务器→注册域名→关键词研究→基于“蜘蛛友好”网站设计→站点内容强化→链接建立。
笔者曾经给印刷行业的一家公司进行过SEO服务,下面结合这个具体的案例,来分析SEO优化的方法和策略。
2.1 选择服务器
检查服务器的IP是否被搜索引擎处罚过是SEO的第1步,是必须掌握的技巧。以例举的印刷公司所在服务器的IP地址为例,通过在地址栏中输入http://whois.webhosting.info/IP地址 来查询该IP地址上的所有网站;通过在Google中来查询这个网站一共有多少个页面被收录。如果大部分都是没有被Google收录的话,那么很有可能这台服务器是被Google处罚过的。为了保险期间,最好别用。
2.2 域名选择
(1)域名的命名应该尽量简洁并且有一定的内涵和意义。(2)对域名后缀的选择,最好选择“.com”“.net”“.cn”“.com.cn”“.org”等后缀有着更高的排名优势。
2.3 关键词研究
在搜索引擎优化中,对关键词的定位和分析处于核心位置。如果选择了过于热门的关键词,则可能会浪费大量的人力和物力,还不容易得到好的排名;如果选择了冷门的关键词,及时得到了好的排名,虽然能给网站带来一定流量,但是无法提高潜在客户转化率;如果选择了不准确的关键词,则可能给网站带了一些垃圾流量,甚至会增加网站服务器的负担,影响浏览速度。因此,对于关键词的研究,就成了搜索引擎优化的重中之重。
2.3.1 关键词选择中的“长尾理论”
长尾理论(The Long Tail)是网络时代兴起的一种新理论,由美国人克里斯·安德森提出。长尾理论认为,由于成本和效率的因素,过去人们只能关注重要的人或重要的事,如果用正态分布曲线来描绘这些人或事,人们只能关注曲线的“头部”,而将处于曲线“尾部”、需要更多的精力和成本才能关注到的大多数人或事忽略[2]。例如,某著名网站是世界上最大的网络广告商之一,它没有一个大客户,收入完全来自被其他广告商忽略的中小企业。长尾理论对于搜索引擎优化中的关键词策略非常有用。即虽然少数核心关键词或通用关键词可以为网站带来可能超过一半的访问量,但那些搜索人数不多然而非常明确的关键词的总和—即长尾关键词同样能为网站带来可观的访问量,并且这些长尾关键词检索所形成的顾客转化率更高,往往也大大高于通用关键词的转化率。
2.3.2 长尾关键词的选择
长尾关键词基本属性是:可延伸性,针对性强和范围广。
长尾关键词一般有以下几种形式:
(1)与企业产品或者网站定位精确度高的词语,此类关键词针对一些有明确目标需求的搜索引擎引入的用户,这类人群是对你所经营的网站产品有着明确认知程度的人群,但是这部分人群是网站流量的一小部分。大概占据网站整体流量的20%左右。
(2)产品或者网站业务扩展出来的关键词,这是面向对你经营的网站或产品有着模糊概念的访问人群设计的关键词。这块流量估计占整体网站搜索引擎流量的30%左右。
(3)即将有可能成为搜索用户使用并且找到网站的关键词,这类关键词语可以理解为比较长尾性关键词语,可能是业务的周边产品的延伸词,或者是与网站内容扩展出的相关词,这块流量估计占整体网站搜索引擎流量的20%左右。
以“印刷”这个关键词作为基本关键词扩展。
通过搜索引擎相关搜索来确定长尾关键词。
图1是通过Google关键词工具,输入“**印刷”得到的一些相关关键词。可以看到“**印刷”这个关键词,全球的搜索引擎用户搜索的次数比较多,属于相对热门的关键词,优化难度较高。
图1 关键词搜索界面图
2.3.3 长尾关键词的部署
网站的每一页都要针对该页面的标题,而不是全部使用一样的标题。而且,在主要页面的标题中还要有尽可能丰富的关键词。
meta元素嵌入了某些搜索引擎用于索引和分类万维网上的文档时所用的文档信息,meta标签应尽量符合当前页面的内容。
(3)
标签
搜索引擎对
这样的信息很感兴趣,而且会对其增加权重,所以把最重要的信息用标识出来,把次重要的信息用标识出来。
(4)标签
这些标识也会被搜索引擎很好地注意到,虽然权重不如
那么高,可以灵活使用。
(5)
用来对网页上的图片进行描述,光标在图片上时显示的提示语即采用该标签实现。
2.4 基于“蜘蛛友好”网站设计
2.4.1 建立网站地图
对于用户,大多数人都知道网站地图对于提高用户体验有好处:为网站访问者指明方向,并帮助迷失的访问者找到他们想看的页面。搜索引擎蜘蛛非常喜欢网站地图,对于SEO,网站地图的好处就更多了:
(1) 为搜索引擎蜘蛛提供可以浏览整个网站的链接。(2)为搜索引擎蜘蛛提供一些链接,指向动态页面或者采用其他方法比较难以到达的页面。
2.4.2 Flash优化
Flash 技术给互联网带来了更丰富的用户体验,增加了演示和虚拟旅行的情趣,使你的网站更加吸引人,但是搜索引擎蜘蛛不能索引 Flash 的内容,因为Flash更像一段视频。所以,Flash里的文本需要从在外部读取。比如,每一则新闻做成一个HTML文件,既让Flash可以读取,也让搜索引擎蜘蛛可以抓到。如news1.html,news2.html,news3.html[3]。
2.5 链接建立
2.5.1 Google PageRank算法
了解Google的PageRank算法对于进行搜索引擎优化有重要意义。PageRank 是Google算法的重要内容。PageRank里的page不是指网页,而是指佩奇,即这个等级方法是以佩奇来命名的[4]。PageRank是最早利用超链接信息进行Web挖掘的算法,也是在商业应用中最成功的一种算法,被Google搜索引擎采用。
该算法的基本思想如下:设页面i的链入集合为{T1,T2,…,Tn},即{T1,…,Tn}中的每一个页面都链接到页面i,C(i)为页面i的链出页面数,则页面i的等级值PR(i)可以通过以下两步计算得出:(1)以概率e随机取Web上任一页面。(2)以概率1-e随机取当前页面任一链出页面。
从上面公式可以看出,如果网页T存在一个指向网页i的连接,则表明页面T的所有者认为页面i比较重要,把T的一部分重要性得分赋予i。这个重要性得分值为:PR(T)/C(T)。该算法的优点是与用户查询条件无关,只是给出每一页面的等级值,作为Google搜索引擎搜索结果排序的一个参考值,等级越高的页面排序越靠前,所有网页的PageRank值通过离线计算获得;有效减少在线查询时的计算量,极大降低了查询响应时间。
2.5.2 反向链接的建立
Google的PageRank根据网站的外部链接(反向链接)和内部链接的数量和质量来衡量网站的价值。PageRank这个概念引自学术中一篇论文的被引述的频度—即被别人引述的次数越多,一般判断这篇论文的权威性就越高[4]。提高网站的反向链接对提高网页的排名至关重要,网站的反向链接要从两个方面着手建立:
(1)链接数量 一般来说,收到较多链接的网页会比收到较少链接的网页排名高些。根据上面公式,链入集合{T1,T2,…,Tn}的数量越多,说明被人引用的次数越多,在概率e一定的情况下,链入集合数量大有利于提高网页的PR值。
(2)链接质量从受尊敬的和具有权威性的来源获得认可比其他的更有价值。搜索引擎通过检查链接来源站点的链接流行度来判断权威性。因此,如果一个高权威性的站点链接到你的网站,这就将它的一些权威性赠与到了你的页面。搜索引擎将最高页面排名的要素归因于从很多高质量站点来的链接。从上面公式可以看出,链入集合中网页的权威性比较高的话(表现在PR值比较高),在数量n一定的情况下,页面i也将获得比较高的PR值。比如,笔者服务的印刷公司网站首页就有一定数量的反向链接,同时这些链接大多来自流量较大的地方门户网站以及印刷行业的权威性网站。
2.6 站点内容强化
(1)有效地建设高质量的原创文章,使得内容即适合用户浏览阅读,又适合搜索引擎的蜘蛛,让这些文章能够提升自己网站的搜索引擎排名。
(2)内容的呈现方式清楚、直接而明确。不论使用何种语言进行撰写都尽量使用清楚而具体的语句、简洁而明确的句法,并且在该加上批注的地方加注,标示缩写与头文字等。以便使处于各种层次的浏览者都能理解网站内容。
3 结束语
搜索引擎优化是一个系统的工作,从搜索引擎的优化公式知道,丰富的内容、一定数量的网站内部链接结构和优质的外部链接数量,以及准确的关键词选择和部署,才能使网站的网页在搜索引擎中获得好的排名,即成功地完成SEO搜索引擎优化工作。
[1]廖键双. 浅谈企业网站优化技术_SEO技术[J]. 科技风,2009,8(4):505-508.
[2] 吕 梁. 关键字策略在SEO中的应用研究[J]. 电子商务,2009,2(3):100-102.
[3]张 丹. FLASH网站的SEO研究[J]. 信息技术,2009,2(4):147-149.
[4] 江裕民. 基于超链接的WEB结构挖掘算法研究[M]. 西安:西安电子科技大学,2006(1):26-29.
[5] 陈洁惠. 搜索引擎排序算法的研究[J]. 河海大学,2007(3):11-13.