APP下载

共链方法在识别竞争对手中的应用--以饮料制造业为例

2011-04-27贾彦龙谭宗颖中国科学院国家科学图书馆北京100190

图书馆理论与实践 2011年1期
关键词:搜索引擎网页白酒

●贾彦龙,谭宗颖(中国科学院 国家科学图书馆,北京 100190)

1 前言

共链接作为网络挖掘的信息源正在被逐渐的重视和利用。很多研究将共链接的分析应用于学术空间,然而有学者发现其在竞争情报研究中也同样可以发挥作用。本文希望在前人研究的基础上,对于在传统行业中应用共链方法识别竞争对手的适用性作进一步的论证。

互联网的应用能够为企业提供有效的竞争情报信息。[1]传统的互联网应用技术大多是基于文档内容的,与经典的信息检索技术和数据库技术有着密切的联系。但是,互联网中特有的许多问题,诸如超大规模的非结构化文档数量、良莠不齐的网页质量、包含在文档中的大量多媒体信息,甚至相当含糊或不规范的用户查询表示等,都使得经典的信息检索技术和数据库技术在互联网环境中很难有效地应用。

然而,互联网又包含了传统数据环境所没有的另一种丰富信息--超链接。创建和利用超链接不是一个无关的现象,而是暗示一种重要的社会反响。[2]他们可以被看作是对目标网页的认可,尤其是创建者已经设置的那些指向有用的或者相关资源的链接。所以,网页间的超链接一方面引导网页浏览的过程,另一方面也反映了网页创建者的一种判断。因此,充分利用互联网的链接结构信息对互联网应用技术进行研究具有极为重要的意义。

目前来讲,利用因特网去获取商业信息的研究还主要集中在网络内容挖掘,而网络链接还没有被充分地运用于这一目的。网络计量学作为一个新兴学科,可以用于挖掘链接(这些链接将网络上的不同文档连接在一起)中包含的信息,进而运用文献计量技术定量地分析网络。目前这一领域研究集中在高校和学术网络空间,[3-5]然而,这一技术同样也可应用于主要的商业站点。WU等人提出指向商业网站的链接包含着有用的商业信息。[6]Vaughan证实链接到一个企业网站的链接数量和一个企业的经营业绩相关,这种业绩可以用总收入和利润来衡量。[7]Kipp等人定性考察了链接到商业网站的目的,不但定量地证实了以上的研究结果,还指出大多数商业网站的链接由商业目的产生。[8]可见,将网络链接应用到企业的情报分析中,可以得到有价值的信息。

共链接作为一种网络链接形式正在逐渐被人们认识,Vaughan对企业之间的链接动机进行了深入的分析,他发现所调查企业网站都不与其竞争对手的网站相链接,但是它们都有可能被第三方链入。也就是说,直接的链接关系并不能为企业竞争情报提供有用的信息,但是利用两个企业网站的共链频次却可以对这两个企业的相似性进行度量,而相似的企业之间必然会存在某种竞争关系,从而就假定可以通过共链的分析方法来判断企业之间的竞争关系。Vaughan利用上述假设,用共链方法研究了电子行业(高科技企业)中企业间的竞争关系,同时,作者也指出此方法应该在其他行业中广泛试用,以便观察其普适性。[9]本文希望能够利用共链方法对传统行业中的饮料制造业企业间的竞争关系进行研究,以对企业间的竞争对手有进一步认识。本研究按照以下标准选取了31家饮料制造业企业作为研究对象(见附录):在国内饮料制造业中营业收入排在前面的企业(数据来源于中国产业信息网和上证交易所)。企业取自于饮料制造业中不同的领域,比如含酒精类饮料制造企业、纯酒精制造企业以及软饮料制造企业(国家统计局分类标准)。

2 相关概念

●入链与出链:在网络链接中有入链与出链之分,入链即是所有指向所要研究的网站的链接,出链则是所有同一个要研究的网页中指向其他网页的链接。[10,11]

●共链接(共链):分为共入链和共出链。所谓共入链即是如果网页C与网页D中都被B所链接(即B中同时存C、D的反向链接),则可称C、D存在共入链。共出链即是网页D中同时存在来自网页B和网页E中的链接,则称B、E存在共出链。图1显示了网络节点间不同的链接类型。[12]

图1 网络中不同的链接类型

表1说明了图1中不同的链接类型。本文主要涉及入链和共入链,像很多关于链接的文章中提到的那样,本文中对共入链与共链当做同义词而未作区分,以下的共入链均由共链代替。

表1 链接类型定义

3 研究方法与分析流程

通过搜索引擎的选取,检索研究对象的入链和共链数据,利用多维尺度分析法将标准化的多维数据投射为二维散点图作进一步分析。

3.1 搜索引擎的选取及相应的检索语句

3.1.1 选取搜索引擎

商业搜索引擎并不是为了学术目的而建立的,结果也并不如我们需求的那样全面。[13]爬行的算法属于商业秘密,对检索信息排序的准确标准也不为我们所知晓,检索结果还会随时间发生波动。尽管如此,商业搜索引擎对于某些网络计量而言仍是唯一的和最好的信息来源。[14]本文对搜索引擎进行了较为广泛的调研,并重点对搜索引擎Google、百度和Yahoo进行了比较,以选择最适合本研究的搜索引擎。

本研究需要对网站内部自身链接进行剔除后才能得到准确的外部入链的数,这样的结果才更准确,[15]而Google不能很好地对外部入链进行区分,百度相对于链接的检索还有待加强。本文重点针对会涉及到的link以及domain两个关键字,对Google、百度和Yahoo这三大搜索引擎的链接检索特点进行了对比,其结果见表2。从比较结果中笔者发现,Yahoo很适合运用于本研究。

3.1.2 检索研究对象的外部入链和共链数

本研究需要得到外部入链和共链的数据,所以需要对所研究的每个企业的网页外部入链数和每一对企业的共链数进行检索。具体的检索式在表3中显示。注意:本文的检索式中site关键字后面只用到了域名的一部分,这样可以更好地排除企业内部自身的入链,从而更准确地得到相应站点外部入链数,[16,17]因为企业可能会使用一些与其网站相关的网址,例如:mail.companyX.com,而不是企业唯一的网址(www.companyX.com)。

表2 搜索引擎的比较

表3 共链、外部入链的检索式

3.2 数据获取与处理

(1)数据获取。为了避免数据的波动,在同一天(2010年3月17日)进行了全部数据的采集,检索了饮料制造业的31家企业的外部入链以及共链数。

(2)数据标准化处理。单纯的共链数并不能准确反映出企业之间的相似程度,比如两企业的外部入链数都是10,那么其共链数是5就可以表示出他们具有很强的相似性,而如果两企业的入链数都是100,那么即使他们共链数是10,相比之下也不能说明企业之间有很强的相似性。因此,本文用Small提出的Jaceard系数来标准化所得到的共链数。[18]

其中Rij为共链数的杰卡德标准化值,用来表示企业i与企业j之间的相似强度;Cij表示企业i与企业j之间的共链数;Ni,Nj表示企业i,j各自的外部入链数(即是企业i,j的反向链接数)。经过这样的处理后,Rij可以比Cij更好地表示出企业间的相似强度。

3.3 多维尺度分析

通过对附录1中的31家饮料制造企业间共链数据进行检索和标准化,即可利用多维尺度分析法对所得到的标准化共链矩阵进行分析。SPSS的多维尺度分析中存在Multidimensional Scaling(ALSCAL) 和Multidimensional Scaling(PROXSCAL) 两种分析过程。其中PROXSCAL可以看成是ALSCAL过程的扩展:

(1)ALSCAL提供了比较经典的5个模型,PROXSCAL使用了 Theory Scaling System Group(DTSS) 的最优化数据转换方法,提供了4个更高级的模型。

(2)ALSCAL对不相似数据进行分析,数值越大表示越不相似。而PROXSCAL既可以分析相似数据,也可以分析不相似数据。

(3) PROXSCAL过程提供了更加丰富的模型诊断、设置和输出。[19]

基于本文共链数据表示企业间相似程度的特性和PROXSCAL自身的优点,本文选用Multidimensional Scaling(PROXSCAL) 进行分析。将31家企业的标准化共链数据导入SPSS[20]并运行PROXSCAL,得到如图2所示的二维散点图。其中模型拟合优度的情况显示Stress值为0.15554,相应的DAF指标为0.84446,因此模型的拟合效果比较令人满意。[21]

图2 31家饮料制造企业共链分析结果的二维散点图

4 结果分析

图2显示了根据企业之间的共链数据,利用MDS分析所得到的31家饮料制造企业在图形中的相对位置。通过数据点之间的远近程度,可以判断企业间的相似程度,进而判断企业间的主要竞争对手。可以看到饮料制造业的这些企业被清晰地聚类到各自不同的品类之中,展示了企业各自主要的竞争对手。

图2中的左下部分主要是白酒制造企业,可以发现,白酒行业中茅台和五粮液比较接近,它们也正是白酒行业的领军企业。2009年五粮液公司实现销售额110.65亿元(人民币),茅台2009年实现营收96.70亿元,在行业中占绝对霸主的地位的同时也存在着强竞争关系。其他的白酒企业与它们的距离偏远,分布较为分散,如图所示稻花香、杏花村、劲牌、泸州老窖,其营业收入都在20-40亿元之间,形成了白酒行业中的第二梯队。注意到图2中杏花村集团既和同等级的白酒企业比较接近,又和同样是保健酒企业--劲牌比较接近,这反映出杏花村集团在“十五”期间倾力打造白酒基地和保健酒基地的战略意图,杏花村集团也成为了同等级白酒与保健酒企业的有力竞争者。而像古井贡酒、水井坊和枝江则形成了白酒业中营业收入在10-20亿之间的第三梯队中的主要竞争者。剑南春作为一个2009年营业额在28亿元的企业似乎其位置有些异常,显得与软饮料的维维企业距离很近,究其原因,可能是与2009年维维企业传出入股剑南春传闻有关,造成这两家企业被更多的企业同时关注,其共链的数据变得更多。最终,维维入主枝江酒业,获得其51%的股份。从3年前维维股份以8000万元收购了双沟酒业38.27%的股份开始涉足白酒行业到如今收购枝江酒业的成功,可以说,维维也在白酒行业占有一席之地。在图2中,传统认为的维维豆奶制造企业却和白酒类企业距离更近,需引起饮料制造业同行的注意,将其视为白酒企业中的竞争对手或潜在的竞争对手是有据可循的。

青岛啤酒和燕京啤酒位于图2的右上角,而其余啤酒企业分布在图2的左下方位置。这正好印证了青岛啤酒和燕京啤酒是行业内普遍被看好的两家龙头企业,属于全国性品牌,在全国范围内展开竞争。而像华润、哈尔滨、珠江啤酒充其量也都是地方性品牌,只能在其相应的地域中充当主要竞争者。

图2最上面的3家企业张裕、王朝和长城聚在一起,它们的市场份额占据了葡萄酒市场的半壁江山,[22]印证了它们是葡萄酒市场的传统三强。

南阳天冠是主要以食用酒精生产为主的企业,与图2中其他企业不存在明显的竞争关系,在图2中表现为孤立的散点。

图2同样较好地展示了软饮料制造企业之间的主要竞争对手。杭州娃哈哈集团公司与广东乐百氏集团公司位于图2的最右侧,它们都是在上个世纪90年代高速成长而享有盛誉的国内大型名牌企业。它们市场竞争的领域都集中在两条路线上,即从1992年开始的乳酸奶市场(从单纯的生产儿童类饮料产品扩大到成人市场),到1996年又扩大到瓶装水市场。红牛和健力宝在图2中的右下角,这两家企业则在功能型饮料中展开激烈的角逐。[23]同样,我们还可以发现在中间偏上部分的银鹭和安德利则主要在果汁饮料行业中有明显的竞争。比较有争议的就是可口可乐和百事可乐这两家企业在图2中的距离比较远,且可口可乐距离其他不含汽的软饮料都比较接近,而百事距离他们就相对远了很多。这可以从两家企业存在战略分化的迹象上加以解释。可口可乐在华投资了全球最大的、设备最先进的不含气饮料的生产基地,辐射全国发展奶饮料和果汁饮料等不含汽饮料,企图全面进军不含汽饮料市场,而百事可乐则继续在含汽饮料市场扩张,可见共链的方法对于竞争对手之间战略意图的变化也有一定的揭示作用。

通过以上的分析,我们发现利用共链分析方法得到的多维尺度图像基本上反映了这31家饮料制造企业间的竞争关系,其中存在的异常点也可以从实际情况得到较好的解释。

5 结论与展望

在选取适合的搜索引擎的基础上,本文通过共链分析方法,利用PROXSCAL对31家饮料制造业企业进行聚类,用二维散点图标示了各企业所处的位置,进一步实证了共链方法可以应用到传统行业中企业间竞争对手的识别。[12]但该方法存在局限性,比如,在共链方法运用中,共链的计数并未因网页的不同而有所区别,但实际上,不同网站的重要程度是有差别的,是否可以通过有权重的共链计数达到更趋于合理的共链方法,例如可以利用Google所提供的网页的PR值标示网页权重,再与共链方法相结合,可能会达到更合理的效果,希望在以后的研究中进一步探索。

附录31家饮料制造企业列表

[1] Porter ME.CompetitiveStrategy:Techniquesfor Analyz ingIndustriesand Competitors[M].FreePress(New York),1980:147.

[2] Turow J,Tsui L.The Hyperlinked Society:Questioning Connections in the Digital Age[M].The University of Michigan Press,2008:43.

[3] Thelwalll M,Wilkinson D.Finding similar academic web sites with links,bibliometric couplings and colinks[J].Information Processing and Management,2004,40(3):515-526.

[4] Bjorneborn L.Small-world link structures across an aca demic web space[D/OL].[2010-04-20].http∶//www.db.dk/lb/phd/phd-thesis.pdf.

[5] Eckmann J-P,Moses E.Curvatureof co-linksuncovers hidden thematic layers in the World Wide Web [J].PNAS,2002,99(9):5825-5829.

[6] Vaughan L,WUG.Links tocommercial web sites as a source of business information [J].Scientometrics,2004,60(3):487-496.

[7] Vaughan L.Web hyperlinks reflect business performance:a study of U.S.and chinese ITcompanies[J].Canadian Journal of Information and Library Science,2004,28(1):17-31.

[8] Vaughan L,etc.Whyare hyperlinks tobusiness websites created?A content analysis[J].Scientometrics,2006,67(2):291-300.

[9] Vaughan L,You J.Miningweb hyperlink data for business information∶the case of telecommunications equipment companies[C]//Proceedingsof the First IEEE International Conference on Signal-Image Technology and Internet-Based Systems.Cameroon:[s.n.],2005:190-195.

[10] Ingwersen P.The calculation of webimpactfactors[J].Journal of Documentation,1998,54(2):236-243.

[11] Thelwall M.Conceptualizing documentation on the web∶Anevaluationof differentheuristicbased modelsfor counting links between university web sites[J].Journal of the American Society for Information Science and Technology,2002,53(12):995-1005.

[12] Bjorneborn L,Ingwersen P.Toward a basic framework for webometrics[J].Journal of the American Society for Information Science and Technology,2004,55(14):1216-1227.

[13] Bar-Ilan J.The use of web search engines in informationscienceresearch[J].Annual Reviewof Information Scienceand Technology,2003:231-288.

[14] Thelwall M,etc.Webometrics[J].Annual Review of Information Science and Technology, 2005, 39:81-135.

[15] Ingwersen P.The calculation of web impact factors[J].Journal of Documentation,1998(54):236-243.

[16] Smith A,Thelwall M.Webimpactfactorsfor Australasian universities[J].Scientometrics,2002,54(3):363-380.

[17] Thelwall M.Extracting macroscopic information from weblinks[J].Journalof the American Societyfor Infor mation Science and Technology,2001,52(13):1157-1168.

[18] Small H.Co-citation in the scientific literature:A new mea-sure of the relationship between two socuments[J].Journal of the American Society for Information Science,1973,24(4):269.

[19]张文彤.SPSS统计分析教程 高级篇[M].北京:希望电子出版社,2008.

[20] Meulman J,Heiser W.SPSS Categories 11.0[M].Chicago:SPSSInc,2001.

[21] Mena J.Web Miningfor Profit∶E-Business Optimization[M].Boston:Digitalpress,2001.

[22]张娅琳.长城葡萄酒竞争营销策略研究[D].北京:对外经济贸易大学,2005.

[23]鲍捷.脉动品牌策略分析[D].成都:西南交通大学,2005.

猜你喜欢

搜索引擎网页白酒
基于CSS的网页导航栏的设计
推动白酒行业生产方式升级(二)
基于URL和网页类型的网页信息采集研究
太白酒
网页制作在英语教学中的应用
网络搜索引擎亟待规范
一起自制白酒引起甲醇食物中毒的调查报告
基于Nutch的医疗搜索引擎的研究与开发
10个必知的网页设计术语
广告主与搜索引擎的双向博弈分析