APP下载

移动互联网下信息搜索趋势及问题的研究

2014-01-18黄世祥

关键词:搜索引擎用户信息

刘 宏,黄世祥

(安徽农业大学经济管理学院,安徽合肥,230036)

一、互联网信息搜索的发展历史

信息的时代离不开信息,我们对外界的了解,都是通过书籍、互联网、手机等途径获取。人类从诞生到发展,信息就一直伴随着人类,可以这么说,人类的发展史就是信息的发展史。尤其是随着计算机的出现和普及,信息实现了全球的共享和交互,呈现爆炸式发展。信息对整个社会的影响逐步提高到一种绝对重要的地位。随着信息技术的发展,人们被海量的数据所淹没,于是就有了信息搜索。互联网信息搜索大致经历了以下四个发展阶段:

(一)分类目录阶段

这一阶段的代表者就是雅虎,它是由美国斯坦福大学电机工程系的博士生DavidFilo和美籍华人杨致远(Jerry·Yang)共同创立,他们将收集到的站点信息整理分成类,又将每一类分成子类,核心就是按层次将站点分类,后来他们将程序对外发布,无数的人都到他们在斯坦福大学的地址上来查询,以至斯坦福大学的网络几近崩溃,用户可以在这个目录里面找到自己想要的东西。

(二)文本检索阶段

文本检索阶段,也被称为自然语言检索,它直接通过计算机以自然语言中的词语匹配查找。文本检索进行匹配的对象,可以是整个出版的文本,包括文章、报告甚至整本图书,也可以是它的部分。随着计算机的出现,人们可以通过计算机更加方便的对文档进行管理,借助计算机,也使得信息搜索能力更加强大,速度更加快速,搜索结果更加精确、全面。这个阶段的信息检索模型主要包括例如布尔模型、概率模型或者向量空间模型。采取这种模式的搜索引擎主要是一些早期的搜索引擎,例如AltaVista、Excite等。

(三)整合分析阶段

整合分析阶段的信息搜索使用的方法和我们今天的网站外部链接形式基本相同,在当时,外部链接代表的是一种推荐的含义,通过每个网站的推荐链接的数量来判断一个网站的流行性和重要性。然后搜索引擎再结合网页内容的重要性来和相似程度来改善用户搜索的信息质量。这一阶段的代表主要是谷歌、百度等。

(四)用户中心阶段

用户中心阶段是以移动互联网为标志的个人需求精准搜索,主要是以用户为中心,注重用户体验,为用户提供一种前所未有的新感觉。当客户输入查询的请求时,同一个查询的请求关键词在用户的背后可能是不同查询要求。甚至是同一个用户,所查询的关键词一样,也会因为所在的时间和所在的场合不同而返回的结果不同。

二、移动互联网下信息搜索的趋势

移动搜索是基于移动网络搜索技术的总称,用户可以通过SMS、WAP、IVR等多种接入方式进行搜索获取互联网信息、移动增值服务及本地信息等服务内容[1]。移动搜索服务的最大优势在于它打破了电脑的线缆约束,让用户能通过随身携带的手机终端随时随地获取所需的信息,具有更强的人性化的本质特征[2]。因此,移动互联网下的信息搜索具有以下五个特点:

(一)移动搜索市场潜力巨大

据中国互联网信息中心(CNNIC)2013年报告称,截至2013年6月底,中国搜索引擎网民规模为4.70亿,与去年同期相比增长了4177万人,同比增长9.7%。搜索引擎作为互联网的基础应用,是网民获取信息的重要工具。

图1 中国历年搜索引擎网民规模和增长率

截止2013年6月底,中国手机搜索网民数达3.24亿,较去年同期增长了25.2%。手机搜索网民逐年提升,是近两年来搜索引擎网民增长的动力来源。此外,在新增网民中,使用手机搜索的网民占搜索网民的70%,手机搜索已成为新增网民重要的搜索方式。

图2 中国历年手机搜索引擎网民规模和增长率

(二)信息数据私有化

JillEllsworth于1994年提出HiddenWeb(暗网)概念,暗网指存储在网络数据库里、不能通过超链接访问,不属于那些可以被标准搜索引擎索引的表面网络,据科学家研究,人类信息只有不到1%的实现了WEB化,而WEB化的网页中,搜索引擎能抓取的大概为1%。

这些“被隐藏”起来的数据来自:

1.人工整理的数据

很多数据不是很简单的通过网络能够获取,比如农业方面的土地、人口、农业产品等,工业方面的企业相关信息、工业产品信息等,第三产业方面的各类信息,还有如每年进行的全国经济、人口、资源等普查,这类数据都是通过人工调查、问卷、整理统计出来的,主要掌握在政府机构、企业、以及一些组织手里。这些数据都是按照分类整理出来的比较可靠、权威、有针对性的信息。但由于数据的私有性、价值性、整理的成本等原因,它们往往都是不对外公布开放的。经过十多年信息化的建设与发展,这些机构、组织、企业所拥有的数据已经达到相当可观的数量级。

2.社交产生的数据

这里的社交网络不仅仅指微博或人人网,QQ、邮件、虎嗅网、微信。甚至短信也是一种社交。这些被称为“暗社交(Hidden Social)”。用户在这些社交过程中原创、分享了数量众多的文字、图片、视频等信息。很大程度上部分社交网站的数据是以网页数据形式展示的,但同时又是封闭的。因为这些社交数据包涵用户最真实的信息,尤其是实名制的社交网络平台更是如此,这类信息显得尤为具有价值,如果掌握这些数据,对这些数据进行分析研究用户的行为习惯、喜好,就可以非常针对性的对用户推送他们感兴趣的广告内容。

3.APP产生的数据

搜狗王小川曾经抛出过“WEB已死”的说法。由于手机端软件与应用的普及,人们获取信息的方式从PC端转向了手机端。包括新闻资讯、视频聊天、游戏、社交、搜索等。由于移动搜索技术的限制,这些APP端软件所产生的数据被谷歌、百度等搜索引擎爬虫抓取的几率变小,甚至根本抓取不到。移动互联网已经不再是由WEB通过超链接互相连接的网络。APP之间通过接口互相链接,APP上的不同用户通过QQ好友关系、微信圈、微博关注关系、手机号码等方式互相链接。随着智能手机、平板设备与3G网络以及目前正在兴起的4G网络的发展,越来越多的用户使用智能机满足日常生活、学习、工作的需求,鉴于传统电脑的不便携性、笨重等不方便原因,使用电脑的人越来越少。

4.个人云应用产生的数据

个人云应用目前被认为是最具商业价值的科技产物,主要是解决多屏同步的问题。个人云应用就像移动互联网一样正在深刻改变个人生活、尤其是办公的方式。用户通过“云”计算技术实现数据同步、移动办公等需求,它的出现让U盘、数据线等设备彻底被摈弃。其便利性、及时性、同步性,让更多用户选择将数据保存在云端。在不同设备上账号认证后下载并使用这些数据。这类应用除了同步通讯录、收藏夹这类私密性强的数据外,还有印象笔记、网易云阅读等类型的大文本数据。这些数据都是私密的,除了用户自己,别人根本没有权限查看,正是因为私密性,其安全性更是天衣无缝,让搜索引擎无能为力。

5.物联网产生的数据

物联网是新一代信息技术的重要组成部分,它通过智能感知、识别技术与普适计算、广泛的网络技术将人与人、人与物、物与物链接起来。随着IPv4的淘汰和IPV6的普及,彻底解决了网络地址资源有限的缺点,这使得地球上的每一颗沙子都能有自己的数据地址。尤其是这几年技术创新与发展,车联网、监控录像、电子抄表、水文监测等物联网应用时刻在产生大量的数据,就拿监控录像来说,每时每刻都在记录视频、文字、图片等信息,尤其是美国的国家安全部门,每天都在监控全球各地的所有能够接触得到的信息,可以想象这些数据是多么的庞大。

数据是具有价值的,而目前百度、谷歌等搜索引擎免费使用网络上的所有信息,使用这些免费的信息再有偿的为网民提供服务,很多网站将自己的数据据为己有,完全私有化,不让搜索引擎染指。Facebook公开屏蔽谷歌的搜索引擎爬虫,像政府部门的大部分数据也不会对外完全免费开放,还有APP产生的数据,搜索引擎也不能搜索到。这些数据变成了私有财产。

(三)信息搜索的垂直化

目前,市场对于市场细分的强烈需求逐步体现,于是垂直搜索应运而生。垂直搜索是针对通用搜索引擎的信息量巨大、查询结果不精确、深度不够、不够完善等提出来的新的搜索引擎服务模式,百度公司前CTO、副总裁刘建国曾说,信息搜索的垂直化是未来移动搜索发展的趋势。其最大的特点就是“专、精、深”,是在移动互联网环境下,将对传统搜索引擎构成致命的威胁[3]。

移动信息搜索垂直化的另外一个表现就是:移动搜索入口多样化且垂直化。在传统互联网中,搜索入口只有搜索引擎,百度、谷歌等,搜索巨头牢牢控制着网络信息流量入口,用户想要搜索信息,只能通过其入口。但在移动互联网里,这种情况不再那么明显。移动互联网入口由众多移动应用所分散,比如想搜索音乐,用户会直接打开音乐APP;想搜索天气,会直接打开天气APP;想搜索美食,直接打开美食类APP,不管这种APP来自安卓还是苹果阵营,移动互联网已经成为APP的天堂。

(四)搜索引擎为数据买单

2013年2月21日奇虎360官方宣布360搜索将与即刻搜索展开战略合作,合作内容包括接入国家食品药品监督管理局的药品查询数据,联合运营网络曝光台以及食品安全栏目。25日百度和药监局达成战略合作,百度将使用药监局的药品数据为人们提供用药相关的查询。360与百度为这批数据付出的代价并未提及。天下没有免费的午餐,药监局虽然是要造福于民,但是这批数据显然不会白给。这意味着搜索引擎为数据买单的时代已经到来。

在国外,Facebook将用户在其平台上产生的数据据为私有,屏蔽了谷歌爬虫抓取里面的信息。换句话说,谷歌不能再免费的无偿的使用互联网信息。

(五)本地生活信息搜索趋势明显

由于本地生活信息搜索得到的信息量较小,准确性要求较高,这正符合移动终端的自身特点。本地生活信息搜索目的性强。手机用户的搜索行为极易形成消费事实。本地搜索应该涵盖生活信息、消费购物、出行指南和公共服务等搜索内容,涉及范围包括吃、喝、玩、乐、行等范畴。

三、移动互联网信息搜索面临的问题

(一)技术问题

当前互联网信息搜索很大程度上基于关键词搜索,其要求的是海量信息、多而杂、大而全的结果。输入相同的关键词,无论是什么人在什么地方,搜索到的结果都是相同的,比如在北京和在上海的两个用户搜索美食时,用户期望返回的最好是当地在其附近的结果,而不是标准化的[5]。

移动搜索受终端设备的限制,要求返回结果必须高精度、高匹配、高度符合用户需求。根据最新调查结果得知,用户通过移动设备搜索信息时,查看页面进行4次翻页就会感到厌烦,另外用户会为这些不相关信息支付流量费,致使用户对搜索的准确性有较高要求。

无线互联网搜索的难点在于无线网站之间并不关联,数据在运营商、服务商的网关中,搜索引擎很难抓取,文件格式又各不相同。此外移动终端的多样性使得适配很难,必须开发专门的无线搜索技术。

(二)盈利问题

目前多数移动搜索服务商为用户提供免费的搜索服务,运营商则收取短信或流量费。搜索服务商出于开拓市场的考虑,不急于从移动搜索投资中立刻获取利润,而是不断开发新技术、扩充搜索范围,以期尽快扩大用户使用规模,待形成固定用户群后再实行收费。可以看出多数移动搜索服务提供商仍寄希望于传统的互联网搜索盈利模式——向网络用户提供免费搜索服务,从付费的广告客户那里获得收入。但是固定互联网搜索的盈利模式能否套用到移动互联网搜索产业存在很多变数,这在一定程度上跟移动运营商的政策有关。另外,受制于目前的终端设备屏幕小,搜索如果还像传统网络搜索放置广告的话,会使得屏幕信息显得杂乱,影响用户的体验,从而影响盈利。

(三)隐私安全问题

2010年的奇虎360与腾讯公司之间的3Q大战,让无数网民看到网络隐私的重要性,而百度文库无疑成了“网络隐私问题”的延伸段:在百度文库上出现了大批量泄露各地用户信息的文档,全国各地老板、大小业主的手机号、家庭地址等隐私,只要鼠标一点,就能免费到手。在移动互联网环境里,用户的数据显得尤为私密,比如电话号码、短信、邮件、手机应用APP产生的其他数据,不法分子会利用移动信息搜索的漏洞,获取用户的隐私。从而对用户的财产甚至人身安全产生了威胁。

四、对策及建议

(一)大力发展移动网络基础设施建设

没有强大的网络基础设计支撑,就不会有移动互联网的快速健全发展,更不会有互联网信息搜索的发展。跟初期的传统互联网类似,在拥有丰富的资源内容之外,移动网络市场更需要便捷快速的网络、良好性能的终端、能够持续续航的动力支持等作为基础条件来支撑。目前政府在这两个方面的建设工作都需要大力加强,起好产业推动作用。

(二)加速移动搜索技术的发展与更新

首先,应该改进个性化的搜索技术,做好用户新体验。移动搜索引擎技术的焦点就是提升用户的体验度:精、准、全、快。鉴于中文含义的多样,同一个词在不同的语境中可能是完全不同的意思,这个需要移动搜索认真具体的分析,在传统搜索百度已经做的很好,但在移动端是否一样的能做到世界领先,还有待观察。真正的个性化移动搜索需要做到信息类型的精准、信息内容的针对以及搜索过程的动态化。做到这些,则需要更多技术研发的投入。

其次,国家应该制定鼓励和促进移动互联网技术发展的政策。国家政策是引导社会人力、财力、物力等资源进行再配置的牵引力。通过制定能够促进移动搜索及相关行业发展的法律法规,加大对移动搜索技术公司,尤其是对像百度、搜狗、搜搜、360搜索这样的技术公司的优惠、奖励力度,在政策方面给与支持,激发这些公司技术创新的热情,促进其技术发展与更新。

(三)拓展移动搜索盈利新模式

目前移动信息搜索的盈利模式主要为:第一,广告收费模式,在这种模式下,移动搜索服务商在提供搜索服务的过程中,向所服务的用户投放广告,以达到推广的目的,向投放者收取广告费用。第二,竞价排名模式。搜索服务商通过人为干扰用户搜索结果,根据客户(广告商)所提供的费用多少来对用户搜索的结果进行排序。

此外,还需要拓展盈利模式。根据用户的性格、地理位置和行为方式以及个人兴趣提供不同的服务。

(四)加强法律监管

我国现行法律对网络隐私权的立法规定较少且并不详细,实践操作性不强;诸多网络服务与内容的供应商自律意识较弱,网络侵权的特殊性是十分明显的,具有传播速度快、影响面大、复制简易、后果不易控制、自由度大、监管难等特点,这些新特点应作为立法的思考点和出发点;在网络隐私权立法制定过程中,应遵循以下原则:收集限制原则;数据正确原则;利用限制原则;安全保护原则;个人参与原则;多方责任原则。

[1]郭涛.潜进中的移动搜索[J].现代商业,2011(29).

[2]邹冉冉.手机移动搜索市场发展探析[J].信息技术,2010(10).

[3]李子臣.搜索技术的现状及发展前景[J].信息技术,2007(6).

[4]储然.搜索技术的现状及发展前景[J].世界电信,2007(11).

[5]郭涛.移动搜索的发展趋势[J].信息技术,2010(10).

[6]李宇宁.移动搜索业务发展方向分析[J].信息通信,2008(1).

[7]王静.世界移动搜索发展现状与趋势[J].中国信息界,2007(8).

猜你喜欢

搜索引擎用户信息
订阅信息
关注用户
关注用户
关注用户
网络搜索引擎亟待规范
如何获取一亿海外用户
展会信息
基于Nutch的医疗搜索引擎的研究与开发
基于Lucene搜索引擎的研究
搜索引擎,不止有百度与谷歌