APP下载

请将数据挖掘权交给用户

2012-04-29何廷润

清华管理评论 2012年5期
关键词:开发者商店应用程序

突破目前固有的以自我“平台”为核心的模式,把数据挖掘与数据处理权交给用户和开发者,将是移动互联网和智能手机产业链获得腾飞的新起点。

改变移动互联网以“平台”为中心的生态链模式,让每个用户都具有类似“平台”一样的数据挖掘、分析、处理能力,使用户成为移动互联网的主导力量,让“平台”遵从用户的真正需求,不仅是移动互联网生态链运行模式的变革,更是未来信息世界控制主体的革命。

得平台者得天下

“三驾马车”

尽管成功的机会林林总总,移动互联网最大的战略机会却是平台。所谓平台,实质是信息的增值通道。谁掌握平台,谁就掌握通往移动互联网财富之路的话语权。从操作系统、浏览器到应用商店,平台正变得广泛而重要。凭借“智能终端+应用商店”,苹果成为大家热捧的典范。

目前,在各应用商店中,苹果App Store发展最好、应用数量最多。据2012年全球开发者大会披露的数据,App Store应用下载量已突破300亿次,应用程序数量达到65万款,稳居应用业务平台第一。其次是谷歌的Android平台,应用下载量达100亿次,应用程序数量也达到50万款。美国应用程序研究公司Flurry最新研究报告显示,从2011年第二季度到2012年第二季度期间,开发者对苹果iOS、谷歌Android、微软Windows Phone(WP)的支持比例发生变化,微软所获支持由1%增至4%,苹果iOS则由71%降至67%,Android由27%增至28%。

“平台”争夺战

最先向三大“平台”叫板的手机终端厂商是韩国的三星。三星采用Android系统应用商店,仅在中国就提供超过8万个应用程序,下载量累计近6000万次;还建立全球首家基于高清电视平台的应用程序商店Samsung Apps,在全球范围内能够提供1000多款智能电视应用程序,下载量也突破1000万次。其他还有联想乐Phone自带的联想“乐园”、摩托罗拉中的“Moto智件园”等。终端厂商主导应用商店的优势是拥有渠道和品牌,劣势是做硬件出身,缺乏运营资源和能力。

近来互联网界大腕也进入智能手机制造业。百度推出云手机;盛大推出Bambook手机;阿里巴巴成立专业公司,自主开发手机操作系统阿里云OS。互联网企业采取OTT(通过互联网向用户提供各种应用服务)业务模式,将业务产品直接搭载在移动互联网上,利用自己的主线应用产品(社交、搜索、电商等)汇聚用户资源,抢占互联网第一界面并通过数据采集、分析等技术手段获知用户上网行为,再通过辅助产品(如娱乐)的推荐使用,增加用户黏性,以产品带产品的运营机制,向用户提供组合产品供其选择。腾讯应用中心作为国内最大的互联网企业应用商店之一,总下载量已超过40亿次。淘宝以基础平台(B2B、C2C、B2C网购平台)汇聚优质商家,为用户提供服务及商品;通过“圈子”、“顽兔”等Pinterest(兴趣图谱)产品,引入第三方服务商,为商家和消费者提供垂直化服务,增加用户黏性,建设电子商务生态体系。

由于谷歌Android系统的开放性,越来越多的第三方应用商店相继诞生,国内目前有近100家左右,但大多数呈现出严重雷同缺点。

目前,国内较为成功的是电信运营商推出并运营的应用商店。中国移动应用商店(Mobile Market,下称移动MM)形成“销售-付费-分成”的快速产业链,以综合应用门户的形象,为用户提供服务。截止2011年底,上架应用超过10万款,注册客户达1.38亿,累计下载超过6亿次。中国联通也推出应用商店“沃”商店。

与国际应用商店“巨头”相比,中国应用平台建设仍处于“诸候割据”的纷乱时期,成为移动互联网产业发展的一个结构性缺失。

来自中国市场的广博潜力

据美国市场研究公司Canalys的数据,2012年一季度全球智能手机出货量为1.46亿部,中国市场占比达到22%,成为全球最大的智能手机市场。美国科技博客网站App Annie统计指出,中国正成为应用下载量增长最快的国家,2011年的下载量增幅高达298%,成为全球第二大移动应用市场。

据国外媒体报道,苹果预计中国市场的应用下载收入将在今年增长98%达到1.71亿美元,并预测在2012年中国的应用程序下载量可能超越美国,成为苹果在全球最大的市场。在此形势下,苹果向中国市场做出最新的示好举措,推出中文版Siri,在OS X中集成网易、腾讯、新浪、优酷、土豆、百度搜索等中国最热门的应用。中国正以广博的市场潜力,吸引全球移动互联网生态链的各方诸侯。

垄断数据挖掘权的平台困扰重重

“信息爆炸”与“知识匮乏”共生

有价值的信息被大量无用信息淹没

移动互联网克服传统通信技术的时间和空间障碍,为人们进一步打开获取信息与知识的大门,加快信息传播的速度,但是也带来问题和“副作用”。首先是“信息爆炸”现象更为严重。

信息爆炸是指人们对当代社会大量出现并加速增长的各种信息现象的描述,表现为新闻信息飞速增加、娱乐信息急剧攀升、广告信息铺天盖地、科技信息飞速递增、个人接受严重“超载”。其结果是移动互联网上真正有价值的信息被大量无用信息所淹没,求知的人不得不耗费大量时间和精力来对待信息“洪水”。有分析说,目前搜索和收集信息所花费的成本已超过信息本身的价值。

信息爆炸并不意味着知识爆炸,信息只是形成知识的原始素材。人们理解数据和信息后,以高度活用的形式编排记忆的系统信息才形成知识。在移动互联网时代,大量无关的没用的冗余信息严重干扰受众对有用信息的准确分辨和正确选择,使人们从浩如烟海的信息中迅速而准确地获取自己最需要的信息与知识变得非常困难。

知识匮乏并不意味着在移动互联网上知识供应总量低于过去,也不意味着知识增长速度放慢,而表现为信息与知识的增长失衡。移动互联网的发展如果处理不当,可能会出现“信息虽发达,知识却贫乏”的困局。医治和控制移动互联网环境下的“信息爆炸”与“知识匮乏”,是移动互联网时代人们面临的严峻挑战。应该看到,以“平台”为中心的移动互联网商业模式,不是减缓信息与知识的增长失衡,反而是加剧此种失衡。移动应用商店中大量的“僵尸应用”便是典型现象。

用户是“僵户应用”现象的最大受害者

“僵尸应用”主要是指移动应用商店中那些从未被下载过、没有任何用户评价的APP(应用程序)。日前有研究报告称,苹果App Store共计有65万个应用,其中“僵尸”约为40万个,即有三分之二的应用程序在“沉睡”;Android应用商店中办公商务类应用有近一半的下载次数不超过100次,80%以上的软件从未获得过用户评价。大量沉默的“僵尸应用”占据应用商店,必将导致商店臃肿,给运营者带来管理难度,也让更多好的应用被淹没,成为新的“僵尸”。

面对愈演愈烈、积重难返的“僵尸现象”,最大的受害者是被移动互联网生态链各方诸侯尊称为“上帝”的用户。用户面对浩如烟海的平台应用程序,往往只能借助于搜索手段。搜索结果会出现两种情况:一是搜索到应用平台希望推广的应用,但大多是采用竞价排名的商业模式而推荐;二是搜索到的是不满足用户需求的“跟风”应用,浪费用户时间和精力,也让用户无所适从;三是使用之后才发现问题,又需要重新搜索、下载。这些给用户带来重复下载、被迫选择收费应用、浪费流量和时间等诸多困扰。

移动互联网“平台”必须良性融入社会

移动互联网平台模式尚处于初级阶段

移动互联网平台模式处于初级阶段的表现主要有:

发展目标是初级的,只想尽快吸引用户,占领市场,争取用户量和业务量。下载量成为最可炫耀的业绩。

用于发展的资源和手段是初级的,主要是以平台扩充和终端升级为主。

参与发展的各主要方面的关系是初级的。实施发展的企业和用户的关系是失衡的,其目标存在较大差异。这从“僵尸应用”现象可见一斑。

发展的结果也是初级的。业务及收入快速增长,但也形成诸多“发展困境”,诸如有害信息泛滥、网络及信息安全漏洞频出、无序应用造成网络拥塞或质量下降等等。

当前移动互联网以“平台”为中心的模式,尚未达到可持续发展的境界,因为巨量的无用和不良信息极大地增加社会成本;网络、信息以及终端严峻的安全威胁,破坏社会良性发展的基础结构;少数人占有大部分网络资源不但造成社会资源巨大浪费,也形成新的信息社会的不公平现象。

移动互联网必须寻求一条可持续发展的道路,需要将移动互联网的目标与社会、经济、人民生活的发展目标和谐一致,不能仅为产业或企业的利益而造成社会成本的增加。移动互联网也需要构建自己的“低碳式”可持续发展模式。

僵尸现象是“平台”垄断数据挖掘权的产物

根源在于应用商店游戏规则的逐利性。“僵尸应用”在很大程度上是APP游戏规则的产物。目前,移动应用的推广方式极为单一,主要是应用排行榜,榜单位置有限,无法容纳更多应用。最受诟病的是推广费用高昂,单一的排行榜推广方式和有限的榜单位置大大抬高推广费用。移动互联网市场存在大量希望快速扩大用户规模的应用,这些应用只能依赖平台的排行榜渠道推广。花钱买推荐早已成为市场的通用规则。有些应用商店首页优质推荐位置在2011年年中就已涨到每天1.2万元。手机应用开发者难堪重负。

同质化竞争以及应用推广中的马太效应。移动应用的同质化竞争以及应用推广中的马太效应导致强者恒强、弱者消亡,也是“僵尸应用”现象的主要原因。一个应用取得成功通常会带来一大批跟风模仿者,而这些功能相同的应用中,只有用户体验最好的极少数能够占据用户手机桌面存活下来,剩下的都难逃成为“僵尸”的厄运。移动应用推广则是下载量越大,排名越靠前,而排名越靠前,则下载量越大。同一类应用中只有排名靠前的少数应用能够吸引用户眼球。

应用开发者的噩梦和“水军”刷票生意的兴隆。从全情投入踌躇满志到钱财耗尽心灰意冷,繁荣的应用商店竟成为开发者的“噩梦”。如果不想成为“僵尸应用”,就得花钱推广,这已成为铁一般的定律。

然而,在推广方式的选择上却有截然不同的两条路:一是针对目标市场进行市场营销和广告投放的正规道路;一是雇佣“水军”在应用商店刷榜的违规道路。在显而易见的“投入产出比”面前,越来越多的应用开发公司选择后者。据透露,1000万元以上的刷量和刷票合同并不少见;有些刷量公司甚至开设大客户专用通道。如果没有充裕资金做后盾,淹没在应用海洋中将是必然的结局。

统计显示,截至2011年11月底,中国手机应用开发者总数约100万人,其中盈利的仅占13.7%,亏损的占64.5%,持平的为21.8%。由此可见,应用商店现有的排名机制以及算法规则,已严重伤害开发者的积极性,最终必将伤害到整个应用商店的创新能力和生命力。

“大数据”不是灵丹妙药

随移动互联网发展而来的海量数据,对“平台”运营商显然已造成巨大负担。但是,以“平台”为中心的运营模式念念不忘的,仍是如何借助“大数据”的理念和技术,牢牢把握住数据挖掘及数据分析处理的核心权力,进一步推出具有黏性较强的庞大用户群的业务,实现市场和盈利的提升,比如苹果App Store《植物大战僵尸》这样的明星产品,9天内就吸金100万美元,让众多厂商和创业者分外眼红。

从2011年起,全球对互联网所带来的“信息爆炸”和“数据洪流”有了全新认识。2011年5月,麦肯锡发布报告,指出数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于大数据的运用预示着新一波生产率增长和消费者盈余浪潮的到来。“大数据”时代已经降临。

大数据具有多样性、体量大和速度高的特征。多样性是指数据应包含结构化的和非结构化的数据,文本、语音、图像、社交网络、地理位置等等,数据类型十分丰富;体量大是指聚合在一起供分析的数据量非常庞大;速度高则是指数据处理的速度必须很快。人们意识到,淹没在数据的海洋中需要更智慧的收集、处理和分析信息,并让信息为业务目标服务;同时,实现更快更智慧的决策和行动。

因此,所有平台运营商,都纷纷表态要以“大数据”的视角,以云计算为依托,优化“平台”结构和流程,力图在原有生态模式下,将产业链主导权收入囊中,一边极力吸引用户进入其业务应用平台,一边让作为“上帝”的用户游离在外。面对汹涌澎湃的“大数据”时代,用户只能等待产业链上各路英豪的数据挖掘与处理,将他们认为有用和有利的数据或业务“奉献”给用户,这就是当今移动互联网的经典“桥段”。

用户在“信息爆炸”环境下是否能用最高效率、最低成本获得所需知识和服务;在追求业务流量和收入同时,是否有效阻止而不是放任不良信息的泛滥;在以大用户群和高盈利为主要追逐目标前提下,是否能让中小开发者从“僵尸应用”的噩梦中解脱;让以盈利为主的的排行榜模式,变为用户和中小开发者都能顺畅使用应用程序和在“平台”展示的良性氛围。这些企望,在目前“平台”运营商的“大数据”战略中难以寻觅。

因此,突破目前固有的以自我“平台”为核心的模式,把数据挖掘与数据处理权交给用户和开发者,将是移动互联网和智能手机产业链获得腾飞的新起点。

向用户端转移

让用户真正成为移动互联网生态链的主导者

在各方巨头把持“平台”核心权力的情况下,“大数据”无力改变用户和中小开发者的弱势地位和命运。因为无论“平台”上的应用有多少,“平台”运营商都不能保证这些应用是用户恰好需要的。

然而,“信息爆炸”的环境与超级互联的社会,将迫使我们开发全新产品,用户依靠数据挖掘、预测分析工具帮助来议定最佳的交易变得非常重要,用户甚至更希望从数据中获取实时、实用的应用。在“大数据”时代,移动互联网生态链面临着前未有的持续创新压力,要求彻底改进产品、服务和流程,并将用户端持有数据挖掘及分析处理机制与能力作为主要改革方向之一。

在“大数据”趋势下,围绕数据价值产生的关联应用复杂多变,不管是电信运营商、互联网企业、第三方运营商、终端厂商还是用户,都必须改变角色定位,以数据价值为核心,跨入意识、技术、产品、服务和应用于一体的大服务时代。必须从数据集成、管理向数据挖掘、分析与展现等方向进行全方位延伸;用户与“平台”各方都需要拥有主动意识,以挖掘数据价值最大化为目标,不能坐等应用需求;要向用户端注入数据挖掘及分析处理机制与能力,提升用户在生态链中的主导地位。

用户端实现“大数据”挖掘的技术探索尚属空白

数据挖掘是从大量有噪声的数据中提取出有用知识的过程,可分为数据准备、数据挖掘、挖掘结果的解释和表达三个阶段。基于云计算架构下的数据挖掘系统模块分别独立地存在于不同的云块,数据在各种云块间进行传递,从而在保证各模块之间有效连接的基础上达到一种松散耦合状态。

这种数据挖掘体制,应包括数据层、数据服务层、应用程序云、知识云、算法云和用户浏览器等。数据层表示数据挖掘系统需要数据的来源,数据既可源于云端,也可源于数据库;数据服务层将不规范的含有噪声的数据,经过筛选、转换、加工转换成为符合数据挖掘算法规定的有用数据;而应用程序云是云计算平台下数据挖掘系统的核心模块;知识云用来存储数据挖掘相关知识,并具有知识查询、更新、修改等管理工具;算法云存储各种数据挖掘算法,当用户端提交挖掘请求时,由应用程序云向算法云提交相应请求,算法云选择相应算法对所需数据进行挖掘;用户浏览器则是各种终端设备,用户可以通过浏览器等软件访问云计算平台程序。

目前,大数据挖掘大多利用一些非传统的数据筛选工具(包括但不限于Hadoop)对大量的结构化和非结构化数据集合进行挖掘,以便提供有用的数据洞察。数据挖掘的模式可引入分布式存储模式,以适合大数据的挖掘;引入建立在Hadoop上的数据仓库基础构架,可以存储、查询和分析Hadoop中大规模数据;引入数据分析中间件,提供数据处理、数据探索、数据建模及应用等一系列功能,开发多种数据挖掘算法和统计建模方法。因此,在用户端通过云计算平台提供的海量数据挖掘方法,提高了挖掘的效率和精度,更利于挖掘应用的推广。

以上是目前“大数据”挖掘与分析处理的基本技术方案,都是在电信运营商或互联网运营商“平台”上实现“大数据”挖掘与分析处理的基础架构和实现路径,而在用户端要实现上述“大数据”挖掘的各项功能,在理论和技术上尚属空白。

何廷润:国家无线电频谱管理研究所高级顾问

本文责任编辑:肖自强

xiaozq@sem.tsinghua.edu.cn

猜你喜欢

开发者商店应用程序
二手商店
天边的白云商店
删除Win10中自带的应用程序
谷歌禁止加密货币应用程序
逛玩具商店
无名火
16%游戏开发者看好VR
iOS开发者调查
iOS开发者调查
栝楼产业开发者谢献忠