大数据背景下电商企业数据再挖掘与企业价值增值研究
2014-03-09覃聪
覃聪
随着移动互联网、物联网、云计算等的迅速发展发展,文字、方位、沟通甚至一切事物都可以量化成数据,承载着海量用户信息并且可以深度挖掘的大数据浪潮出现了。大数据不仅开启了重大的时代转型,变革了医疗卫生、商业模式,也悄无声息的改变着我们的生活和认知世界的方式。中国电商企业只有积极探索以大数据为基础的解决方案,拥抱大数据,正视大数据带来的挑战和机遇并采取行动,才有可能促进产业优化升级及企业价值增值,甚至凭借大数据的跳板缩小与发达国家的差距。
1 大数据的相关理论研究
“4V”特征、麦肯锡定义和维克托·迈尔的三个转变。IDC并没有明确地指出大数据的概念,目前比较被认可的说法是“4V”特征和麦肯锡定义。“4V”特征:volume数据规模性、variety数据多样性、volocity数据高速性、value数据价值性。麦肯锡认为“大数据是指无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。
维克托·迈尔—舍恩伯格在《大数据时代》中提出了大数据时代处理数据理念上的三个转变:要全体数据不要随机样本、要混杂和效率不要绝对精确、要相关关系不要因果关系。
大数据时代的到来预示着人类单纯依赖局部、片面和抽样数据,甚至是以往经验理论和个人价值观去探索世界规律的日子一去不复返,不在偏执于数据的绝对精确,不再将思维禁锢在对因果关系的追求,而是将精力放在相关关系的探索中。
“叫醒”数据坟墓与数据再挖掘。在大时代背景下,数据将逐步演变为企业的一项重要资产。数据再挖掘无疑为那些拥有大量数据但是却很少使用的电商企业带来了突破发展的契机,它们搜集了数据并使用过一次,鉴于数据存储成本低等原因将数据保留下来,也就是数据科学家所说的“数据坟墓”。维克托·迈尔先生曾说过“数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下”,只有不断地对数据进行创新和多次使用,数据的真实价值才能得到充分的挖掘和利用。电商企业目前的任务就是认识到数据再挖掘和提升企业价值的内在正相关联系,想办法突破电商企业大数据导入模式的瓶颈,借助新的方法和工具对数据开展再利用的创新实践,深度挖掘数据的真实价值。
大数据背景下数据价值的重新衡量。根据以往统计结果显示,在过去50年中,数据存储成本大约每两年就削减一般,而存储密度却增加了5000万倍。而这些日益增长的数据的账面价值又是多少呢?又应该如何给这些数据估值呢?数据再挖掘的潜在价值又该如何体现呢?选择价值又该如何进行确定呢?种种疑问充分表明在大数据时代,不能再依靠查看公司的账面价值来确定公司的价值。为了准确对数据、企业价值进行估值,帮助产业价值链上各主体做出正确决策,有必要将庞大数量的数据纳入到企业价值评估系统中,从数据持有人的数据授权方面入手,重新制定衡量数据价值的标准,制定适合我国国情的估价模型。这对于分析和准确评估大数据时代电商企业的价值有重要的指导意义,也将为产业价值链上供应商、客户、企业现有及潜在竞争者还有服务商制定明智投资决定打下理论基础。
2 数据再挖掘与电商企业价值增值的关系研究
2.1大数据与企业竞争力关系研究
大数据逐步成为电商企业竞争力的重要组成部分,悄无声息的改变着整个行业结构,我们认为大数据与企业竞争力是成正比关系的。在这场战争中,不仅大公司有充分的“武器装备”,小公司也有机会大获全胜,低成本、创新思维带来的优势远大于并不乐观的原始资本投入产生的负效应。中等规模公司则可采取向两端企业转型的策略来突破发展瓶颈,若此类公司能在明智领导者和正确科学的指导下寻找突破口,也将和大公司和小公司一样享受大数据带来的福音和企业竞争力的稳步攀升。
2.2 数据再挖掘企业价值增值的相关研究
从海量数据中挖出“用户体验”。要想说明数据再挖掘与企业价值增值的关系,用案例比理论要实在得多。苹果作为全球电子产品潮流的引导者,已成为很多消费者钟爱的品牌。iPhone就是苹果公司数据再挖掘从而促进企业价值增值的成功典范,也为苹果公司开辟了更为广阔的创新发展之路。苹果公司在与移动运营商签订的合约中要求运营商为其提供大量的有用数据,从而更全面的分析用户体验,而这正是其他运营商没有触及的领域,也是iPhone推出后大获成功的关键因素之一。苹果公司作为第一个吃螃蟹的人,抓住了移动运营商没有看到的商机,挖出了潜在的数据价值,很大程度的提高了企业的价值。
止步于书PK挖出“新商机”。谷歌和亚马逊都是大数据时代电商行业的先锋,但他们发展策略却有些差异。亚马逊的Kindle包含了上百家出版社的图书,将焦点只放在阅读书籍上,没有进一步的分析文本,没有继续挖掘数据的潜在价值,丢掉了数据再挖掘的契机。而谷歌在收集了这些数据之后,将这些已经被数据化的文本用来改进他的机器翻译。这个系统在自动扫描文本后找出译语的单词和词组在源语中的对应词和词组,只需要用电脑找出两种语言之间最恰当的对等词和词组即可,用维克托先生的话来说就是“亚马逊深谙数字化内容的意义,而谷歌触及了数据化内容的价值”。可见,电商企业进行数据再挖掘,深度挖掘数据的潜在价值,将大大提升企业价值。
挖出“未来”、指导决策。数据中间商搜集数据进行整合,根据自己的需求提取有用的信息进行利用,同样可以通过搜集整合、再挖掘数据实现企业的价值增值。总部位于西雅图的交通数据处理公司Inrix汇聚了美洲、欧洲近1亿辆汽车的实时交通数据,通过提供免费的智能手机应用程序,在为用户提供免费的交通信息的同时也得到了车主手机反馈回来的信息。这些数据不仅可以帮助Inrix为政府部门和商用车队预测交通状况,还可以通过数据再利用去预测经济情况、商场销量额等等。该文原载于中国社会科学院文献信息中心主办的《环球市场信息导报》杂志http://www.ems86.com总第535期2014年第03期-----转载须注名来源这也充分说明了对大数据再挖掘的实践对于企业价值增值的促进作用。电商企业数据再挖掘的创新可以提高企业和价格的透明度,从而降低社会管理的成本。数据和信息也会更加的准确和及时,帮助决策者做出准确分析的同时,也更大程度的满足了消费者的个性化服务需求,实现降低企业经营风险和创新企业商业模式的双赢。
3 电商企业开展数据再挖掘面临的挑战以及解决之道
3.1 大数据时代电商企业开展数据再挖掘面临的挑战
数据自身新变化,传统技术不再适用。伴随着大数据时代数据的爆炸增长,数据的结构、来源、质量、存储都发生了很大的变化,大数据已不再满足于传统意义的分析体系,数据库、数据仓库以及联机分析处理的组合已不能满足大数据分析处理的需要,不得不承认大数据的诸多变化对传统的分析处理技术带来巨大的冲击。(1)数据的结构变化。数据的类型从传统的结构式数据转变为结构式数据、半结构式数据和非结构是数据三者的结合。数据来源从传统的服务器和个人电脑向手机、平板电脑等移动终端转变。(2)数据的质量变化。只是简单的搜集数据却忽视数据的清洗、过滤、分类、去重是与大数据去伪存真的处理原则背道而驰的,有必要重视大数据质和量的平衡。(3)数据的存储变化。传统的数据库管理系统已经不再适用于大数据的保存,需要新的数据存储技术。电商企业需要努力降低数据存储的成本和能耗,从数据本身和数据导入模式作为出发点进行创新和运用,努力将新模式新技术的价格“平民化”,共享平台普及化。
中等规模电商企业面临转型难关。大数据让大公司和小公司受益良多,却让既没有规模优势又没有灵活优势的中等规模电商企业面临着企业生存的困境:要么向两端转型,要么破产关门大吉。大数据和冰川世纪不一样,不会让所有的中等规模公司像古代生物一样人间蒸发,总有可以突破的契机。但是不可否认,大数据给中等规模电商企业带来了巨大的威胁。关于中等规模电商企业到底应采用什么具体方式有效转型,从而实现最大的企业价值也是值得电商企业思考的。
隐私“被”挖掘, 预测能力“被”滥用。当我们的隐私被收集,我们有权知道这些隐私包括哪些具体信息、将要作何用途、我们是否拥有控制被收集数据的数量和用途的权利。但是在大数据时代,企业在做一项预测之前要征得数亿用户的许可的话,是不可设想的。可见,在大数据时代对隐私的保护已经不能用以往的眼光来加以衡量:限制太死,数据再利用无法得到充分的创新;限制太松,我们的隐私又得不到保障。
更加让人觉得恐慌的是大数据的预测能力。我们研究大数据就是希望能从对数据的处理、分析、挖掘、再利用中得到有效的信息,预测未来。但当大数据渗透进我们生活的各个方面,可以预知考试成绩、工作情况、家庭状况、犯罪倾向时,大多数人便会感觉到自己的选择权利、决定自己未来的权力被剥夺了。值得注意的是,我们并不能完全保证数据的完全正确,所以我们可能会在绝对依赖大数据的情况下做出错误的决定。这样,社会问题就伴随着大数据的普及而来了。
IT人员与数据量之间的不平衡,对新技术的强烈需求。IDC预测2020年全球需要管理的数据量将达到35ZB,相对于2011年将增长50倍,但是同期IT从业人员只会增加1.5倍,也就表示人均管理数据量将膨胀近33倍。这也从另一个角度表现出了对大数据技术的强烈需求,因为在大数据时代,现有的数据库技术无法满足TB级的数据容量和多样化的数据结构,大数据对技术的要求即将超越传统数据库的管理能力。
3.2如何开展数据再挖掘
数据本身:提高使用率和质量。根据美国德克萨斯大学对数据有效性的一项研究表示,企业通过提升自身数据的使用率和质量,能够显著的提高企业的经营表现。企业应该意识到数据坟墓的存在,通过整合这类数据,从中提取有价值的信息。将分析时下数据与历史数据结合,不断完善数据的结构和数量,提高数据的使用率。而数据的质量则关系到预测结构的可靠性,不可过度的追求数量,在处理数据时要秉持去伪存真原则,去重、过滤都是不可缺少的步骤。电商企业应该重视数据的使用率和质量,提高企业的人均产出和运营效率,争取在大数据技术的配合下改变行业竞争的态势和经营业务的商业模式。
规模调整:加大合并与收购,在大数据时代背景中,合并和被收购也是不错的选择,沃尔玛收购一号店,为其开辟了新的市场。从2009年开始,国际上关于大数据的收购案例持续增加,其中最引人注目的要数Oracle收购Sun,惠普收购Autonomy,两大收购金额高达176亿美元,可见大数据的企业价值不可小觑。我国电商也可以考虑合并收购,开展技术整合,同时通过自身实力推出大数据的分析产品。
技术创新:自主开发与国际交流紧密结合。IDC认为大数据技术就是:将被设计用于在成本可承受的条件下,通过非常快速的采取、发现和分析,从大量化、多类别的数据中提取价值,将是IT领域新一代的技术和架构。大数据技术产品框架主要由大数据产品、大数据管理和大数据的终端使用三个部分组成,大数据产品主要包括RDBMS、Analytical DB、NoSQL DB、ERP/CRM、SaaS、Social Media、Web Analytics、Log Files、RFID、Call Data Records、Sensors、Machine-Generated。大数据管理主要是数据的整合和质量控制,涉及到数据的存储、处理和过滤。而大数据的终端使用则包括数据的挖掘、分析、搜索和扩充。目前大数据热度最高的产品NoSQL和Hadoop,但这两种技术并不是大数据技术的全部,随着研究的深入,会涌现出越来越多的新技术,尤其是能处理非结构化数据的技术。大数据和自然环境一样,也有自己的生态系统,贯穿了数据的整个生命周期,从数据的产生、存储、处理、价值提取和应用。在数据再利用方面,电商企业要着重发展数据的应用软件和信息服务,落实创新智能搜索和分析软件、咨询服务和信息安全。
同时,电商企业还要积极学习国外先进技术,并结合国情进行技术创新。Google、IBM、EMC、Oracle、微软、惠普、SAP、Teradata这些世界知名企业都发布了关于大数据的产品,产品类别涉及搜索服务、数据库、服务器、存储设备、解决方案的提供商等,显示了这些大数据先锋的优势和贡献。我国电商企业技术门槛是发展大数据的一道门槛,要想突破这道瓶颈,创新数据再挖掘,就需要从国外优秀的企业汲取营养,结合我国的国情,尽早到优化自身的数据导入、分析、再利用技术。若是电商企业能够在Hadoop的基础上开发出高质量的数据分析软件,在数据再挖掘抢得先机,那么成为大数据先锋也是有可能的。
国家扶持与科学规划:重视隐私保护与反垄断。作为一个新兴的产业,国家应该在政策、资金、技术、人才、法律方面给与积极的扶持,帮助建设信息基础设施,支持技术产业,完善安全保障体系,帮助扭转当今数据保存和数据利用意识淡薄的现象,确保社会在此领域有法可依。在大数据时代,争取每个用户的许可已经不再使用,国家通过法律可通过责任主体的转变来保证隐私的安全,从民众转移到数据使用者,使得他们对自己的行为负责。至于大数据预测功能带来的社会问题,也需要政府确保公民的权利,保证数据决策的公开公正以及个人反驳的权利。就像19世纪美国铁路钢铁的垄断一样,大数据时代也可能会出现垄断。反垄断法能有效地保障权利的使用和人类自身的安全,对世界经济健康发展也有重要意义。
大数据浪潮来势凶猛,将成为理解和解决当今很对紧迫的全球问题不可或缺的重要工具,还可用于发展经济和预防冲突。我们必须抓住此次变革的机遇,直面挑战,对大数据的正确运用将有效地帮助我们解决各个领域的问题,并改变我们认识理解世界的方式。电商企业置身于信息流中央,用专业技术和创新的思维迎接大数据,并通过创新使用数据再利用改善现有的产品和服务,推出全新的服务,实现企业价值增值。