企业档案大数据分析方法与技术创新双向决策模型
2016-12-12李晶伟王毅
李晶伟王毅
(1.中国人民大学,北京 100872;2.辽宁大学,辽宁沈阳 110136)
企业档案大数据分析方法与技术创新双向决策模型
李晶伟1王毅2
(1.中国人民大学,北京 100872;2.辽宁大学,辽宁沈阳 110136)
大数据分析方法可以帮助企业从档案数据中发现规律和问题,推动企业科学决策与技术创新。基于目标驱动的“技术评估与预测模型”与基于数据驱动的“技术监测与预警模型”双向决策模型本质上是企业管理决策的一种科学工具,有利于企业技术知识的可视化累积和知识发现,有利于企业流程重造、质量控制以及合作模式创新,有利于企业风险管理、偏差检测、预警响应等。应注意模型应用策略,及时建立失效预警机制,自觉维护客户隐私,确定数据存储期限。
企业档案;大数据分析方法;技术创新;决策模型
引言
大数据分析方法是企业技术创新的方法之一,可以帮助企业从大量复杂数据中发现规律和问题,实现从“数据分析能力”向“数据决策能力与优势”的转化。企业档案是企业知识资产和信息资源的重要组成部分,具有知识创新性、不可替代性,为企业技术创新提供数据基础。对于企业而言,抓住大数据时代带来的技术机遇,将大数据分析方法运用在企业档案信息资源分析挖掘上,可推动企业科学决策和技术创新。
“技术创新的本质就是组织利用知识创造出新知识的过程”[1],拓宽“技术创新”的外延,将企业技术创新界定为“企业管理决策思维创新”。根据朱东华等提出的大数据环境下面向技术创新管理的双向决策模型[2],即从“技术评估与预测”“技术监测与预警”两个方面构建适用于企业技术创新管理的新方案,以及王毅等提出的“国有企业档案大数据管理与技术创新模型”[3]理论基础,探讨档案大数据分析方法与企业技术创新的关系,结合大数据分析方法,构建企业档案大数据分析方法与技术创新双向决策模型。该模型本质上是企业运用大数据分析方法的管理决策思维外化而成的科学决策工具。
一、双向决策模型的内容框架
双向决策模型主要由两部分组成(如图1所示):右侧部分显示该模型遵循“数据采集——数据预处理及存储——数据分析挖掘——数据应用”的数据生命周期,主要功能是为模型构造提供思维依据;左侧显示模型主体部分,主要由两部分——技术评估与预测模型和技术监测与预警模型构成。左侧主体双向决策模型建立的基础是“企业档案信息资源”板块和“大数据环境下云计算平台”板块,前者为双向决策模型提供数据来源,后者为双向决策模型提供存储和运行平台。主体第一部分为目标驱动技术评估与预测模型,主要功能是以传统大数据分析方法和技术为手段分析挖掘企业内部档案信息资源,达到技术评估与预测目的;主体第二部分为数据驱动技术监测与预警模型,主要功能是以自组织动态实时监测大数据分析方法和技术为手段分析挖掘企业外部有价值的档案信息资源,预
警突发情况,达到技术监测与预警目的。需要说明的是,技术监测与预警模型、技术评估与预测模型中各自运用的大数据分析方法与技术是相通的,在实际分析中可根据需要选择。
图1 企业档案大数据分析方法与技术创新双向决策模型
(一)目标驱动的技术评估与预测模型
技术评估与预测模型着眼于企业内部档案信息资源,以“目标驱动决策”展开。对于企业管理者而言,首先需要弄清楚目标需求。基于目标驱动,通常采取传统意义上的大数据分析挖掘方法,经过数据采集、预处理、分析挖掘,从企业档案信息资源中获取推动企业技术创新知识、观点或者管理思维。然而对于传统意义上十大类企业档案信息资源,企业管理者的目标需求不同,分析挖掘的企业档案信息资源种类也不同。因此,企业管理者在运用技术评估与预测模型时,应当具体问题具体分析。
对于企业科研开发、仪器设备等技术类档案而言,通过分析挖掘,实现对潜在技术信息的发现与可视化,企业管理者可以评估技术发展状态并预测技术发展趋势。美国佐治亚理工大学Alan
Porter教授提出以“技术机会分析”方法为核心的“技术挖掘”理论[4],可以为企业管理者针对技术类档案分析挖掘提供借鉴。通过整合专家知识和文献计量方法,将与某特定新兴技术相关领域的科技文献采集、处理、分析挖掘,进而发掘该技术领域内的核心企业、技术的实时变化和与该技术企业联系密切的相关技术参与者间的关系并可视化展示,从而掌握技术竞争情报,预测创新路径。在利用文献计量法时采用“自然语言处理技术”“主题词簇技术”等,实现对噪声数据的清洗与合并。
对于经营管理类、生产管理类档案,企业管理者可以运用关联规则、聚类分析、分类回归分析、时序分析等方法,实现企业档案潜在规律模式的发现与可视化,形成新的管理思维,做出精确的市场趋势预测和企业管理模式的转变,进而实施更加有效的市场营销战略,提升企业竞争力。以乐购公司经营管理中会员卡顾客数据为例。乐购公司的会员卡中记录顾客购物商品信息,乐购公司通过顾客信息挖掘并分类,得出顾客购买商品间的相关关系,进而调整策略,使乐购的非食品类产品和服务类产品销售大大增加;同时乐购公司通过精确的实验分析,将会员卡用户细分,针对不同用户提供不同的优惠促销活动。优惠券的答复率在直销业一般为2%,乐购公司在汇率支付的年度大型乐购700万优惠券中答复率高达20%。通过精确的用户细分,乐购公司不仅提升客户的忠诚度,更在业绩方面居于市场领先地位。
(二)数据驱动的技术监测与预警模型
数据时代,任何一种信息都可能为企业技术创新带来新思维。对于企业而言,不仅应该关注自身拥有的数据资产,更应关注企业外部与企业相关的有价值信息。企业应通过实时建档,利用最新的大数据分析方法和技术,充分掌握新兴技术和竞争对手态势、市场最新动态,并对一切可能的情况及时做出反应与预警,这正是技术监测与预警模型要解决的问题。
与目标驱动的技术评估和预测模型不同,数据驱动技术监测与预警模型更能体现出自组织动态实时监测的特点。通过在线实时监测技术与主动爬虫技术,自动获取和收集散落在互联网上有价值的社交数据、网络舆情数据、政府政策、市场动态数据以及金融交易数据等,经过机器的算法训练和网络舆情、偏差检测分析,能够追踪舆情的最新动态,分析挖掘新兴技术及竞争对手的最新动态,做出及时有效反应,达到监测与预警目的。以因百威啤酒而名扬世界的安海斯——布希公司为例,该公司通过大数据分析系统,自组织实时动态监测与公司相关的竞争对手和分销商数据,不仅了解竞争对手产品的陈列、定价及货架空间等情况,同时还从大量分销商销售数据中获得本公司产品在零售环节的详细情况,掌握市场最新动态,从而开展效果更佳的营销活动。
二、双向决策模型的特点
(一)基于“大档案观”多元化的数据来源
企业档案呈现4V特征:Variety(模态繁多但不便于存储)、Volume(体量浩大但分析周期长)、Velocity(生成快速但难以捕捉)和Value(价值巨大但密度很低,较难控制)[3]。在这种情况下如果企业档案管理者依然把企业档案视为传统意义上的十大类企业档案,那么企业档案工作不仅会在社会分工中越来越边缘化,而且不利于企业知识管理与企业档案价值的实现。该模型从“大档案观”视角研究企业档案信息资源,既包括传统意义上十大类档案信息资源,也包括与企业相关的网络舆情数据和社交网络数据,后者利用网络舆情进行预警与监测,同时把政府政策、市场动态以及金融交易等数据纳入其中,提升企业情报分析的全面性。
(二)数据生命周期贯穿始终,云计算平台为基础
大数据分析方法贯穿企业档案信息资源处理的整个生命周期,因此在构建双向决策模型时将“数据采集——数据预处理——数据存储——数据分析挖掘——数据应用”数据生命周期贯穿模型始终。此外,在大数据时代由于企业档案信息资源呈现4V特征,传统数据库和处理方法已经不再适应大数据环境,因此该模型建立在云计算平台基础之上,通过采用目前常用的MapReduce并行处理系统运行算法、基于Hadoop开源的分布式文件系统(HDFS)及谷歌的BigTable等非关系型数据库,实现数据有效采集、预处理、存储和质量管理。
(三)多种大数据分析方法与技术的有效结合
分析企业档案信息资源时,可视化分析、数据挖掘、预测分析、语义引擎、数据质量管理等大数据分析方法不仅单独运用,也可相辅相成地综合运用,因此该模型充分吸纳这几种常见的大数据分析方法。具体来说,基于目标驱动的传统大数据分析方法有文献计量法、关联规则、聚类分析、分类回归分析、时序分析、可视化分析、语义引擎等,运用具体技术包括文本萃取、自然语言处理、主体词簇等;基于数据驱动的大数据分析方法有网络舆情法、偏差监测法,常用的技术主动爬虫、机器学习等。
(四)双向决策模型的本质特点——企业管理决策的有效工具
目前对于企业管理者而言,“企业高层越来越依靠基于数据分析的企业管理决策,而不是靠直觉的经验管理决策。”[5]大数据分析方法作为定量分析方法的工具,势必会对企业运行管理、生产业务流程、管理决策产生影响。为促进企业管理决策科学,双向决策模型的构造将大数据分析方法运用在企业档案信息资源挖掘上。而“任何一个管理活动都会有管理工具,任何管理工具都有物质与意识两种不同的表现形式。”[6]根据管理工具的不同,档案管理可以分为档案物理管理和档案逻辑管理。企业经营者运用大数据分析方法管理企业档案信息资源实质是一个逻辑管理过程。企业经营者在决策前,首先要拥有运用大数据分析企业档案信息资源的思维,然后将该思维外化为规则符号构成企业决策模型,成为企业决策的有效工具。
因此,可以说双向决策模型由大数据分析方法外化而成,其本质是企业管理决策的有效工具。
三、双向决策模型的优势
双向决策模型的本质是企业管理决策的有效工具,对模型的优势性分析需要结合企业管理中的具体理论与实践。近年来出现企业知识管理、集成管理、风险管理等专门研究领域。“管理就是制定决策。”[7]企业知识管理、集成管理、风险管理的实质是决策过程。因此本文主要从企业知识管理、集成管理、风险管理三个层次结合案例分析双向决策模型,双向决策模型优势分析如图2所示。
图2 双向决策模型优势分析
(一)双向决策模型驱动下的企业知识管理与技术创新
1.有利于企业隐性技术知识的可视化累积。在大数据时代,一切都可以量化,类似于企业员工的经验等隐性知识可以数据化,企业隐性知识可视化展现已经具备技术基础。例如,对于即将退休的技术人员,通过口述访谈形式将其多年工作经验标准化、规范化,形成企业的业务指南或者员工技术手册,有助于提升企业技术创新水平。
2.有利于企业的知识发现。使用双向决策模型,企业管理者可以迅速掌握企业内部信息和外部竞争情报,掌握市场发展趋势,精准营销。利用基于目标驱动技术评估与预测模型,企业可以采取与顾客交流方式,将顾客隐性需求显性化,
满足顾客需求;利用基于数据驱动技术监测与预警模型,企业可以获取网络、新闻、报纸等不同媒介上的信息,及时建档,分析消费者观念变化、价值取向、市场发展趋势等。
(二)双向决策模型驱动下的企业集成管理与技术创新
1.有利于流程重造,质量控制。以双向决策模型为工具,能够帮助企业重新审视自身结构,加强质量控制,推动企业业务流程的优化重造。
2.有利于企业合作模式创新。双向决策模型可以使企业管理者掌握企业内外有价值的档案数据,通过分析挖掘发现潜在的合作伙伴,促进企业合作模式创新。
(三)双向决策模型驱动下的企业风险管理与技术创新
双向决策模型为企业风险管理提供工具。通过及时建档,对企业实现内外部控制,从企业档案大数据中发现有价值的竞争情报,发现企业运行过程中的潜在问题,把企业运行管理过程的风险降低到最低,并对风险进行预测、评估、监控,实现企业对风险的主动控制。具体来说,企业可以使用该模型中的偏差检测技术,从众多档案数据中发现异常情况,并参照给定模型预警响应,达到风险控制目的,减少企业损失。
四、双向决策模型的运用策略
双向决策模型作为科学管理决策工具,帮助企业管理者做出科学决策,推动企业技术创新,但该模型并不是万能的。谷歌在2009年预测禽流感案例被视为大数据分析预测的典型成功案例,然而谷歌的禽流感预测在最近两年显示不准确。大数据时代下企业档案信息资源的4V特征使得很多时候收集到的档案数据存在“变量遗漏”和“样本偏差”,以这样的数据为依据,得到结果可能是低效甚至是错误的。
大数据分析方法只是一种工具,只能提供参考,并不能盲从,应建立失效预警防御机制。同时由于企业档案中包含大量个人隐私信息,要求企业管理者在分析挖掘这些档案信息时应正确处理商业利益与客户隐私的关系,保护客户个人隐私。此外,双向决策模型运用实时建档方法,将使企业档案大量增加,给企业档案管理带来较大压力,因此应设定数据合理存储期限。
[1]Drucker.Post-capitalist Society[M].New York:Butterworth Heineman, 1993.
[2]朱东华.大数据环境下技术创新管理方法研究[J].科学学与科学技术管理,2013(4).
[3]王毅,赵淑梅.国有企业技术创新与档案大数据管理安全战略研究[J].档案学通讯,2014(2).
[4]Porter A,Cunningham S.Tech Mining:Exploiting New Technologies for Competitive Advantage[M].New York:Wiley,2005.
[5]Akella,Janaki,Timo Kubach,et al.Data-driven Management: Bringing more Science into Management[R].McKinsey Technology Initiative Perspective,2008.
[6]丁海斌.论档案的逻辑管理[J].档案管理,2013(5).
[7]赫伯特·A·西蒙.管理决策新科学[M].李柱流,译.北京:中国社会科学出版社,1982.
F272
A
1672-3805(2016)05-0001-05
2016-08-08
辽宁省经济社会发展课题“辽宁省企业技术创新与档案大数据分析方法研究”(2016lslktzdian-30)
李晶伟(1991-),男,中国人民大学信息资源管理学院硕士研究生,研究方向为档案管理。