基于云计算的政府门户网站知识管理研究
2014-08-08迪莉娅
基金项目:本文为河北省高等学校人文社会科学研究重点项目“电子政务云服务模式构建研究”(项目编号:SD124010)的研究成果之一。
作者简介:迪莉娅(1974-),女,副教授,管理学博士,硕士生导师,研究方向:电子政务与信息资源管理,发表论文20多篇,出版专著1部,参编教材3部。·信息资源开发与利用·
〔摘要〕政府门户网站是电子政务服务的窗口。云计算为政府门户网站的知识管理提供了强大的技术工具。本文阐述了云环境下,政府门户网站知识管理的意义,重点论述了政府门户网站知识管理的过程和保障策略。
〔关键词〕云计算;政府;门户网站;知识管理
DOI:10.3969/j.issn.1008-0821.2014.03.013
〔中图分类号〕C93〔文献标识码〕A〔文章编号〕1008-0821(2014)03-0055-05
Research on Knowledge Management of Government
Portal Website Based on Cloud ComputationDi Liya
(College of Humanities of Law,Yanshan University,Qinhuangdao 066004,China)
〔Abstract〕The government portal website is the window of eGovernment service.Cloud computing technology provides powerful tools for knowledge management in government portal website.The paper expounded significances of knowledge management of the government portal website,focusing on the process and security strategy of knowledge management of government portal website under the cloud environment.
〔Keywords〕cloud computing;government;portal website;knowledge management
1概念界定
11云计算
云计算是并行计算、分布式计算和网格计算的综合发展,是计算机科学概念的商业实现,同时又提升了虚拟化、效用计算等功能。云计算的发展经历了网格计算、共用计算、软件即服务和云计算4个阶段。云计算的基本类型分为IaaS(基础设施即服务)、PaaS(平台即服务)、SaaS(软件即服务)和KaaS(知识即服务)。因为云计算具有资源的虚拟性、高弹性计算和存储能力、按需服务和节省资源等特点,美国、德国、英国等国政府部门都在尝试将云计算的理念和技术用于提高电子政务的管理与服务。
12政府门户网站
政府门户网站通常是一级政府统一建立起来的跨部门、综合的业务应用系统,使公民、企业与政府工作人员都能快速、便捷地接入所有相关政府部门的业务,并获得个性化服务的窗口。政府门户网站是政府提供公共服务的重要方式之一,是电子政务系统的重要组成部分[1]。
具体而言,政府门户网站首先是对外服务的平台。政府门户网站承担着政府对公民(GtoC)、政府对企业(GtoB)、政府对非营利组织(GtoO)、政府信息公开与服务等功能。其次,政府门户网站是跨部门、集成的服务系统。我国政府门户网站通过将所属机构的服务资源通过后台集成,为前台提供查询、交互、交易的网上服务。第三,政府门户网站是提供个性化服务和知识挖掘的平台。通过用户在政府门户网站操作中所留下的“足迹”,以及在政府工作流中沉淀下来的数据的挖掘,为用户提供基于兴趣和偏好的服务和优化政府的工作模式,提高政府的决策和创新能力。
13知识管理
虽然知识管理的思想最早由哈耶克在其著作《个人主义与经济秩序》中首次提出。但西方公认的最早提出知识管理理论的则是当代伟大的管理宗师彼得·F·德鲁克。虽然知识管理的理论提出有一段时间,但目前对于知识管理的含义仍众说不一,例如丹尼尔·E·奥利里认为:“知识管理是将组织可得到的各种来源的信息转化为知识,并将知识与人联系起来的过程,即对知识进行正式的管理,以便知识的产生、获取和重新利用[2]。DavidJSkyrme博士则认为:“知识管理是对重要知识的创造、收集、组织、使用等一系列流程的科学的、系统化的管理。它注重于将个人的知识转化为组织的知识,并使知识得到适当地运用[3]。而学者王瑛认为知识管理是一种以人为中心,以数据、信息为基础,以知识利用和创新为目标,将知识看作是一种可开发资源的管理思想[4]。
本文对知识管理的解读是以利用云计算技术为前提,以政务为基础,以服务为导向,按需求为用户提供分布式数据挖掘与知识发现、决策分析等高端功能的电子政务知识服务平台。
2基于云计算的政府门户网站知识管理的意义
21提高政府创新的能力
政府创新是指政府为适应不断变换的经济政治环境,回应公民、社会诉求,实现政府基本价值目标,对行政理念、组织机构、行政制度及体制等行政活动各层面进行自我革新的能力。知识管理既是政府创新的结果,又是政府创新的基础和前提。过去信息渠道不畅通,信息处理成本过高,信息管理工作普遍处于自发状态,缺少信息工作的长远规划,没有信息的系统管理制度及机制,必然导致政府创新能力不足。反之,通过知识管理,在信息的基础上获取全面、准确和多样化知识,不仅为政府创新提供了“原材料”,而且有利于开阔政府的认识视野,启发创新思维,形成创新动力[5]。
22拓展政府的知识服务能力
知识服务是指从各种显性和隐性知识资源中按照人们的需要有针对性地提炼知识,并用来解决用户问题的高级阶段的信息服务过程[6]。因为政府数据的不断增长,对于知识的提炼成为政府信息管理与服务的重要任务,但从数据到知识则是一个不断演进的过程。
因此,知识服务是政府公共服务的高级阶段。在这个阶段,通过利用云计算技术的数据分析与挖掘能力,在海量数据中提炼政府知识,为用户提供知识查询、定制、推送等服务,革新政府传统的、被动式的服务模式,提升政府的知识管理与主动服务能力。
23加强政府信息资源的共享能力和提升电子政务和政府数字治理的效率利用云计算技术将有助于打破政府各部门间、政府与公民间的固有边界,“信息孤岛”现象将有可能大幅度削减,信息共享有望成为现实。云计算技术提供政府决策所需要的基本信息支持,提高政府各机构协同办公的效率和为民办事的效率,极大地提升政府的治理能力和公共服务能力。
24优化政府的管理流程
传统的电子政务系统是运营式的信息服务系统,即为提高工作效率和服务而设计的系统,但系统工作流程中所产生的现行数据和历史数据,并没有很好的开发和利用起来,而仅仅具有查询的功能。在云环境下,以用户服务为中心,政府知识的获取、分析、评价、开发利用成为管理的核心内容,对改变和优化政府管理流程将起到积极的作用。
endprint
3基于云计算的政府门户网站知识管理的过程
31政府门户网站数据云的建设
311政府门户网站数据的集成
政府门户网站数据采集的来源包括两个部分:政府门户网站电子政务系统运行数据和用户行为的数据。政府门户网站电子政务系统运行数据主要包括电子政务业务流程数据、案例数据、公开信息与政策法规数据、历史数据等。用户行为数据是指用户在登录政府门户网站进行浏览、查询、互动和交易过程中所产生的数据。而采集的类型包括结构化数据和非结构化数据。尤其对政府门户网站非结构数据的采集成为主要的任务。据有关统计数据表明,仅有20%的数据存储在结构化数据库里,而其他80%的非结构化数据分散在业务构成和外部环境中,例如文本、图像、影像和网页等[7]。
政府门户网站的数据采集首先进行的是政府内部数据的集成。例如为公民、企业、非营利组织、政府部门服务的工商局、税务局的、教育局等各个职能部门的数据在该部门的中心服务器中集成,然后利用云计算分布式并行计算的能力,在各个机构的中心服务器中采集数据和组织数据。因为云计算很强的扩展性和容错能力,对数据尤其是非结构化数据的采集具有强大的功能,可将数据池相同或者相似的数据同构化,同时应用集群技术、虚拟化技术实现机构之间的无缝对接和超级共享(见图1)。
312政府门户网站数据的存储
政府门户网站是政府所属服务的集成网站,每天在政府门户网站运行着大量的数据需要存储,而传统的行式数图1政府门户网站数据云的形成图
据仓库存储已经无法满足政府门户网站管理与发展的需要。在云环境下,列式电子政务数据仓库克服了行式存储的弱点。列式数据仓库的数据是根据属性按照列存储,每一属性列单独存放。投影数据时只访问查询涉及的属性列,大大降低了系统输入和输出损耗。又由于列式存储的数据具有相同的数据类型,相邻存储的数据之间相似性比较高,具有更好的压缩率,而压缩的数据更能够减少输入与输出的开销[8]。例如,传统的数据仓库存储采用的行式存储有1个1万行的表,取其中3个字段,行存储需要每行都读取出来才能取出3个字段。而列存储只需要读3次就可以完成任务,大幅度提高了电子政务数据仓库管理的性能。
32政府门户网站数据的挖掘
基于云计算的政府门户网站数据的挖掘采用的是分布式并行挖掘技术。分布式并行数据挖掘技术不同于其他并行算法的地方在于它适用于处理大规模的数据处理。过去所使用的串行数据挖掘算法只能适用于规模很小的数据,并且其运行需要花费大量的时间也成为其缺点。分布式并行数据挖掘是指在分布式系统中,机器集群看作硬件数据池,将并行的任务拆分,然后交由每一个空闲机器去处理数据,能够极大地提高计算效率。任务分解处理以后,将处理以后的结果再汇总起来[9]。
MapReduce是云计算环境中处理大规模数据集的挖掘模型,MapReduce的实现主要包括两个函数[10]:
Map(inputkey,input value)→
Reduce(Key,[Valuei…valuem])→
程序员在Map(映射)函数中指定对各分块数据的处理过程,在Reduce(规约)函数中指定如何对分块数据处理的中间结果进行归约,它在政府门户网站管理中的应用,不仅可以提高数据挖掘的效率,而且这种机器数据的无关性对于计算集群的扩展也提供了最好的设计保证(见图2)[11]。图2基于云计算的政府门户网站数据挖掘图
33政府门户网站数据的知识抽取
在云环境中,Map面对的是杂乱无章的互不相关的数据,通过Reduce解析的每个数据,能够提取数据的特征。但对于数据之间的关系和内涵的认识还有一段距离,这就需要本体技术进一步提炼信息,形成知识。
本体是知识抽取不可缺少的工具。本体从数据中抽取出与本体匹配的事实知识,该技术与语义标注具有相同的本质,即识别无语义标注信息的语义含义。本体是领域内重要实体、属性、过程及其相互关系形式化描述的基础,在知识共享和知识建构中具有重要的作用:(1)本体将某个或多个特定领域的概念和术语规范化,为其在该领域或领域之间的实际应用提供便利。(2)本体可在不同的建模方法、范式、语言和软件工具之间进行翻译和映射。(3)本体将对象知识的概念和相互间的关系进行较为精确的定义,大大提高知识搜索、知识重用、知识共享的效率[12]。
331政府门户网站初级本体词表
政府门户网站公共服务的提供涉及某一具体的领域,例如医疗、税务、工商管理等服务部门,因此领域本体的构建是前提。领域本体指特定领域内可以重用的,提供该领域特定概念定义、概念之间关系、发生的活动以及该领域主要理论和基本原理等的概念模型[13]。
电子政务主题词表是政府门户网站知识本体建设的基础。主题词表是具有语义关系的语词库,它通过集成规范化的语词,展现了某个学科领域的主题,在传统的情报检索应用中历史悠久,发挥着重要的作用。在某种程度上来说,主题词表可看作是初级本体,二者都通过概念术语从语义层面上组织信息,并通过词形、词义、词间关系表现信息的结构[14]。
我国于2005年编制而成《综合电子政务主题词表》,是我国第一部按国家标准编制的综合性电子政务主题词表,收词范围涵盖了电子政务各个领域,总收录主题词是20 252条,其中正式主题词17 421条,非正式主题词2 831条。范畴表包含21个大类,132个二级类。《综合电子政务主题词表》由族首词、正式主题词、入口词和同义词等组成[15]。主题词表中的语词均是规范化的科学用语,根据词表抽取概念术语建立本体的类,减少了本体构建过程中对领域专家的依赖;主题词表具有“用、代、属、分、参、族”这样简单的词间关系,有助于对本体类的属性和类间关系的建立[14]。
332政府门户网站领域本体库的生成
主题词表作为初级本体,它在领域本体构建的过程中有事半功倍的效果,主要表现在:基于这种方法构建的本体可以遵循词表原有的语义基础,参考其所包含的语义关系,进而构筑领域本体的词义[16]。通过对电子政务主题词表抽取的概念层级结构,直接映射为本体中的概念层级结构而建立的概念的关系层次结构,通过关系的定义域和值域的设置,限制概念之间的联系,从相互作用的角度体现概念之间的实际语义。
333政府门户网站的知识服务
通过MapReduce挖掘的数据通过初级本体和领域本体的分析和解读抽取出来的用户的知识、政务知识和其他知识存放在知识库中,为政府知识图书馆提供基于兴趣和偏好的知识推送、知识定制、知识可视化方面的服务。
4基于云计算的政府门户网站知识管理的保障策略分析41顶层设计政府门户网站知识管理的流程与服务
云计算在政府门户网站知识管理中的应用不仅是一种技术的创新,更是政府管理的创新,它是一种全新的政府门户网站管理与服务模式,而顶层设计是政府门户网站知识管理建设成功的前提。
首先,要树立以用户为中心的知识服务理念。政府要改变传统的“被动式的服务方式”,通过知识管理,获取用户的兴趣和偏好,积极主动地为用户提供个性化的知识服务。第二,建立统一的政府门户网站知识管理的协调结构,避免重复性的建设和更好地统筹资源。第三,知识资源的挖掘和服务成为政府门户网站管理的主线,而非结构化数据的挖掘是其知识管理的主要对象。
42保护云计算环境下的政府门户网站管理与服务的信息安全传统的政府门户网站的数据采用关系型数据库的管理方式,其安全技术已经随着发展已经比较成熟。在云环境中,电子政务系统所依托的非关系型数据库并没有设置严格的访问控制和隐私管理工具,同时由于政府门户网站数据来源的广泛性和复杂性,让政府部门定位私密信息的界限变得复杂起来。同时,由于云管理中将数据储存在同一个地方,虽便于数据保护但同时也容易成为黑客的攻击目标。因此这就需要政府部门加强立法,保护个人隐私安全。一方面立法部门需要使相关法律更加具体和细化,建立快速的反应机制,为监管部门提供及时有效的监管依据;另一方面,需要借鉴其他国家的立法经验,加强各国政府之间的合作,共同保护云环境中数据的安全。
43建立以知识管理为导向的政府门户网站管理与服务的绩效评估体系政府门户网站服务的本质是要站在用户的立场上思考问题,加强与用户的直接互动,了解用户的期望,以追求用户满意为基本目标。因此,将知识管理纳入到政府门户网站绩效评估的体系中是实现其服务目标的重要路径[17]。这就需要政府建立规范化的政府门户网站知识管理评估指标和方法,加强对用户和公务员隐性知识的挖掘和共享,优化政府门户网站知识管理的方法和策略,为用户提供基于需求和偏好的个性化知识服务提供参考依据。
44积极培养数据挖掘与分析的人才
在云环境中,政府门户网站信息的挖掘和知识的抽取成为管理的核心内容之一。在政府门户网站中存储的资源中有很大的部分是非结构化的数据,因为这种数据来源的广泛性和类型的复杂性等因素增加了知识的挖掘和利用的难度。数据的挖掘和知识的抽取需要掌握计算框架和基础算法知识,并能很快部署到云计算和掌握机器学习、知识图谱的人才和具备数学、统计学、数据分析、商业分析和自然语言处理方面的应用型人才。传统的政府门户网站管理的人才层次结构已经无法满足云环境的要求。因此,需要积极培养和引进人才,为门户网站的知识管理提供重要的条件。
参考文献
[1]赵国俊.电子政务教程[M].北京:中国人民大学出版社,2010:147.
[2]张秋.知识管理研究中的五大问题——近两年知识管理研究综述[J].人大复印资料:图书馆学、信息科学、资料工作,2001,(12):11.
[3]苏新宁,任皓,吴春玉,等.组织的知识管理[M].北京:国防工业出版社,2004:23.
[4]王瑛.知识管理与电子政务信息门户建设[J].管理观察,2008,(8):190.
[5]汪平玲,叶战备.中国政府创新能力影响要素分析[J].内蒙古民族大学学报:社会科学版,2010,(5):89.
[6]http:∥baike.baidu.com/view/1878908.htm[EB].
[7]文龙.基于XML非结构化数据管理研究及应用[D].长沙:湖南大学:硕士论文,2009:5.
[8]那玉钢,王曼丽,王翰虎,等.基于列式存储的闪存数据库优化策略[J].计算机技术与发展,2011,(12):132.
[9]王鄂,李铭.云计算下的海量数据挖掘研究[J].现代计算机,2009,(11):22.
[10]章华东.云计算环境下知识服务研究[D].马鞍山:安徽工业大学:硕士论文,2012:11.
[11]张春艳.云计算下的SRINT并行算法研究[J].软件,2010,(11):58.
[12]钟秀琴,符红光,佘莉,等.基于本体的几何学知识获取及知识表示[J].计算机学报,2010,(1):168.
[13]陈一峰,赵恒凯,余小清,等.基于本体的用户兴趣模型构建研究[J].计算机工程,2010,(21):46.
[14]金晶,宋敏霞,徐晨琛,等.基于主题词表的政务领域本体构建[J].图书情报工作,2010,(4):16.
[15]郑新燕,李霖.专题电子政务主体词表体系[J].科技创新导报,2007,(33):143.
[16]牟冬梅,范轶.数字图书馆领域本体的构建与推理——以医学领域本体为例[J].图书情报工作,2007,(8):30.
[17]迪莉娅.基于本体的电子政务公共服务用户知识管理研究[J].图书馆理论与实践,2012,(3):35.
(本文责任编辑:马卓)
纪念竞争情报事业20周年暨第二十届
中国竞争情报年会征文通知2014年我国竞争情报专业组织成立20周年。为纪念竞争情报事业和分会走过的不平凡历程,宣传好行业创造的辉煌成绩,激励广大情报从业者更加热爱竞争情报工作,积极参与国家经济和社会建设,我会将组织开展庆祝成立20周年和第二十届年会的征文活动,有关事宜说明如下:
会议主题为共筑竞争情报梦——纪念竞争情报事业20周年暨第二十届中国竞争情报年会。征文分为纪念性文章和学术研究论文两部分内容。一、纪念与回顾征文(体裁不限,可以采用记叙文、议论文、散文、诗歌、随笔等形式)。内容可包括:1)竞争情报事业的二十年发展历程;2)展现竞争情报业在我国经济和社会建设中发挥的重要作用;3)讴歌竞争情报从业者新风采;4)寄语竞争情报业发展美好明天;二、学术研究论文征文(详见征文要求)。内容包括:1)国家、产业、区域经济竞争情报及其作用探讨;2)竞争情报学科建设与理论研究;3)技术竞争情报理论与实践;4)竞争情报方法探讨与创新;5)企业竞争情报实践与案例分析;6)竞争情报体系建设;7)竞争情报价值评价研究;8)专利情报挖掘、分析方法、工具开发及其应用;9)舆情监测与情报工作;10)商业秘密保护、反竞争情报与竞争情报职业道德;11)竞争情报教育与人才培养;12)新媒体、云环境、大数据下的情报工作研究。
年会将组织专家对所有录用论文进行评选,共设立一等奖、二等奖、三等奖若干名,入选征文将结集出版发行,会议期间将举行颁奖仪式颁发获奖证书,获一等奖的优秀论文由主办单位向相关一级刊物推荐。论文截稿日期:2014年7月15日。
1.来稿请发至:scic@onet.com.cn(主题为“二十届年会论文投稿”)
联?系?人:刘玉、殷锦红、戴侣红
联系电话:(010)68961820
传真:(010)68962474
2.征文录用函与会议邀请函,将于2014年8月30日寄发给作者。
3.征文要求与投稿详情请参阅分会网站(http:∥www.scic.org.cn)
中国科学技术情报学会竞争情报分会
endprint