基于云计算的虚拟社区信息服务模式研究
2020-10-26魏腾云
摘 要:随着云计算技术的发展,在虚拟社区中引入云服务,已成为一种趋势.本文以云计算环境下的虚拟社区信息服务作为研究的出发点,分析了虚拟社区信息服务的现状,并从虚拟社区的信息服务技术架构、信息服务体系架构、信息服务模式应用等三个方面,对基于云计算的虚拟社区信息服务模式的构建做了研究。
关键词:云计算;虚拟社区;信息服务
中图分类号:TP391.1 文献标识码:A 文章编号:1673-260X(2020)09-0036-04
1 引言
云计算[1]是一种基于互联网的计算方式,其共享的软硬件资源和信息可以按需分配给服务对象,用户可以直接使用在云里通过虚拟技术封装好的软硬件资源,无须了解软硬件的具体运作细节,也无需对软硬件环境进行维护。这种方式的出现,使用户可以降低成本开销,把更多精力专注于业务流程的改进。目前,云计算提供的服务主要包括基础架构即服务(IaaS)[2]、平台即服务(PaaS)[3]、软件即服务(SaaS)[4]等,其影响力已经拓展到了网络空间的各个方面。虚拟社区是在网络空间交流中形成的具有共同兴趣、爱好、目标的群体关系总和[5]。虚拟社区的数据主要包括社区与社区、社区与用户、用户与用户之间的交互数据,这些数据经过积累已经形成大量的信息资源,资源的碎片化、序列化、可视化都需要更为成熟的技术支持。将云计算技术与虚拟社区信息资源相结合,研究基于云计算的虚拟社区信息服务模式,有助于改善虚拟社区的管理模式,提升信息服务整体水平。
2 虚拟社区信息服务的现状
2.1 信息产量巨大,但重复使用率低
在各种虚拟社区信息服务平台中,用户既是信息的使用者,又是信息的创造者。用户可以接收、发布各式各样的动态信息,还可以建立属于自己的独立版块(如博客、Wiki、Twitter、QQ、微信等)[6]。众多的平台网站,每个站页中又包含不同格式的大量数据,信息数量高速增长,并且储量庞大而杂乱。虚拟社区信息大多是非结构化数据,缺乏有效的聚合机制,无法实现在Web底层无障碍流动,社区中仅有少量信息被关注、转载,绝大部分的信息重复使用率低。
2.2 用户自主性强,但信息共享意愿不高
虚拟社区成员具有极强的流动性和极大的自主性,为了吸引用户,虚拟社区的注册门槛一般都不高,社区对用户基本上采用积分制、星级制等级别晋升激励手段,看重用户的参与度,把浏览量、点赞率和置评数当成虚拟社区群体规模的首要指标。大多数虚拟社区没有建立对信息价值的客观评价机制,总体上都是以某些博主博文为主导,带动风向,其他用户观看浏览居多,信息共享意愿低,成员对社区的忠诚度具有极大的不确定性[6]。
2.3 信息传播便利,但安全策略还不完善
虚拟社区具有虚拟性、非地域性、非时间性、开放性等特点[5],社区的成员可以是来自世界上的任何一个角落,接入的设备、所使用的操作系统、访问时间都不尽相同,虚拟社区的访问控制能力面临极大的考验。信息传播的便利性,往往带来了网络犯罪、网络侵权、网络色情等负面问题[7]。此外,虚拟社区没有建立统一的信息行为规范,时常在交流区出现非礼貌用语,甚至恶意评论、谩骂等。社区后期介入采取的补救措施,往往收效并不明显。
2.4 信息交互能力提高,但供需矛盾依然突出
虚拟社区的信息交互能力与过去相比已经大幅提高,但信息本体构建、标签本体评价及信息本体重构等过程还不规范,导致用户需要的信息在虚拟社区缺少本体维护,无法把有效信息及时推送给用户。此外,缺少快捷有效的数据更新或本地信息资源库缺少相关数据,也会降低用户的使用意愿。因此,突出的供需矛盾依然是虚拟社区今后需要解决的问题。
3 云计算在虚拟社区中的应用趋势
虚拟社区信息服务正面临着三个重要转变。(1)从单一型向多样型的转变。通过多种形式把信息呈现在用户的面前,让用户能够借助不同渠道获取信息。(2)从封闭式向开放式的转变。以网络化、虚拟化等方式选择、组织、传播信息,构建一个开放式服务系统。(3)保障型向供应型的转变。不再局限于以建立大而全的本地信息資源库,而是以实现用户需求最大化满足为目标。
云计算的出现,强有力地支持虚拟社区的进一步发展。云计算是从分布式计算、网格计算、效用计算发展而来,其核心优势体现在以互联网为中心,为基于云计算环境的各种平台提供高效且安全的云计算服务与云存储服务,它把众多的软硬件资源协调在一起,使用户经由网络就可以便利地获得接近无限的信息资源。基础架构即服务(IaaS)为虚拟社区提供充足的物理硬件设备。平台即服务(PaaS)为虚拟社区提供稳定的网络平台支撑。软件即服务(SaaS)为虚拟社区提供强大的应用程序[8]。
将云计算技术应用到虚拟社区信息服务中,是一个重要的发展趋势。虚拟社区应当积极关注引进新技术,创新发展并实践新型信息服务模式,推动社区可持续性发展。
4 虚拟社区信息服务模式的构建
为了灵活应对需求的变化,协同、高效地为用户提供信息服务,本文提出构建基于云计算的虚拟社区信息服务模式,主要包括信息服务技术架构、信息服务体系架构、信息服务模式应用三个部分。
4.1 信息服务技术架构
虚拟社区信息服务技术架构可分为物理硬件层、虚拟化层、服务层和接口层四个部分。如图1所示。
物理硬件层指的是为虚拟社区提供服务的硬件基础设施,包括网络设备集群、存储设备集群、服务器集群和其他设备集群等。
虚拟化层是通过虚拟化技术,将大量同类的硬件资源,虚拟化成同构或接近同构的虚拟资源池。虚拟化技术的跨操作系统、多任务的特性,使虚拟资源池可以方便存储虚拟社区移植到云计算平台的各类数据。
服务层则是以云计算技术提供的云服务为核心,面向用户提供软件即服务(SaaS)、平台即服务(PaaS)、基础架构即服务(IaaS)三种基本服务模式。云计算提供的应用程序可由客户端设备通过接口进行访问,用户不接触网络、服务器等底层基础设施。云计算提供的平台是那些部署在基础设施上的编程语言、开发工具、网络服务器、数据库等,是应用程序的托管环境。云计算提供的基础架构指的是存储、计算等基础性资源。存储服务则是以HBase/HDFS技术为基础。HBase是一个分布式的、面向列的开源数据库,能够在海量数据中实现高效的随机读取,有很好的伸缩能力,能够同时处理结构化和非结构化的数据。HDFS有着高容错性、高可靠性、高吞吐率等特点,为数据的处理和存储提供强大的底层存储架构。计算服务则以Spark/Storm/MapReduce技术为基础。Spark是面向大规模数据处理的快速通用的计算引擎,支持交互式计算和复杂算法,它剥离了对集群本身的关注,使应用开发者可以专注于计算本身。Storm可以高效实现信息的可靠性和容错性。MapReduce是面向大数据并行处理的计算模型、框架和平台,它可以实现数据划分、计算任务调度、数据代码互定位、面向系统的优化、检测并恢复出错数据等功能。[9]此外,用户控制、安全控制、任务控制、资源控制也是服务层的重要组成部分,为云服务、存储服务、计算服务提供必要的安全协助。
接口层则是以服务层为依托,向用户提供必要的业务接口。面向不同类型的终端设备(计算机、手机、沉浸式设备等)、不同类型的操作系统(Linux、Windows、iOS、Android等),云计算环境下的接口层都具有强大的需求适应能力。
这种基于云计算的虚拟社区信息服务技术架构,有几个优点。第一,将数据资源托管于虚拟资源空间中,便于集中管理、专业维护。第二,减少了硬件及维护人员投入,降低了虚拟社区信息服务的运营成本。第三,接入设备多元化,用户享有更便捷的使用体验。第四,云计算所提供的服务更集中、更及时、更到位。
4.2 信息服务体系架构
虚拟社区信息服务体系架构由采集层、存储层、平台层和应用层四个部分组成,如图2所示。
采集层,实现虚拟社区对相关数据的采集。主要包括用户信息、时间信息、行为信息、外来信息、运营信息等,这些数据类型涵盖结构化数据、半结构化数据和非结构化数据。
存储层,描述信息的存储过程。信息存储既可以基于关系数据库,也可以基于非关系数据库(如NoSQL等)。由于数据类型复杂、原始数据质量不高,存储层需要通过对数据的抽取、清洗、组织等动作,实现本体的构建、语义标注及资源库构建等信息活动。此外,应对信息资源的传播和利用行为呈现出碎片化的趋势,需对加载的资源对象进行碎片化、序列化、可视化处理,便于与云计算平台规范对接。
平台层,即云计算平台,包括资源管理、云中间件、基础服务、基础管理等几个重要部分。资源管理主要面向存储层,包括资源调度、容器管理、任务调度、资源监测等。云中间件则介于资源管理与基础服务之间,包括云消息中间件、云服务中间件、云测试中间件、云监控中间件等,在云计算中间件平台接管了自动部署后,可以根据业务系统的并发访问情况动态地调度后台资源,使计算和存储能力保持弹性。基础服务包括面向用户需求所提供的索引服务、流程服务、权限服务、报表服务、日志服务、文字服务、语音服务、视频服务等。基础管理包括元数据管理、字典管理、图谱管理、模型管理等,数据挖掘和数据集成是对基础管理中的海量数据资源进行梳理分析、整合的有效手段。技术保护为基础服务和基础管理提供访问控制、数据加密、智能代理等手段,保障在云计算环境中的虚拟社区信息安全。
应用层体现云计算平台向用户提供的应用服务。应用层主要包括应用展示窗以及运行其上的智能搜索、智能推荐、服务定制、流程分析、状态估计、代理决策、预测分析、协调调度等服务模块。
4.3 信息服务模式的应用
目前,已有越来越多虚拟社区引入云服务。本文以上海市某高校图书馆为例展开讨论。
4.3.1 前置分析
上海市某高校,多校区办学,在校生近五万人,图书馆现有纸质文献三百多万册,电子图书近三百万种,纸质期刊近八千种,电子期刊五万多种。图书馆藏资源类型多样,储量庞大,但分布较为分散,资源的更新速度不够快,仅有少量学生通过原校内图书检索系统获取数据。为此,该图书馆提出三点信息服务需求。(1)资源内容综合化。尽可能涵盖各个学科,尤其是交叉学科。(2)资源形态多样化。信息资源需要纸质的,也需要电子资源,且满足用户多渠道获取的需要。(3)资源服务精准化。通过挖掘分析,使用户可通过平台一次性获得所需资料。
4.3.2 解决思路
通过分析,得出解决问题的思路。(1)运用虚拟化技术存储数据,整合图书馆海量信息。(2)利用云计算技术,调度管理资源池,实现操作平台一体化。(3)搭建云计算中间件,推动用户的推和“拉”智能化发展。
4.3.3 系统构建
该图书馆原有电子资料较为丰富,基于云计算的图书馆新系统在构建实施过程中,完成了几个重要部署。(1)整合新旧资源。尽可能收录原系统数据到新系统,作为基础支撑,再购入云服务新资源。新系统的资源仍分散各地,通过网络传输服务请求和返回服务结果,服务器本身仅存储少量数据。(2)整合系统服务。对用户进行分类,修订相关资源栏目,以适应不同用户的需求,原有的校内用户统一身份认证系統,也与新系统作了较好的整合。(3)个性化检索服务。在后台通过对信息的关联分析,将结果按数据库推荐或学科推荐的相关度排序,同时前台检索也可按用户个人设定的默认数据库进行查找。
该图书馆新系统选用Ex libris公司的Primo系统作为后台支撑平台,此系统在部署后,与原系统相比优势非常明显。(1)具有友好的界面,操作简单,易于上手。(2)具有良好的可扩展性,新购资源只需要在新系统里做好配置对接,用户就可以使用。(3)具有良好的共享性,新系统将馆内资源集中到云里,避免了资源的重复购买,也为云上扩容做好配置对接准备。(4)新系统里的用户关注内容和行为数据,经过计算分析,可以为制定图书馆信息服务决策提供参考依据。
4.3.4 存在的问题
该图书馆新系统目前仍存在几点不足。(1)数据整合还不完善。本地数据把控较好,从各商业数据库收割来的元数据,在质量和标准上有差异,而去重工作难以设定具体标准,还是会出现数据重复,影响用户体验。(2)资源更新不够及时。云上数据与本地映射数据更新不一致,偶尔还是会出现图书状态信息显示滞后的情况。(3)网页浏览器要求较高。图书馆新系统目前仅支持使用Chrome/搜狗浏览器,使用其他浏览器会出现输入无法显示或显示不完整。(4)定制检索响应时间较长。图书馆新系统的定制检索是从云中获取信息,受限于数据库平台的响应时间及网络传输速度,等待时间较长,导致部分用户的使用意愿减弱。
5 结语
随着云计算技术及其云服务的持续深入发展,基于云计算的虚拟社区在实践中将有更广阔的应用前景。研究基于云计算的虚拟社区信息服务模式,有助于理清技术架构和体系思路,把握信息服务规律,对虚拟社区的构建、运作和发展具有较积极的参考价值。当然,虚拟社区本身也是一个不断进化的网络系统,应该注意把控云计算技术中的难点与风险点,及时解决出现的新问题新需求,推动信息服务朝着个性化、协同化、智能化相结合的方向发展。
——————————
参考文献:
〔1〕Kalagiakos, Karampelas. Cloud Computing learning[C].Apllication of Information and Communication Technologies(AICT), 5th International Conference on. 2011:1-4.
〔2〕Lee B S,Yan Shi-xing, Ma Ding,et al. Aggregating IaaS Service[C].SRII Global Conference(SRII). Annual, 2011:335-338.
〔3〕Lv Cheng-tong, Li Qing, Lei Zhou. PaaS: A revolution for information technology platforms[C].Educational and Network Technology(ICENT), International Conference on. 2010:346-349.
〔4〕Ju Jie-hui, Wang Ya, Fu Jian-qing. Research on Key Technology in SaaS[C]. Intelligent Computing and Cognitive Informatics(ICICCI),International Conference on. 2010:384-387.
〔5〕徐小龙,王方华.虚拟社区研究前沿探析[J].外国经济与管理,2007,29(09):10-16.
〔6〕魏腾云.基于Web3.0的虚拟社区信息服务机制研究[J].信息系統工程,2019,32(12):53-55.
〔7〕王方芳.SNS虚拟社区的交往结构与信息传播研究[D].辽宁:大连理工大学.2010.
〔8〕丁言.云计算下大数据高效处理的若干关键问题研究[D].吉林:吉林大学,2018.
〔9〕吕林涛.大数据技术及其应用[M].北京:科学出版社,2019.