公共文化服务大数据研究的体系与内容
2018-07-10李广建化柏林
李广建,化柏林
近年来,随着公共文化服务的发展以及大数据技术的广泛应用,人们开始认识到大数据在公共文化服务领域的意义与作用。如何构建公共文化服务大数据资源体系,并利用大数据推动公共文化服务领域的整体发展、协同进步与精准服务,成为研究的重点。刘炜等认为,当前伴随公共文化服务而产生的各类大数据已经完全能收集、组织和利用起来[1]。嵇婷等对大数据的采集存储技术与分析方法进行了探讨[2]。张春景等认为公共文化服务大数据应用主要有技术驱动与社会化两种模式[3]。曹磊等对欧美发达国家关于公共文化服务大数据方面的政策进行调研并给出政策建议[4]。陈建认为应将大数据逻辑治理融于公共文化服务实践,构建公共文化服务供需大数据库及其开放共享平台[5]。这些研究在公共文化服务大数据的数据类型与应用服务等方面进行了有益的探讨,促进了公共文化服务大数据的研究。除理论研究外,很多公共文化服务机构尝试把大数据的理念和方法引入工作中,取得了很好的效果。2016年3月26日“文化上海云”上线,平均每月为市民推送1万场活动信息,近100万活跃用户带来的每月访问量达1500万人次。平台产生的大数据广泛应用于文化主管部门及机构的行政管理、资源调配等,通过大数据的集成化采集、分发、再分析,协助政府将公共文化服务供给侧的“端菜”模式,转变为更贴近百姓需求侧的“点菜”模式。时至今日,在已有研究与实践基础上,对公共文化大数据的理论体系进行系统研究与深入探讨,时机已经成熟。本文首先梳理构建公共文化服务大数据研究体系的背景,然后探讨公共文化服务大数据研究的体系与内容,最后提出公共文化服务大数据研究近期应该关注的重点课题。
1 构建公共文化服务大数据研究体系的背景
1.1 构建公共文化服务大数据研究体系是国家发展战略的要求
公共文化服务是由政府主导、社会力量参与,或由经过授权的公共机构,利用公共资源,向公民提供文化产品、设施、活动等服务,以满足公民的基本文化需求的制度和系统的总称。这体现了政府的责任,也顺应了民众文化需求的变化。我国提出到“十三五”末期即2020年,基本建成现代公共文化服务体系。十九大报告指出我国社会的主要矛盾已经转化为人民日益增长的美好生活需要和不平衡不充分的发展之间的矛盾。在公共文化方面,如何解决好这一矛盾,“美好生活需要”在公共文化方面有哪些具体表现,如何准确地把握用户需求,如何充分利用数据资源的共享与对接解决不平衡不充分的问题,成为新时代公共文化服务需要着力解决的问题关键。事实上,十八大以来,党和政府重视公共文化服务大数据发展的顶层设计,重现提高政府公共文化服务大数据治理能效、打造数据驱动的新型公共文化服务链、加快公共文化服务大数据应用示范,以加快实现在“十三五”期间建成我国现代公共文化服务体系的战略目标。
2015年1月14日,中共中央办公厅、国务院办公厅印发的《关于加快构建现代公共文化服务体系的意见》指出,要加快推进公共文化服务数字化建设,“结合‘宽带中国’‘智慧城市’等国家重大信息工程建设,加快推进公共文化机构数字化建设”,“加强公共文化大数据采集、存储和分析处理”,“加快推进数字文化资源在智能社区中的应用,实现‘一站式’服务”。
2017年3月1日起施行的《中华人民共和国公共文化服务保障法》(以下简称《保障法》),将公共数字文化服务点纳入公共文化设施,要求县级以上地方人民政府将公共文化设施建设纳入本级城乡规划,根据当地条件,“形成场馆服务、流动服务和数字服务相结合的公共文化设施网络”。《保障法》指出,国家统筹规划公共数字文化建设,构建标准统一、互联互通的公共数字文化服务网络,建设公共文化信息资源库,实现基层网络服务共建共享;国家支持开发数字文化产品,推动利用宽带互联网、移动互联网、广播电视网和卫星网络提供公共文化服务;地方各级人民政府应当加强基层公共文化设施的数字化和网络建设,提高数字化和网络服务能力。这些表明数字信息资源及其服务手段在公共文化服务中的作用已经得以充分重视,与场馆服务、流动服务一道构成公共文化服务的三大基础。如何充分发挥数字信息资源及其服务的效能,是今后公共文化服务工作者的重要任务。
除公共文化服务领域本身十分重视数字公共文化资源及其服务以外,大数据建设领域也十分重视公共文化大数据,公共文化大数据是国家大数据规划建设的重要组成部分。2015年8月31日,国务院发布《促进大数据发展行动纲要》,系统部署大数据发展工作,要求加强顶层设计和统筹协调,大力推动政府信息系统和公共数据互联开放共享,加快政府信息平台整合,消除信息孤岛,推进数据资源向社会开放,增强政府公信力,引导社会发展,服务公众企业;加强数字图书馆、档案馆、博物馆、美术馆和文化馆等公益设施建设,构建文化传播大数据综合服务平台,传播中国文化,为社会提供文化服务。
上述政策法律文件充分表明,在公共文化服务体系的建设中,国家要求通过公共文化服务大数据的研究与应用来支撑与保障公共文化服务体系的建设与发展。大数据技术应用于公共文化服务,尤其是应用于民众的需求识别、精准服务等,将给公共文化服务资源汇聚方式、行为模型构建以及智能分析、决策支持等带来一系列重要变化。在大数据环境下,要保证公共文化服务体系建设的顺利开展,就需要把公共文化服务大数据的理论探索与应用研究作为工作的基础与主线,为公共文化服务的资源汇聚、共建共享,为公共文化服务数据的分析挖掘,为探索公共文化服务的用户特征与需求提供理论指导。可见,构建公共文化服务大数据研究体系,不仅是学科理论建设的需要,更是国家发展战略的需要。
1.2 构建公共文化服务大数据研究体系是公共文化服务实践的需要
公共文化服务体系建设是一项系统工程,涉及的机构、要素很多。
从服务主体看,主要指公益性文化机构,如图书馆、文化馆、美术馆、博物馆、科技馆、纪念馆等。这些机构因任务、职能不同,拥有的基础资源有所不同。例如,图书馆主要以图书、期刊等纸质文献与文献数据为主,数据的呈现以文本为主,资源本身是静态的,资源的更新是持续的,资源的使用具有很强的知识功能;文化馆主要以非物质文化遗产为主,涉及传统文化、曲艺杂技、礼仪民俗等,具有典型的人文特征与明显的群体性;美术馆主要以视觉艺术为中心,资源涉及绘画、雕塑、摄影作品、插画、装置艺术以及工艺美术作品等,通过视觉去感知并欣赏资源是其典型特征,提高艺术修养与陶冶情操是其基本功能;博物馆主要典藏人文自然遗产,其资源一般是实物,具有很强的收藏特征、价值一般很高。不同类型公共文化机构之间的资源规模、资源类型以及数字化程度差别很大,这些有着巨大差异的资源合集构成了公共文化大数据的主体。这一点与已实现大数据成功应用的领域(如电子商务、金融)有很大不同。以银行大数据的应用为例,各个银行从事的业务内容基本相同,工作流程大同小异,因此所产生的数据在性质上基本相同。不同类型银行之间的数据属于“同质异构”(即性质相同,结构不同),这类机构的大数据应用重在解决数据的“量”的问题。而在公共文化服务领域则不同,图书馆、文化馆、美术馆、博物馆等公共文化服务机构提供的服务方式并不一样,图书馆通过图书文献的阅读来达到服务目的,文化馆通过举办各类展览、讲座、培训等开展服务,美术馆通过展览视觉艺术作品来提供服务,博物馆通过陈列代表自然和人类文化遗产的实物来进行服务,等等。这些机构的业务系统在体系结构、数据性质、实现的功能等方面完全不同,所产生的数据不仅仅数量大,更为关键的是数据的“异质异构”(即性质不同,结构不同)。这种数据规模庞大、异质异构的特性正是大数据的基本特征,非常适合用大数据的理念和技术来进行处理。但是,如何将这些异质异构的数据融合汇聚到一起,实现一个共同的服务目标,以往重在解决“量”的问题的大数据理念和技术并没有给出现成的解决方案,需要我们结合公共文化服务的实际进行探索。
从服务客体看,用户在任何一种类型的公共文化服务机构中表现出来的需求都仅仅是其公共文化需求的一部分,而不是全部。正如“公共文化服务体系建设”中“体系”一词所表明的那样,只有将用户对不同类型机构的服务需求集成地、体系化地揭示出来,才能真正理解用户、理解社会对公共文化服务的需求,从而更好地为民众服务。显然,这是一项系统工程,也是“公共文化服务体系建设”的最终目标。公共文化服务用户需求的这种特征决定了公共文化服务大数据不能简单地套用大数据理念与技术。以用户画像为例,电子商务领域的用户画像是最成熟的大数据应用,电商系统与平台利用用户注册信息等基本数据,结合用户浏览、查询与点击等行为数据,以及用户购买的商品、单价、网购量等商务数据,并辅以用户所在城市、收货地址等位置数据,对用户的类型与特征进行全面刻画,对用户的需求进行分析挖掘,从而更好地进行推荐与精准营销,这一系列工作靠电商自身的平台就可以完成。而公共文化服务则不同,要满足其用户需求须分别通过阅读、观看、欣赏等感官动作来实现,而且这些感官动作及其施加的对象存在于不同类型的服务机构(图书馆、文化馆、博物馆等)中。这就需要我们在大数据的理念和方法基础上,进一步研究不同类型公共文化机构中用户数据的集成整合,以及对这些数据进行融合分析的方法。从这个意义上说,一般的或其他行业的大数据理论并不适用于公共文化服务领域,需要我们构建公共文化服务大数据研究体系,以指导并解决公共文化服务大数据应用中的具体问题。
1.3 大数据在多领域的成功应用为构建公共文化服务大数据研究体系提供了借鉴
在数据驱动的大数据时代,运用大数据推动经济发展、完善社会治理、提升政府服务和监管能力是新的趋势。大数据深刻影响着人们思维与决策的方式。“用数据引领创新,用数据驱动发展”是大数据时代的标志,成为推动社会发展创新与现代化治理体系构建的新模式与新要素。大数据在搜索引擎、商业及电子商务、金融保险、公共交通以及城市综合治理等领域已经取得了成功应用。例如,在现代化商场中,提供WiFi服务已非常普遍,顾客进入商场后便习惯登录上网,即使不登录上网,手机WiFi也会处于开启状态;商场可以采集到所有上网和开启WiFi手机的信息,分析商场顾客的人群特征,商场中具体某片区域人流量及聚集情况,顾客在某片区域的停留时间,顾客对某片区域重复访问次数等。利用这些信息可以分析商场中店铺的分布是否合理、哪些店铺是热点店铺、顾客的特征、顾客的行走线路习惯等,辅助商场管理者更好地进行管理。公共文化服务机构完全可以借鉴这种大数据应用,提升对公共文化服务场馆管理的科学性。
事实上,大数据应用并不简单地限于上述例子中的统计分析。大数据智能分析方法在近年来也有突飞猛进的发展,不仅在棋类游戏、图像识别、智能语音、机器翻译等技术领域表现出强大的能力,在城市管理与社会服务方面也有不俗的表现。如浪潮集团于2017年9月启动的“基于移动时空大数据深度学习的人群流量预测预警”项目基于TensorFlow框架和深度学习方法,在分析人群时间维度流动规律的基础上,融合DPI数据、MRO数据、气象、节假日等多源数据,预测未来一定时间段内人群流量变化,为城市规划、智能交通以及城市安全决策提供科学依据。使用GIS工具将地图栅格化,并将历史DPI和MRO数据清洗转换为表示人群流量的图像。在空间维度上采用多层的卷积神经网络挖掘人群流量的空间距离性和层次性,在时间维度上采用15分钟粒度、天粒度和周粒度3个采样周期对历史人群流量图抽样,挖掘人群流量随时间变化的平滑性、周期性和趋势性。在此基础上,实时动态监测区域人群流动变化,综合考虑不同栅格互相之间的影响,精准分析和模拟每一栅格历史的人群流入和流出变化,以及对未来一定时间段内的人群变化做出预测预警。基于移动时空大数据和深度学习的人群流量预测预警,能直接服务智慧城市建设,为其出谋划策、保驾护航[6]。
大数据在这些领域的成功应用已形成较为丰富的理论方法与技术体系,积累了实践应用的成果与经验,为公共文化服务大数据研究体系构建提供了理论依据与参考。对具体的公共文化服务机构来说,其数据大致可以分成两类:一类是业务系统中的数据,包括但不限于数字图书馆服务系统、博物馆电子展览系统、服务机构官方网站、用户投票系统、参考咨询服务系统、留言板、论坛等,这些数据记录了用户的行为、资源的利用情况等,非常有价值,目前比较关注这些数据的应用。另一类是时空数据,包括但不限于人流数据、阅览室阅读数据等,这些数据有重要的应用价值。例如,通过网络定位技术可以分析人群在图书馆、博物馆、文化场所的聚集情况,通过RFID可以收集读者在阅览室中阅读的情况,通过二维码可以分析用户对展品的观看情况,通过传感器可以采集用户在活动区域的停留时间。对这些数据的综合分析,有助于公共文化服务机构进行资源规划配置、场所有序疏导、服务项目设置、用户兴趣的发现等。由于这些数据并不来自于现有业务系统(即业务系统中并没有这类数据),目前公共文化领域对其类型、范围、采集手段以及应用方式认识得还不太清楚,需充分参考借鉴电子商务、城市计算等大数据领域的理念体系、理论方法、技术实践、服务模式等现有成果与成功经验,积极引进消化吸收。同时,还要分析公共文化服务领域的现状与问题,结合公共文化服务领域的行业特点、发展阶段与现实需求,形成具有领域特色的公共文化服务大数据研究体系,对公共文化服务大数据应用做前瞻性引导。
2 公共文化服务大数据研究的体系与内容
公共文化服务大数据是新生事物,其理论体系研究还处于初探阶段。为了更好地促进公共文化服务的理论探索与实践发展,需要深入研究。
2.1 公共文化服务大数据研究的体系架构
在大数据理论体系构建过程中,不同学者由于学科领域与专业背景不同,对大数据研究体系的认识侧重点会有所不同。一般来讲,计算机信息科学等领域往往是突出技术的发展与应用,以技术为核心要素梳理与构建大数据的研究体系。比如,王元卓等从基础理论与关键技术两个层面展开具体研究,认为在基础理论层面,需要对大数据的复杂性进行研究,并提出适合于大数据的新型计算模型;在关键技术层面,则需要研究多源异构大数据感知、融合与表示,大数据内容建模与语义理解,以及感知、存储与计算融合的大数据计算系统架构体系[7]。经济管理、交通、医疗、智慧城市等领域往往会结合领域特征,以行业应用为核心构建大数据研究体系。所以,采取何种研究体系,是由业务所决定的。在公共文化服务领域,服务是核心。因此,应该以大众化服务为基点进行理论构建,公共文化服务大数据研究体系需要以用户为核心要素展开。
传统的学科体系架构一般有“理论-应用”二维框架、“理论-方法技术-应用”三维框架、“理论-方法-技术-应用”四维框架和“理论-应用-方法技术-管理”四维框架。随着数据资源的积累以及服务方式的转变,一些学科或行业的发展由资源为中心转向以用户为中心。用户画像、个性化定制、精准推荐等以用户为中心的理念与服务在大数据营销、用户行为分析等领域都得到充分的重视并取得了成功。因此,大数据环境下用户经常作为一个维度出现在体系结构中,这样就形成了“理论-方法-技术-用户-应用”的五维框架。公共文化服务作为一种典型的服务领域,有着非常突出的用户属性,公共文化服务大数据的研究体系也比较适宜采取以用户为中心的五维框架来表示,见图1。
图1 公共文化服务大数据研究体系架构
这个框架除具备一定的层次性之外,还根据公共文化服务的自身特点,呈现出明显的网状结构。其中,理论、方法、技术、应用不再是单纯的线性指导或层次性递进关系,而是以用户为中心,通过用户这个纽带连接起来。这种以用户为中心的“网状+层次”体系结构可以有效解决传统上理论与实践脱节、需求与服务不对接等问题。
公共文化服务大数据研究作为一个体系,既呈现出以用户为中心的网状特征,又保留着一定的层次结构。体系的顶层由公共文化服务大数据理论研究组成,中间层由公共文化服务大数据方法研究、公共文化服务大数据技术研究、公共文化服务大数据用户研究组成,顶层的理论对中间层的方法、技术、用户研究起指导作用,后者的研究成果则会进一步丰富理论研究的内容,对理论进行完善。最后一层是应用研究,是根据用户的需求,在理论指导下,以方法和技术手段解决公共文化服务中的现实问题,同时应用研究可以检验理论、方法、技术研究的内容。
如图1所示,在公共文化服务大数据研究体系中,用户研究起到核心作用。一方面,以用户为中心的理念贯穿于公共文化服务大数据研究的每一个组成部分。理论研究要紧扣用户各需求开展,形成以用户为中心的公共文化服务大数据理论体系。方法、技术与应用研究也要紧密围绕用户研究来展开,在研究过程中始终要考虑用户的因素,换句话说,用户研究的需求决定着方法、技术与应用研究的内容。另一方面,用户研究处于整个体系的中心,公共文化服务大数据研究体系其他4个组成部分又对用户研究起到支撑作用,理论、方法、技术与应用研究的成果为用户研究提供理论解释及研究工具,帮助用户研究不断丰富内容,发现新的需求。
图2 公共文化服务大数据研究体系的内容
2.2 公共文化服务大数据研究体系的内容
图1所示的公共文化服务大数据研究体系由公共文化服务大数据理论研究等5个部分组成。其中,每一部分又由若干个子领域构成,每个子领域还可以划分成若干个具体的问题,从而形成一个可扩展的研究体系。在这样一个体系下,各个板块分工明确,各负其责,其内容如图2所示。
(1)公共文化服务大数据理论研究。主要研究公共文化服务大数据的一般原理、一般规律和一般方法,从总体上描述整个公共文化事业发展的概貌和基本脉络,为公共文化服务大数据提供基本理论和研究方法,对公共文化应用和公共文化服务实践起着重要的指导作用。作为一个具有自然科学与人文社会科学双重属性的研究领域,公共文化服务大数据理论需要研究公共文化服务大数据的概念范畴、特征规律等基本问题,形成公共文化服务大数据的理论框架,研究公共文化服务大数据标准的制定原则与流程,研究公共文化服务大数据教育、人才培养等学科理论。
(2)公共文化服务大数据方法研究。可以从多个维度来研究公共文化服务大数据方法,最为常见的就是公共文化服务大数据方法论研究,其目的是给出应用各种公共文化服务大数据方法的一般性的原则。也可以按照数据处理流程中涉及到的各个方法,如采集方法、清洗方法、分析挖掘方法进行研究,研究各种方法对公共文化服务大数据处理的应用规律。公共文化服务的机构多,涉及到的数据类型复杂,一方面,需要研究公共文化服务大数据处理的共性方法(即适用于图书馆、文化馆、博物馆、科技馆、展览馆的共性方法),另一方面,要针对图书馆、文化馆、博物馆、科技馆、展览馆各自的业务特点与数据特征,按行业开展各自的大数据方法研究。前者构成了公共文化服务大数据一般方法研究,后者构成了公共文化服务大数据行业方法研究。
(3)公共文化服务大数据技术研究。在公共文化服务大数据技术方面,除了要研究分布式存储、并行计算、高维可视化等大数据共性技术,还要研究对公共文化服务领域有更强适应性以及更有效的领域细分技术,探索公共文化服务领域关键技术,形成公共文化服务大数据的资源整合与分析技术体系,研究公共文化服务系统集成,构建公共文化服务共享平台以及开发行业专用的软件工具等。
(4)公共文化服务大数据用户研究。只有理解用户到底需要什么,才能知道如何更好地为不同类型用户服务,才能将公共文化资源有效地投放或推送给用户。对用户的深入了解是公共文化服务满足用户需求的前提,也是落实以用户为中心的必经之路。公共文化服务大数据用户研究主要包括用户建模(根据用户特征及服务使用习惯建立用户信息需求模型的理论与方法)、用户行为分析(采集用户行为数据并对其统计分析,从而发现用户使用公共文化服务规律的理论与方法)、用户画像(根据用户行为信息抽象出标签化用户模型的理论与方法)、模型重用(保证不同类型公共文化服务机构的模型可以复用,以便提高建模效率的理论与方法)以及公共文化资源的精准推荐(根据用户模型或画像,对资源进行分析,将符合用户需求的资源推送给用户的理论与方法)。
(5)公共文化服务大数据应用研究。理解了用户的需求,就可以更好地推进应用。通过公共文化服务大数据的分析与挖掘,全面揭示公共文化服务行业发展态势,研究公共文化服务的发展战略,探索公共文化服务新产品与新模式,并对公共文化服务的效果进行客观评价。
3 当前公共文化服务大数据研究值得关注的课题
公共文化服务大数据研究内容很多,有些是大数据领域的共性问题,有些是公共文化服务领域的特性问题,有些是大数据理念和方法在公共文化服务领域的应用问题,有些是需要根据公共文化服务的特点所做的“发明创造”。限于篇幅,下文结合我国公共文化服务体系建设的要求及国家政策与行业实践情况,探讨近期我国公共文化服务大数据研究应该重点关注的课题。
3.1 公共文化服务大数据的概念与边界
公共文化服务大数据的概念与内涵是什么?研究范畴与边界是什么?可以划分为哪些类型?功能与作用如何?这些问题是研究公共文化服务大数据的基础,也是理论研究首先要解决的问题。
大数据的特征包括数据量大、数据类型多样、处理速度快、价值密度低。公共文化服务大数据既有一般大数据所拥有的共性特点,同时也具有本领域特色,如数据分布不均衡、数据应用效果测评难等(不像电子商务等领域可以直接用点击率和转化率等指标进行测评)。因此,从某种意义上说,与公共文化服务相关的各类数据资源都是公共文化服务大数据。但是,也需要指出,当前对大数据概念的使用有一些泛化,针对某一类数据做一些常规统计与对比也称为大数据,是不够严谨的,如针对几千人活动的简单统计显然不是大数据。另外,如果只是单一类型服务机构的数据甚至某一个具体服务机构的数据,由于数据类型分布与数据累积规模都较为有限,也难以称得上大数据。值得注意的是,大数据不仅仅指数据量上的大,还体现在新的分析理念与分析方法上,如倾向于全体数据而不是样本数据,重视相关分析而不是因果分析,追求效率而不是绝对精确。
为避免概念混淆,需厘清公共文化服务大数据的内涵与边界。公共文化服务大数据是公共文化服务体系中各种活动产生的、体现公共文化要素以及要素与要素之间关系的多源异构大规模数据。公共文化要素包括主体、客体、建筑设备、服务过程、馆藏资源等。这些要素在公共文化服务中的地位是不一样的,因而公共文化服务大数据是有层次的,主要包括四个层次:(1)图书馆、博物馆、文化馆、科技馆等各类公共文化服务机构拥有的资源数据、用户人口统计学数据以及用户对各类公共文化机构资源与服务的使用数据,这些数据直接体现了公共文化服务机构的服务能力,是公共文化服务大数据的核心资源,是公共文化服务的核心大数据;(2)业务辅助数据,是指为完成公共文化服务业务工作所需要的数据,包括规范档、分类表、主题表、解说词、活动脚本等;(3)管理数据,包括工作人员数据、建筑设备数据、财务数据等;(4)支撑数据,主要包括政策法规、国家或地方的公共文化服务规划、与公共文化服务相关的互联网数据等。在上述四个层次数据中,当前的研究重点任务是完善核心数据的采集、处理及应用机制,具体包括各类馆藏资源、用户数据、业务管理数据以及相关支撑数据的采集入库、规范标引,形成能够统一揭示、相互关联与映射的多源异构数据集。在此基础上,围绕用户需求与应用场景,利用聚类分析、关联分析、可视化分析、信息抽取等数据分析方法与技术对数据进行多维分析与深度挖掘,使之更好地满足用户需求,提高资源利用率与数据价值。
3.2 公共文化服务大数据方法研究
大数据方法带来的新理念包括多源多维数据的融合,强调相关性、效率、全体数据、实时分析以及挖掘新模式,公共文化服务领域需要充分借鉴大数据方法。但公共文化服务也有自身的特点,通常目标任务明确、注重关键数据或主导数据。因此,大数据方法的范式不能简单套用到公共文化服务研究上,而应该结合行业特点,构建具有行业特色的新模式。在方法的研究方面,不能“只移植,不创造”,公共文化服务应该构建适应行业应用的方法体系。对公共文化服务大数据方法的研究,可从多个维度展开:可以按方法层次展开,也可以按处理流程展开。
按方法层次,可以将公共文化服务大数据方法的研究分为方法论研究、一般方法研究以及行业方法研究。方法论是一种以解决公共文化服务领域问题为目标,对一系列具体的问题、任务进行分析研究、系统总结,并最终提出较为一般性的具有指导意义的处理过程与方法。在一般方法研究方面,重点研究各种大数据方法与公共文化服务相互作用机理,探讨各种大数据方法在公共文化服务中的适应性,探讨如何利用大数据方法推动公共文化服务的改进和创新,总结各种大数据方法在公共文化服务中的应用规律等。如前所述,公共文化服务包括图书馆、文化馆、美术馆、科技馆等多个行业,每个行业有着自身的特点、业务模式、服务对象等等,因此需要针对这些行业的特点,开展各行业的大数据方法研究。
按照处理流程,可以将公共文化服务大数据方法研究分为公共文化服务需求计算,公共文化服务大数据采集方法、清洗方法,图书文献、艺术作品、文物展览等多源异构数据的组织揭示与融合汇聚方法,馆藏资源、用户数据与过程数据的多维关联分析与深度挖掘,资源、用户、场景的可视化展示,分析结果的解读应用与分析评价等。公共文化服务大数据的采集、标引、解析、关联、映射、分析、挖掘、展现应用的理论方法也是重要的研究内容。虽然大数据的处理已经具有较为成熟的流程与一系列分析挖掘方法,但主要应用在商业领域,而公共文化领域的大数据与商业领域的大数据在某些方面还是有着明显的不同,因此其处理流程与方法也会略有不同,或者说整体上是相似的,但在某些细节处理或关键问题上还需要进行改进。比如,为了更好地提供服务与推送,就需要对公共文化资源进行组织与标引、揭示与解析。这些问题在零售、金融、交通等大数据领域就相对简单一些,但在公共文化服务领域中就要复杂得多,这就需要探索更加适应公共文化服务的大数据流程与方法。
3.3 公共文化服务大数据集成整合研究
各级公共文化机构都不可能囊括一个领域所有的数据,更何况公共文化机构涉及到图书馆、博物馆、文化馆、美术馆等多种类型。这些机构所拥有的数据都具有公共文化的特色,体现了公共文化的不同侧面。每个机构都有自己的业务系统,每个机构的系统实际上是一个数据孤岛。这些系统的数据固然有价值,但由于其存在形式分散而不能得到很好的利用。
大数据时代的数据融合为公共文化数据的利用带来了新机遇。如果能够将散落在不同公共文化机构中的数据,基于其特殊的公共文化背景进行集成和融合,就可以对这些数据进行充分的挖掘和利用。在数字馆藏资源数据方面,不同文化机构之间的数据资源有重叠的部分,也有自己的特色部分,将这些数字资源数据集成起来,可以弥补各机构数字馆藏资源方面的不足。从非馆藏资源数据方面来看,不同类型的文化机构属于不同的领域,位于不同的区域,拥有不同的用户。它们拥有独特的服务数据(讲座、展览、活动)、用户数据(参展、借阅、评论、投票),这些数据的重叠性相对较低。对这些数据的集成是对领域、区域和用户做全方位洞察的基础,这是任何单一机构仅通过自身有限的数据很难实现的。通过集成和融合,将这些数据驱动的洞察反馈给数据的源头,即各级公共文化机构,可以为它们提供更精准、更专业、更客观的决策支持。公共文化服务大数据集成整合研究近期应主要包括以下内容:梳理公共文化服务机构的系统和数据情况;设计公共文化服务大数据系统的体系架构;探索公共文化大服务系统及其大数据集成的方法与技术;总结公共文化服务大数据系统集成的实现模式,并通过这些研究来改善和提高公共文化服务大数据的应用效果。
3.4 基于大数据的公共文化服务用户画像建模及精准服务研究
用户是公共文化服务大数据研究的核心要素,如何应用大数据理念、方法与技术提高用户体验,满足用户不断增长且变化的服务需求,提供更智慧的公共文化服务,是公共文化服务大数据研究亟待解决的现实问题。通过梳理公共文化服务机构的用户信息行为数据,抽取公共文化服务网络用户人群的行为特征,分析公共文化活动及其用户行为偏好与群体特征,刻画用户画像,构建公共文化服务用户行为模型,并在此基础上构建基于用户情景的公共文化精准服务推荐系统,为公共文化服务的需求开发、宣传推广、内容推荐、产品设计、营销策划等环节提供决策支持。针对大数据场景下公共文化用户精准服务推荐系统构建面临数据源复杂、数据标准缺失、模型适用性未知等一系列挑战,探索公共文化服务用户建模方法,研究用户模型可重用技术,对推荐系统建设的重要性及可行性进行分析,为公共文化服务机构提升用户体验建立理论与方法基础,都是当前值得关注的问题。具体来说,在公共文化服务用户画像建模及精准服务方面,需要研究各类型公共文化服务机构中各类用户数据的特点及其对用户建模及用户精准服务的适用性及可用性,提出公共文化服务用户建模及精准服务的数据支撑规范;研究公共文化服务用户特征抽取的准则、方法与技术,公共文化服务用户画像模型的构建方法与技术;在识别用户兴趣的基础上,探索符合公共文化服务特点的推荐及精准服务的模型、技术体系及实现方法;研究不同类型公共文化服务机构之间用户模型的共享、重用以及互嵌的规律与方法。
3.5 公共文化服务大数据发展战略研究
在大数据环境下,公共文化服务迎来了新的发展机遇,同时受到外界强有力的挑战。一方面,国家对构建现代公共文化服务体系高度重视,良好的政策环境为公共文化服务注入了新的推动力;而大数据技术方法在电商、智能交通等领域的成功应用也提供了技术与方法上的新的驱动力。另一方面,一些新兴的以内容服务或场景服务为主的网络平台或自媒体(如“罗辑思维”“喜玛拉雅”“得到”)得到了很好的发展,具有很强的知识性与传播效率,吸引了大量的知识与文化领域的用户,它们提供的服务内容与传统公共文化服务机构具有很强的相似性与竞争性。公共文化服务领域如果不重视网络平台与大数据的应用,其未来的发展必将会受到很大的挑战。互联网与大数据的思维正不断地渗透到经济社会发展的各个领域。例如,高德地图根据用户使用导航所反映的路况比通过监控器所反映出的路况要准确与实时得多,滴滴出行等平台迅速改变了原有的电话叫车与路边招车的出租模式与效率,共享单车的爆发式发展一夜之间挤掉了原有的城市公共租用自行车。互联网与大数据对产业发展与服务模式的变革能力与颠覆能力必须引起高度重视。虽然公共文化服务领域具有很强的公众性与公益性,但这种公众性与公益性也恰恰可能是大数据突破的切入口。大数据在公共交通领域的应用与影响值得公共文化服务领域深入思考与借鉴。
公共文化服务大数据的发展需要从公共文化服务方式转变、公共文化服务大数据应用场景与价值方面进行探讨。公共文化服务在理念思维方面,由资源为中心转变为以用户为中心;在服务模式方面,由生产者主导变为消费者主导;在工作模式方面,在业务管理的基础上越来越重视数据、技术与平台的融合与运用。公共文化服务体系建设不仅需要有固定设施体系、流动服务体系,还需要有大数据思维。公共文化机构不仅需要有传统服务方式和手段,更需要有面向个体的个性化服务能力。数字图书馆、数字博物馆、数字文化馆、移动阅读和掌上服务等改变的不仅仅是文化的载体形式,更改变着人们利用公共文化服务设施、享受公共文化服务的方式。在公共文化服务体系建设中实现文化和科技的融合,打造数据驱动的新型公共文化服务链,是公共文化服务体系建设面临的时代任务与前景。通过公共文化服务大数据的分析与挖掘,可全面揭示公共文化服务行业发展态势,探索公共文化服务新产品与新模式,对公共文化服务效果进行客观评价。
通过对公共文化服务大数据的分析与挖掘,可以为政府或文化事业单位科学决策提供支持或参考研究,主要包括3个方面:一是为地方公共文化建设提供支持与帮助,为地方构建国家公共文化服务体系提供顶层设计、决策参考、指导实践、总结提升等服务;二是为公共文化服务机构提供应用解决方案,通过大数据分析,实时捕获公众文化需求变化、及时开发设计新服务形式新产品、定向进行宣传推广、精准测评活动效果等,通过这些举措能更好地服务公众,与社会协调发展;三是为公共文化服务宏观政策制定提供决策支持,通过大数据对我国公共文化服务的新特点、新形势进行分析研判,为公共文化相关政策的规划与制定提供数据支撑与决策参考。公共文化服务大数据必将应用到公共文化服务领域的各个方面,提供高效的管理与全面的支撑。这是公共文化服务大数据发展的必然趋势,也是值得我们深入研究的问题。
4 结语
公共文化服务大数据具有很强的应用需求与时代特点,公共文化服务大数据的研究也具有很强的理论价值与实践意义。深入研究公共文化服务大数据既呈现出很强的必要性,又具备了可行性。作为一个典型的交叉领域,公共文化服务大数据的研究才刚刚起步,有很多问题需要逐步细化探讨。我们要紧跟社会需求与行业发展,在理论方法、技术平台以及实践应用方面进行不断探索、集成创新,把科技与文化深度融合这篇大文章做好。