APP下载

基于社会诉求大数据的公共服务需求管理模型研究*

2023-03-11沙勇忠苏有丽

图书与情报 2023年6期
关键词:公共服务决策公众

沙勇忠 苏有丽

(1.兰州大学管理学院 甘肃兰州 730000)

公共服务关乎民生,连接民心,提供高质量公共服务,满足公共服务需求,增加民众获得感,是国家治理能力现代化的内在要求。新时代背景下,一方面公共服务需求呈现多层次、高级化和差异性的演进特点[1-2],另一方面公共服务供给始终面临“供给过剩”“供给真空”“前瞻不足”等现实困境[3]。如何适应快速变化的民众需求,及时回应、高质量满足公共服务需求,成为社会治理创新和公共服务供给面临的重要问题。

随着数字技术迅猛发展,公众的需求表达途径不断丰富和便捷化。公众能够通过12345 政务热线、“留言板”型网络问政平台以及各级领导电子信箱等多种数字平台即时向政府表达自身诉求和期望,由此产生了巨量、广泛的公众诉求表达数据。据2022年政务热线发展报告统计,仅2022 年上半年,北京12345 政务热线就受理群众和企业来电高达2252.7万件[4]。不断涌现的海量诉求使得政府应对和精准把握公众需求面临前所未有的挑战。大数据治理新兴思维和强大的数据挖掘能力为破解这一问题提供了新思路。这些海量的社会诉求大数据具有细粒度、高频度、强感知性、高时效性和开放性[5]等特征,它们不仅在个体层面上能够直接反映个性化需求[6],还能够通过大数据的分析、预测、判断能力,精准定位“需求主体是谁”“需求内容是什么”[7]。 那么如何有效挖掘社会诉求大数据实现公共服务需求管理,就成为亟待解决的问题。本文构建基于社会诉求大数据的公共服务需求管理模型,重点探析其中应该分析哪些需求要素、如何分析以及如何决策等问题,并以人民网地方领导留言板北京市全年的数据为例进行实证分析,验证所构建模型的合理性和可行性。

1 相关研究

社会诉求数据是公民与政府进行咨询、投诉、建议等沟通时产生的行为或痕迹数据,已成为获取公众诉求和发现社会热点问题的重要源泉[8]。不少学者发现了社会诉求大数据在公共领域的应用价值,如在 超 大 城 市 治 理 创 新[6]、政 府 治 理 决 策[9]、应 急 决 策效率提升[10]等方面可以发挥重要作用,并从技术角度对政务微博评论数据[11]、政民互动诉求件[12]、政府领导电子信箱[9]、地方留言板数据[13],通过运用关联规则、共词聚类、主题挖掘、情感分析等大数据技术进行挖掘,发现公众观点、诉求热点差异、城市主要公共问题的时间特征和空间分布等,推动精细化治理。上述社会诉求大数据在公共管理领域的应用研究为本文的研究提供了基础和参考。

国内不少研究将公共服务需求的表达、识别、分析作为单独的对象进行阐述和分析[14-15],而公共服务需求管理“本身是一个闭环的小系统”,包括需求采集、需求分析、需求转化等多个环节[16]。关于公共服务需求管理过程的论述,较有影响力的是复旦大学的陈水生教授对管理全过程的详细阐述,认为“公共服务需求管理是在公共服务过程中公共服务管理方对民众需求偏好和需求信息的调查、分析、整合、传递和转化的全过程。 ”[17]近年来,学界开始关注将数字技术嵌入公共服务需求管理,以达到精准化管理的目的。 现有研究将大数据背景下的公共服务需求管理过程分为精准感知、精准聚类、精准测量、精准满足和精准监测等环节,认为这个过程具有需求实时洞察、系统集成联动、公共价值导向等特征[18],也有学者认为其过程包含需求感知机制、需求挖掘机制、需求辨别机制、需求供给机制以及需求评估机制[19]。尽管学界对公共服务需求管理过程构成环节进行了初步探析,但多为描述性讨论,尚未构建起基于大数据的公共服务需求管理一般性理论模型,对于社会诉求大数据在公共服务需求管理全过程中的应用研究也尚未涉及。因而,本文基于DIKW 模型,从数据流转视角构建基于社会诉求大数据的公共服务需求管理一般性理论模型,重点分析管理过程关键要素和环节,以促进公共服务需求管理向精准化、科学化和纵深化发展。

2 基于社会诉求大数据的公共服务需求管理模型构建

“数据-信息-知识-智慧”模型(Data-Information-Knowledge-Wisdom,DIKW)由Ackoff 于1989年提出[20],用以描述数据驱动决策的过程(见图1)。该过程先后经历收集原始素材,对数据进行处理与解释,使数据之间建立联系形成信息,经过关联分析转化为知识等环节,最终形成可理解的能够为决策提供参考的智慧。基于社会诉求大数据的公共服务需求管理,从大数据中挖掘数据价值,体现了数据驱动决策的思想,同样涉及从数据到智慧的流转过程。本文遵循DIKW 模型“数据→信息→知识→智慧”逻辑,将大数据背景下的公共服务需求管理一般过程分为需求识别、需求分析、需求决策等三个阶段,构建基于社会诉求大数据的公共服务需求管理模型(见图2)。

图1 DIKW 模型

图2 基于社会诉求大数据的公共服务需求管理模型

(1)需求识别。原始数据是孤立、分散的,只有经过加工处理,提取其中的“Who”“When”“Where”“What”等特征生成结构化的描述,才会形成知识[21]。 需求识别运用大数据技术提炼诉求数据中的需求特征信息,其流程首先是通过算法模型自动采集需求原始数据,随后对原始数据进行预处理,再通过特征模型库进一步分类、筛查、辨析和评估,最后剔除不完整、不真实信息后,判别公共服务需求的特征和分类(见图3),其目标是从每一条原始数据提炼出结构化的单个需求。需求识别的数据源来自于网络空间和社会空间,既包括政府网站留言板、政民互动平台、政务平台、在线调查问卷、领导信箱以及社交媒体等各类在线诉求数据,也包括社会调查报告、座谈会等社会空间数据。对需求的结构化描述基于对需求结构特征的表述和观察,通过分析海量诉求数据的组织结构,将需求构成抽象为需求内容、主体、空间、时间、类别、情感等要素,为下一步需求多维分析奠定基础。

图3 需求识别模型

(2)需求分析。辨识出的海量个体需求,还不能从总体上把握公共服务需求,而这正是需求分析要解决的问题。传统需求分析基于访谈、调研、问卷等数据,利用扎根理论、主成分分析法等进行,具有较为成熟的体系,但存在周期长、主观性较强等问题[19],借助于数据挖掘、机器学习、数据可视化等大数据分析方法,需求分析主要对辨识出的海量个体需求进行聚合分析和需求预测。聚合分析分别对需求的内容、主体、空间、时间、类别、情感等结构要素进行统合,将海量无规律的公众诉求转化为直观、动态的公共服务需求要素图表报告,实现主体精准画像、地域精准定位、诉求精准分类,准确、全面把握热点公共服务需求(见图4)。同时,还可以通过对主体特征的分析比较、聚类、分类处理,关注数据的相关性,发现以前不曾注意的联系,掌握以前很难理解的复杂系统[22],为公共服务需求预测提供条件。如专家发现,符合一定特征的“网络搜索行为”与感染“流行病”之间存在一定联系,通过监测统计区域内的“网络搜索行为”,就有可能了解该区域内“流行病”的实际状态[23]。

图4 需求分析模型

(3)需求决策。对各类公共服务需求的总体把握,最终旨在实现智慧决策。公共服务需求决策是为获取最优的公共服务需求满足方案而实施的行动过程,该过程可分为需求清单确定、需求综合评估、决策建议输出等环节(见图5)。需求清单确定首先依据需求分析结果对公共服务需求的强度和紧迫性进行排序,初步确定需求内容。需求综合评估一方面将需求清单与当前公共资源配置、人口分布等数据进行交叉验证,如针对公交站设置的需求,可通过拟设置公交站点附近的人口分布、学校、医院资源、交通流量等进行大数据分析,精准验证公众诉求;另一方面综合政府的供给能力、整体规划以及均衡性等因素,评估需求供给的可行性。 决策建议环节可通过人工智能的仿真能力,模拟需求决策执行后的效果和公众的满意度,同时还可利用大数据技术对初步决策方案进行精准投放,“以决策之事问决策之众”,实时洞察社会各方对初步决策方案的意见和建议,快速准确地传送给需求决策者,形成完整的反馈回路,并通过不断动态调适形成最优需求决策方案。

图5 需求决策模型

3 实证分析

3.1 数据来源

实证数据来源于人民网“领导留言板”(http://liuyan.people.com.cn/home),选择该平台的原因有三:一是该平台是人民日报专门向中央部委和地方各级党委政府主要领导搭建的官民互动平台,覆盖范围广,公信力高,已在纾解社会矛盾、完善社会治理、凝聚社会共识等方面发挥了重要作用,被誉为“广大网民沟通领导、传递民意的首选渠道”[24];二是从该平台公众发帖数据看,诉求内容主要反映了公众对城建、交通、教育、医疗等领域的投诉、建议和咨询,与公共服务需求主题契合;三是该平台公众参与度高、数据丰富且公开可获得。

3.2 分析过程

3.2.1 需求识别

因人民网“领导留言板”仅公开近一年的数据,本文在个人PC 上通过Python 语言编写爬虫程序,运用Selenium 技术模拟浏览器,采集了2022 年1 月至2023 年2 月间用户活跃度最高的北京市的所有留言,共计27616 条。采集数据存在重复留言、字段缺失、无效留言等问题,通过数据预处理操作,得到有效留言27275 条。人民网“领导留言板”将公众留言分为城建、交通、教育、医疗、政务、治安、企业、环保、就业、文娱、体育、旅游、金融、三农等14 个领域类别,在采集用户留言标题、留言内容、留言时间、诉求对象、留言所属领域等结构化数据的基础上,通过算法自动识别诉求对象和留言内容包含的地域特征词,提取诉求主体所属的地理区域,形成了结构要素完整的公共服务需求数据集(见图6)。

3.2.2 需求分析

(1)需求主体分析。传统需求调查通过问卷、访谈等途径得到需求主体的年龄、性别、学历等特征值,大数据背景下,可以利用用户在网络平台留存的注册信息得到需求主体信息,如人民网领导留言板用户须通过手机号注册方可留言,各地的政府网“政民互动”系统也鼓励实名制注册。采集的北京市留言板数据中,经过文本特征分析,9691 条留言直接表明了主体身份(见表1),其中诉求主体占比最多的为城镇居民和农村居民,分别为52.48%和37.53%,在表明职业身份的人群中,企业职工/白领的诉求量明显超过其他群体,他们也更愿意通过网络平台主动表达自身的公共需求。

表1 需求主体身份特征分布

此外,部分留言中隐含了特殊群体的身份信息,如留言“本人父亲是一名肢体二级残疾人员,同时也是一名复转军人……”“2022 年4 月14 日上午,带视力残疾的母亲打算进入某景区被拦下, 出示背面红色的残疾证,只允许我母亲一人通过……”等。 通过构建特殊群体的典型特征库(如残疾、肢体、产妇、高龄、行动不便等),采用文本特征匹配方法,可以有效发现特殊群体的公共需求。本文构建了残疾人群体特征词库,通过特征词匹配算法,对原始文本库进行特征匹配,识别残疾人群体的公共需求,共匹配到留言88 条,并进行词云分析(见图7),结果显示残疾人的公共服务需求主要聚焦于小区配套设施、交通出行等方面。

图7 残疾人群体诉求的词云分析

(2)需求内容分析。以北京市城建领域数据为例,使用结巴分词组件(jieba)对文档进行分词与去除停用词预处理,然后利用TF-IDF 模型进行关键词抽取,转换成数值型词向量特征,最后使用经典的LDA 主题模型进行热点分析。 利用LDA 模型困惑度和一致性参数确定最优主题数为12,提取各主题的主题词,将每个主题内主题词的生成概率降序排列,得到挖掘结果(见表2)。通过对主题词的归纳,形成了“小区安全隐患管理”“老旧小区改造”“小区周边配套建设”等12 个热点需求主题。

从表中可以看出,北京市城建领域需求热点聚焦于小区管理、房产证办理、老旧小区改造等方面。在用pyLDAvis 技术绘制的LDA 主题模型可视化图谱(见图8)中,每一个气泡代表一个主题,气泡越大,代表主题出现的频率越高,主题相互之间的位置远近,表示主题之间的接近性,气泡有重叠说明话题里的特征词有交叉[25]。可以看出,通过大数据分析技术能够从文本数据中识别出一定区域内的公众热点需求,并直观呈现区域内公共服务需求全貌。

图8 北京市城建领域公众诉求LDA 主题可视化图谱

(3)需求时空特征分析。分析公众诉求表达的时间和空间特性非常重要,通过时间分析可以发现公众需求随时间推移的演化趋势,通过空间分析,可以发现不同地域的公共服务需求差异。从公共服务需求表达的时间特征来看,北京市上半年诉求量要高于下半年,自3 月起诉求量开始上升,4 月-7 月延续了3 月的高诉求量,8 月-10 月诉求量逐渐降低,11月诉求量有所提升(见图9)。由此印证了“两会”的召开激发了网络空间公民诉求的表达,而党政机构的年终考核也为公民诉求表达提供了机会窗口[24]这一观点。可见,在中国情境下,民众的总体诉求状况与中国的政治活动周期密切相关。

图9 公众诉求量时间分布

公众诉求的空间特征可以从两方面测量:一方面,诉求文本包含了地理特征词,如留言“尊敬的市委书记:您好!大红门拆迁十多年,2021 年安置的,2022 年初发的钥匙入住并且是全款买房,位置在丰台区金通阳光苑26 号院2 号楼……”“南庭新苑北区防疫期间,废弃口罩就乱扔在公共楼道处……”。这些留言均表明了留言个体的地理特征,体现出公众诉求的本土化,即公民直接代表自己的利益,反映的是与自己居住、生活、生产密切相关的问题。另一方面,在政府留言板中,公众诉求对象为各省市县区的党政领导,可以通过诉求对象推断出所在区域。按照上述规则,进行空间特征分析,91.28%的留言均可以识别出空间特征信息。据此得出北京市各区诉求量分布情况,最高的3 个区分别为朝阳区、海淀区和大兴区(见图10)。

图10 北京市各区诉求量分布图

(4)需求情感分析。通过SnowNLP 情感模型,发现总体上公众诉求的负面情绪表达要高于正面情绪的表达(见图11),在政务、旅游、教育、交通等议题上,公众需求表达相对平和,正面情绪的表达较多,在环保、三农、治安等议题上公众负面情绪的表达相对较多(见图12)。这一现象表明公众对环保、三农、治安等领域有关公共服务的满意度相对而言还存在较大的提升空间。

图11 公众诉求的情绪值与留言数量分布情况

图12 公众需求在各领域的情感极性分布

3.2.3 需求决策

需求清单的确定首先是依据需求结构要素分析结果,对公共服务需求的强度进行排序。需求强度在不同的情境中定义不尽相同,往往与需求规模、情感强度、公众关注度等因素有关,在本案例中,将某一主题下公众的需求强度形式化表示为公式(1):

其中F 是某一主题下个体需求数量,M 是某一主题下个体需求情感强度,A 是某一主题下个体需求用户关注度,可以用点赞数或转发数等表示。α,β,χ 是这三个指标的权重系数,通过专家打分法或层次分析法确定。 从公式(1)可以看出,单一主题的需求强度由该主题下的个体需求数量、个体需求情感强度决定,同一主题下个体需求数量越多,需求情感强度越强烈,公众关注度越高,该主题的情感强度就越强。

在前文需求主题、诉求频数、情感极性计算的基础上,通过层次分析法确定公式(1)中α,β,χ,分别为0.65,0.25,0.1,并对主题个体需求数量、需求情感强度、点赞数等变量进行归一化处理,最后计算出需求强度(见表3)。

表3 各需求主题的分布情况

从表3 可见,小区安全隐患管理、老旧小区改造、办理房产证、房屋拆迁等需求强度最强,诉求占比均超过10%,负面情绪比例均超过了60%,表明这些是公众最为关注的公共服务,决策者应优先考虑对这类服务进行供给。小区周边配套建设、小区停车问题、小区交通问题、施工扰民等诉求强度次之,占比均在5%左右,政府应引导企业加大配套设施资源的投入。相对而言,拆除违规建筑、村庄形象建设、搬迁安置等方面的需求强度较弱,但拆除违规建筑、搬迁安置也属于基本民生问题,也属于决策者重点考虑的范围,村庄形象建设公共服务影响力小,关注度也不高,决策者可根据公共服务资源合理提供。

需求评估可通过北京市城建领域的资源配置数据、历史反馈数据,验证小区安全隐患管理、老旧小区改造、办理房产证、房屋拆迁等公共需求的真实性,再经过领域专家讨论,决定哪些需求是重要并紧急的,哪些需求重要程度一般且是长期需求,最终形成一个包含需求类型、需求内容、需求优先级、需求来源等要素的初步方案。

3.3 结论分析

模型构建和实证分析表明,本文构建的基于社会诉求大数据的公共服务需求管理一般性理论模型能够通过挖掘社会诉求大数据,有效实现需求识别、全景分析和智慧决策,达到公共服务需求精准管理。具体结论如下:

(1)社会诉求大数据在公共服务领域具有巨大的应用价值。社会诉求数据是公众对自身意愿、要求的主动表达,从实证分析可以看出,基于本文构建的模型,对社会诉求大数据进行深度挖掘和分析,不仅能够精准、精细、跨时、跨域地刻画公众公共服务需求,也为预测公共服务需求、探究公共服务需求的关联因素提供了有效路径。

(2)基于社会诉求大数据的公共服务需求管理一般性理论模型分为需求识别、需求分析、需求决策三个连续环节。首先,需求识别采集相关社会诉求原始数据,形成结构化描述的需求;其次,需求分析通过算法模型开展需求结构要素的聚合分析或者进行需求预测,从整体上把握需求特征分布;最后,需求决策环节通过人机协作为需求满足提供最优决策方案。 需求识别、分析和决策三个环节,蕴含数据到信息、信息到知识以及知识到智慧的转化过程,揭示了诉求数据如何一步步在数据流转中形成智慧。

(3)大数据技术在公共服务需求管理中发挥着关键作用。从实证分析可以看出,公众的个体需求结构是由主体、内容、时间、空间等要素构成的多元组,需求识别通过大数据采集、存储、分析技术实现需求分类、筛查、匹配,从社会诉求大数据中提炼出结构化的个体需求;需求分析通过主题聚类、情感分析、特征匹配技术对需求内容、主体、时空等结构要素进行聚合分析,挖掘出群体需求和特殊人群需求;需求决策通过对公共服务需求的强度进行排序,确定需求清单,然后通过综合评估、精准反馈、动态调整直至形成最优决策方案。大数据技术贯穿于需求管理全过程,发挥了关键作用,与此同时,算法模型、训练数据集的选择,也决定了需求识别、需求分析的精准性。

4 结语

大数据技术为重塑公共服务需求管理提供了历史性契机。本文构建的基于社会诉求大数据的“识别-分析-决策”理论模型,厘清了公共服务需求管理的三个环节及各环节的关键流程,为大数据背景下公共服务需求管理提供了完整的技术框架和实现思路,不仅完善了公共服务需求管理的理论体系,而且为高水平公共服务需求精准管理提供了依据,也丰富了社会诉求大数据在公共服务领域的应用实践。

本研究为在数字政府背景下政府部门开展公共服务需求管理提供了思路,也可为数智企业支撑政府智慧决策提供借鉴,主要管理启示有:一是促进数据的融通。 2023 年10 月25 日,国家数据局正式揭牌,其核心职能之一是统筹数据资源,进行整合共享和开发利用。数据的核心价值在于“聚、通、用”,各级政府应以此为契机,充分融合物理空间、网络空间、社会空间的信息,打通政府内部数据流动,畅通公众表达渠道,形成感知民情民意的“数据池”,才可以在“数据池”中精准挖掘公共需求。 二是把握需求分析的全面性。在需求分析中,既要通过海量诉求数据找到一般需求,又要避免“小数据流失”,通过构建针对特殊群体的算法模型,精准识别其个性化需求,才能更好地体现出需求管理对个性化和多样化公共服务需求的适应。三是构建适应不同场景的算法模型。针对不同公共服务领域,构建适应不同粒度场景的监测、感知、预测算法,如针对交通服务需求,要考虑特殊节假日、特殊时间段、重点路段等不同场景需求,实现精准决策。四是打造多元协作格局。政府要重视人才建设,加快培养既懂政府业务又懂信息技术的复合型人才,同时注重调动、发挥市场和社会主体尤其是科技企业在数据资源、算法技术和算力能力上的优势,形成多方协作的公共服务需求管理新格局。

猜你喜欢

公共服务决策公众
公共服务
为可持续决策提供依据
公共服务
公共服务
公共服务
公众号3月热榜
公众号9月热榜
公众号8月热榜
公众号5月热榜
决策为什么失误了