APP下载

浅析人口库数据建设及其应用

2023-09-15桂煜凯

中国信息化 2023年8期
关键词:昆山市标签人口

桂煜凯

昆山市政府对运用大数据技术整合人口数据非常重视,抓早抓实,取得显著的成绩。本文就昆山市运用大数据技术进行系统建设框架、人口库基础数据采集、人口库基础数据开发应用三个方面做一浅析。

一、系统建设框架

昆山作为苏州大市下面的一个县级市,在建设自己的人口基础数据库时,以电子政务外网为依托,将苏州市人口基础数据库为交换枢纽,通过数据解析、清洗、比对、校验、加工等一系列过程从苏州市人口基础数据库中定时抽取数据存放于昆山本地数据库中,并将本地采集的教育、医疗、人社等相关数据推送给苏州,形成与苏州市级人口数据的共享互补。昆山市级的各部门通过接口调用的方式从人口库中取得相应数据,形成自己的政务服务应用。

在网络结构上,昆山市人口基础信息库系统部署在电子政务外网上,以政务网应用为核心,多种通信方式并存,形成跨平台、支持分布式处理的计算机网络系统。系统具体所涉及的网络包括电子政务外网、部门数据维护专网、互联网三大部分。结合昆山市大数据资源管理中心网络部署情况,平台具体网络拓扑架构如下系统按照各部分物理功能的不同,分成以下几个物理区域。

数据接入区是各数据来源部门数据接入上报的区域,包括各数据接入上报部门前置机,主要有苏州市人口库接入前置机、昆山人社、卫生等部门前置机等。

系统前置服务区负责与各接入部门上报数据接收反馈和数据交换,部署一台包括中心前置服务器,负责人口库数据中心与外部各部门上报数据的接收、反馈和交换。

系统应用服务区是部署平台对外应用发布和系统管理的应用服务器区域,主要包括系统应用服务器和系统管理服务器。

数据生产存储区布置了数据处理服务器、核心数据服务器和存储设备,包括2台数据处理服务器、2台数据库服务器、1台本地核心数据存储和1台备份存储。其中,数据处理服务器负责对中心前置服务器接收的数据进行校验、转换、加工、去重、关联、加载和入库等一系列数据清洗处理,最终形成有效人口标准数据;数据库服务器主要用于人口库的标准数据存储和服务支撑。2台数据库服务器和存储采用了集群安装,并使用了ORACEL RAC方式。

二、人口库基础数据的采集

昆山市人口基础信息库系统进行基础数据采集采用两种方式。

通过部门前置机进行数据交换对数据进行采集。市重点成员部门(如教育、人社、卫生等)配置部门前置机,各部门数据推送至前置机后通过数据交换平台处理后报送至昆山市人口基础信息库数据中心。苏州人口基础数据库通过苏州市级交换平台推送至昆山市人口基础信息库数据中心。

不具备条件的单位可以采用定期导出数据的方式来上传数据。昆山市人口基础信息库数据中心建立中心前置系统负责进行各方的数据接收、解析和疑问数据反饋,经接收解析后的人口信息经过中心处理系统进行数据去重、校验、关联整合等一系列数据处理后保存至人口数据标准,形成昆山市人口基础信息库。

三、人口库基础数据开发应用

人口库的数据必须是全而大的,昆山人口库归集了本市户籍人口信息、流动人口信息、社保信息、医疗诊治信息、公积金信息、车辆信息、驾驶证信息、违章信息等,人口库已初具规模。基于人口库来做相关应用,打通各政府部门人口础信息之间的数据孤岛已然可行。但目前昆山人口库对海量人口信息数据没有建立有效的模型,当采集到新的人口数据后系统需要相应调整,导致数据分析应用的扩展性和灵活性较差。通过构建标签系统、助力全市智慧小区建设、政府民生应用形成数据+应用的双轮驱动,能最大程度发挥人口库的作用。

(一)标签体系的建设

标签体系的全文检索工具能够实现对全市人口库中的数据的快速分析和关联统计。利用昆山人口库海量信息数据,实现用户画像的构建,根据人口社会属性,生活习惯等信息抽象出标签化的人口模型,用户画像能够利用数据的多维度视图,客观真实地反映出用户的行为轨迹、习惯特点及服务需求等,为数据分析应用提供了必要的技术支撑。

1.数据处理流程

系统先接收多个信息采集渠道的人口信息,再对人口信息分类,根据人口库数据及建立的人口数据标签,确定人口个体画像及人口群体画像。

2.系统功能框架

人口库标签系统功能框架分为数据层、模型层和功能层三部分组成。

昆山市人口信息索引库是在现有昆山市人口库基础上通过现有数据层已有原始数据,构建模型层和功能层相关业务功能进行整合支撑。

数据层是对现有已归集的数据进行预处理及展示,实现数据处理为人口库标签提供初步加工的基础数据;模型层主要构建人口信息相关特征进行分析挖掘处理,构建人口画像及人口业务画像;功能层是对基础管理功能中的标签进行全生命周期管理。

3. 数据标签管理

为了适应昆山市人口基础信息资源库统一服务需求,人口标签信息包括标签定义信息,标签属性信息,标签结果信息三大类。标签定义信息包括了:标签说明信息,创建日期,标签名称,标签分类信息,标签编码,标签审核状态,标签审核人,审核日期等。标签属性信息包括了:标签编码,版本日期,标签版本。标签结果信息包括了:人口标识信息,标签编码,标签名称,标签值,生效时间,失效时间,标签更新频次。

4.标签分类及相关规则

从昆山市人口基础信息资源库,昆山政务交换平台,各局办业务平台直接获取的数据,通过基础属性判定规则即可生成基础属性标签。通过标签系统权限下发,由各区镇各单位业务人员按业务规则进行分析、梳理、制定的标签称为业务标签。

人口标签规则是指对标签的解释,说明人口标签和特定逻辑表达式的含义。比如人口就业状况标签由“失业”和“就业”组成,又可在其标签中深入分解为“就业困难”和“自主创业”等。

5.数据标签应用场景分析

系统提供标签辅助分析能力来帮助人口库业务人员了解到昆山人口标签中相关内容,实现相关的构成分析、对比分析,趋势分析等分析手段,辅助相关业务人员洞察人口进行辅助自助创建新的标签。标签对比分析:分析不同标签中人口数重合,不重合在总人口数中的占比情况。标签构成分析:展示标签在某个统计周期下,按照所选择的属性纬度值对标签人群构成情况分析。

6.标签评估模型

标签评估对人口标签结果信息的使用效果进行综合评估,通过使用情况和反馈结果,持续完善提升标签体系。根据索引标签使用次数,业务应用成果有效应用次数等,使用加权积分计算综合标签评分值。

7.标签数据仓库设计

标签数据仓库按照数据标签规范,对各区镇各部门业务场景标签数据按照一定的规则、方法和流程进比对、整合并存储。采集的数据标签信息基于安全域划分,建立人口库扩展、专题库、关联库、标签库等存储数据,形成标签基础数据仓库。人口库存储是基于现人口信息归集的数据,并提升人口库数据。专题库存储是通过各政务部门业务场景使用,形成落地场景标签数据。关联库存续是通过与外部共享交换通道归集证照、信用、其他部门数据匹配关联。标签库存储是按照各信源单位配置规则完成标签数据清洗、匹配关联等操作处理。

8.标签业务场景

(1)在养老方面的应用

在民政和各区镇发放相关养老金时及相关节日上门慰问老人时,苦于没有相关老人分类底册,造成很多工作中的困难。标签平台把人口数据开发应用通过拓展延伸、条线建模,力争使数据动起来、活起来、用起来,切实赋能社区治理、服务群众,取得明显成效。标签平台将打标签功能下发,由相关部门、区镇业务人员对辖区高龄、空巢、独居、残疾、失能、重病等特殊人群添加“巡访提醒”标签,生成标签“80-89 周岁”老年人、“90-99周岁”老年人、 “100 周岁及以上”老年人。按巡访周期,以村(社区)为单位定期推送巡访人员名单,同时由巡访人员完善老人信息标签,如打上空巢、独居、失能、重病等类型。一方面解决了各区镇、相关部门尊老金的申领问题。当达到申领高龄津贴条件时,平台会自动汇聚领取人员名单。另一方面当标签系统和相关综治网格系统打通后,将向该小区所在网格的网格员发出巡访提醒,该网格员就可上门提醒其尽快办理。

(2)在教育行业的应用标签平台可以对市教育人口结构信息进行标签化处理。通过对教育人口的分析,实现师资情况的统计,各教育阶段入学人数和毕业人數统计。 生成标签教育人口结构分析:“幼儿园教育适龄段统计”“小学教育适龄段统计”“初中教育适龄段统计”“高中教育适龄段统计”、“大学教育适龄段统计”“按性别对市内当前教育适龄人口结构分析”“按户籍性质对市内当前教育适龄人口结构分析”等标签。

(二)助力全市智慧小区建设

在全市范围内由政府主导构建住宅小区智能化管理系统的县级市,通过智慧小区建设,完成小区、楼宇等部位门禁的智能化改造,推进小区、楼宇的封闭式管理,统筹社区、住建、公安、网格以及物业等多方力量形成合力,依托人口库对全市人口登记模式进行流程再造,用数据精准赋能“铁脚板”,进一步厘清人口底数,反哺人口数据库。

搭建城市安全管控中心-区镇联动分中心-村(社区)联动工作站-小区物业四级平台架构体系,目前已完成住宅小区智能化管理系统软件1.0阶段开发。安装小区智能化管理系统后,相关部门可以利用技术手段准确核实业主信息,有效提升小区常态化疫情防控能力。以大数据建设为载体,优化暂住登记自主申报、小区居民门禁申报等业务流程,做到人员变动实时感知,同时打破条与条块信息之间存在的壁垒,打通物业系统与暂住登记信息的数据对接,对于逻辑冲突数据,进行二次下发核查,实现流动人口、出租房屋、群租房、安全隐患的精细管理,有效服务公安基础及案件侦破工作。

(三)政府民生应用

基于人口库的应用开发分为两类:一类是针对各政府之间的,一类是应用于广大群众的民生应用。针对于政府部门之间的应用又分两类.

1.直接应用于本部门

现已开通有:公安人口库调用接口,接口调用了人员就诊信息、人员社保信息、出租车从业人员信息等等,为快速破案打下了基础;人社局调用接口,接口调用了人口死亡信息、低收入人口信息,极大的减少了人员骗保事件的发生。

2.通过相关数据来做预测,以便开展以后的工作

系统通过对数据的统计分析,现形成了人口概述、人口与经济、人口与社会、人口与资源四个方面的趋势分析。同时针对特殊的用户比如教育局,基于学区的教育承载能力分析,结合教育部门学区划分,针对本市不同的小学、初中学区范围内的适龄入学人口的统计和教育承载能力分析,主要是学区内适龄入学人口统计,学区内适龄入学人口数据分析。针对于民生应用的,通过智慧昆山APP接口调用方式,现已完成了重名查询功能模块,极大方便了群众。

四、结语

做好人口库管理工作任重而道远,人口数据是动态的,需要不断更新,认真维护;同时要坚持创新发展,深挖其应用潜力,使其在建设“强富美高”的新昆山中发挥更大的作用。

作者单位: 昆山市大数据资源管理中心

猜你喜欢

昆山市标签人口
《世界人口日》
人口转型为何在加速 精读
昆山市“四进四排查” 守群众平安年
昆山市安全学校运行初见成效
昆山市坚持共建共享 争创省级安全发展示范城市
昆山市娄江实验学校
无惧标签 Alfa Romeo Giulia 200HP
人口最少的国家
1723 万人,我国人口数据下滑引关注
不害怕撕掉标签的人,都活出了真正的漂亮