浙江统计大脑建设路径探索与思考
2023-04-17浙江省统计局课题组
□ 浙江省统计局课题组
| 背景意义
(一)建设统计大脑是贯彻落实习近平总书记关于数字浙江建设战略部署的重要实践
党的二十大报告指出,要加快建设网络强国、数字中国。浙江是数字中国战略擘画的重要萌发地、率先实践地。早在2003 年,时任浙江省委书记习近平同志作出了数字浙江建设重大决策部署。2023年9 月,习近平总书记亲临浙江考察指导并发表重要讲话,赋予浙江“中国式现代化的先行者”新定位和“奋力谱写中国式现代化浙江新篇章”新使命。统计大脑建设是贯彻落实习近平总书记重要讲话精神,落实省委、省政府决策部署,破解统计工作难点堵点、推进统计领域数字化转型的重点任务。
(二)建设统计大脑是推进统计现代化改革的重要举措
国家统计局“十四五”统计现代化规划明确,要加快建设与国家治理体系和治理能力现代化要求相适应的现代化统计调查体系,以科技创新为支撑,推进统计现代化改革,以统计科学、数据科学和现代信息技术支撑统计事业发展。特别是在增强统计调查能力方面,要推进统计生产流程数字化改造取得突破,基本建成统计云平台。作为“两个先行”示范省的统计部门,浙江省统计局有条件有基础率先以数字化推进统计现代化改革探索。自2018 年以来,陆续建成数字化应用平台等多个信息化系统,为先行打造集成化综合性平台奠定了坚实基础,积累了丰富的知识经验和技术力量。
(三)建设统计大脑是贯通协同各数字化场景实现效能倍增的现实需要
近年来,各政府部门坚持需求导向、问题导向、目标导向和效果导向,推出一批多跨协同重大场景应用解决方案,亟需对各自沉淀大量数据进行结构化、标准化处理和清洗,推动数据共享共用,更加有效发挥数据价值,急需立足数据资源基础,综合运用算力算法,深度融合业务知识,面向应用需求端,打造或沉淀智能化公共组件,推动能力复用和贯通协同。2022 年初,浙江提出加快探索各领域大脑建设的新路径,把握好“再造、赋能、驱动、安全”要求,全面推进统计大脑建设。
| 统计大脑建设路径探索及阶段成果
“大脑”是神经中枢、运行中枢,核心是数据计算分析、知识集成应用、逻辑推理能力。浙江省统计局坚持一把手领衔、班子带头、专班跟进、全员参与,从2021 年9 月启动统计大脑V1.0 版建设,到2022 年9 月更新迭代至3.0 版,打造了“一池一库一箱一舱一中心”体系架构,为各数字化场景的高效协同运行提供最基础最重要的平台支撑。
(一)构建扩展型算力池(一池)
依托浙江省政务云的云服务器、云存储、云安全等软硬件资源,构建了统计数据计算、存储、安全防护的能力中心。包括云服务器45个(其中34 个服务器ECS、10 个关系型数据库RDS、1 个Redis),7 个云储存OSS,34 个云安全,优化了算力资源使用和运行监测,保障了算力资源的安全,为统计业务和重大应用提供基础保证。
(二)构建多维型统计数库(一库)
打造数据治理平台,探索构建“以数据自动沉淀为主,人工采集为辅”数据采集体系,依托浙江省一体化智能化公共数据平台,根据不同类型的数据需求,建立省统计局接口调用、批量数据或数据融合计算等部门数据归集模式,构建统计数据(15.46T)、元数据库(33077条)、资料库(32283 篇)、文献库(海量)、案件库(7839 个)、运维库(335 条)等多维度数据底座,提供目录查询、共享申请、GI(政府智能)数据分析等服务。聚焦全省统计局系统数据,归集清洗加工3394 张表14.5 万个指标并梳理形成数据资产目录。聚焦重大决策部署,构建共同富裕、碳中和等专题数据库,其中,共同富裕基础数据库归集省公安厅等30 个部门213 类数据资源46.2 亿条。
(三)构建智能型工具箱矩阵(一箱)
基于智能化平台,构建算法库、模型库、图谱库、组件库,打造统计智能工具矩阵,与重大应用形成“正向支撑、反向沉淀”的良性互动。创建数据质量管控等统计业务核心算法93 项并持续优化;初步搭建反映三大产业监测、三大需求监测、三大收入监测、GDP 影响因素模型预测、GDP 生产函数模型预测、固定资产投资增速预测等的SWOT-A 模型53 个;构建GDP战略目标管理等智能模块16 个;形成经济形势分析、统计法律法规等知识图谱2 个,不断提升应用集成智能度,实现自我学习、全面感知、预测预警和战略目标管理能级跃升。
(四)综合集成“我的智能中心”(一中心)
创新建设“我的智能中心”,推动以用户为中心的业务集成。实现了从名录库、项目入库、数据生产、数据加载、数据发布、财务内控等统计生产服务全流程业务节点提醒,完善数据生产、审核确认、推送发布的一站式全流程管理,支持指标分析、专题展示屏创建、模型创建复用、知识资料共享等自定义功能,支持全省统计系统工作人员自定义集成业务功能,构建个性化、集成化、智能化的个人工作中心。
(五)汇聚搭建“一屏尽览”驾驶舱(一舱)
搭建全方位的“核心业务+重大应用+经济形势图谱+我的智能中心+统计智能工具箱+统计数库”全省统计系统工作平台统一入口,确保日常办公系统、统计生产、统计服务、统计监督三大核心业务以及数字化重大应用集中展示管理运行,便于统计人员一屏掌握和综合调用。
| 统计大脑实战效能
统计大脑作为浙江统计领域“应用的应用”,统计领域整体智治的动力源和能力集,积极推动突破数据共享壁垒,支撑业务流程再造和制度重塑,助推统计生产更加智能规范、统计服务更加智慧精准、统计监督更加智效有力。
(一)助力统计生产更加智能规范
1.增强数据审核管控能力。一是助力把好调查对象“入库关”。利用企业入规电子围栏等工具,建立入规测算算法和模型,对入规、退规跨电子围栏双向流动情况实现可视化、智能化全面感知。利用投资项目精准坐标经纬度数据,智能化识别全省所有投资项目边界重复问题。利用多期“卫星遥感影像图数据”,建立建筑物自动判读算法和形象进度自动测算算法,监测约2.4 万个项目点,提高投资项目入库的效率和准确性。二是助力把好数据生产“审核关”。建立跨专业数据质量风险识别模型,围绕GDP 相关专业主要指标,设置表间数据逻辑性、部门数据匹配性、变动趋势合理性等管控规则,实现跨专业跨部门自动审核。建立实时数据监测机制,在数据上报期间,实现基层数据质量管控、国家数据比较、风险预警等功能。三是助力统计数据生产方式变革。部署“浙农直报”功能,改变原来村一级填报模式,实现农业经营主体统计数据“一键报送”。利用国家地理信息系统、国土“三调”底图、无人机高分遥感地图的组件,对规模户进行地理信息标识,推进农业经营户“户—账—图”的统一。探索利用部门数据补充完善规模以下工业抽样调查、规模以下服务业联网直报等新途径。
2.减轻基层工作负担。一是围绕提升统计人员工作效率。依托“统计单位活动状态智能监测”工具,利用税务等部门数据,建立单位生、死、生存质量等生命状态监测模型,监测统计单位活动状态,让数字跑起来代替统计调查核实。依托“数字员工”AI+RPA 技术,实现7×24 小时各专业报表自动化、智能化催报,奇异值报警、准强制报警等智能化审核以及基础数据汇总等功能。劳动工资统计安装部署120 个机器人,累计自动运行任务20 万次。二是围绕减轻调查对象填报负担。利用OCR 等技术,以数据智能抓取匹配为路径创新数据填报方式,实现企业部分报表数据从企业基础资料到联网直报系统的自动上报,落实为企业减负承诺和提高统计数据源头质量目的。特色小镇季报30 项指标自动从一套表取数,减少基层填报工作。
(二)助力统计服务更加智慧精准
1.加强数据高效共享利用。一是完善数据供给模式。形成公共数据主动共享、个性化数据灵活共享、隐私数据脱敏共享的数据共享模式。通过省一体化智能化公共数据平台主动共享166.25 万笔数据;依托数据融合计算平台形成政府部门数据需求征集机制,分类研究满足;个性化需求常态化定制提供,个体数据需求通过“可用不可见”提供服务。与部门合作开展“亩均论英雄”“企业水效评价”等场景建设,完成共享项目7 个、共享统计基础数据232.9 万条。二是支撑数据横纵贯通。向“统计e 家”共享企业名录数据283.25 万笔,向“企业健康诊断”共享一套表调查单位基础数据1145.25 万笔;为“浙江民调在线”问卷调查提供共同富裕基础数据库样本信息数据1.75亿笔,向“一体化统计监督”共享财税部门770 余万笔数据应用于企业数据质量风险评估。定期归集能源监测中心、电力公司等数据,开展能源指标数据多跨协同校验。此外,规范系统内数据回流共享申请流程,按需向市县统计局回流大脑数据。三是支持数据价值挖掘。打造可视化数据地图,实现地图任意区域数据的汇总开发利用。提供GI(政府智能)数据分析服务,实现对原始数据库表数据直接自定义搜索查询汇总,扩展数据开发范围、深度和自由度,提升了数据应用水平和效率。
2.拓展统计服务边界。一是丰富统计监测新内容。聚焦共同富裕统计监测,对“1+9”重点群体进行精准画像,探索建立人户关联模型对“家庭”进行精准画像,该统计模式入选浙江省委社建委共同富裕机制性制度性创新模式。聚焦碳排放碳中和,通过多跨协同、数据共享、智能核算,统一规范开展各地区、领域、企业碳排放监测预警工作,实现碳排放核算零成本、全覆盖、及时性、高效益。二是提升统计服务精准度。利用数据汇聚分析,实现民生民意主观调查对象的精准画像和调查问卷的精准推送。利用统计指标白名单系统查重3.7 万人次,累计精简报表29张,减少调查指标929 个,实现统计报表指标的精准管理。三是实现基层统计服务直联通。线上“统计e 家”和线下“统计之家”双向发力,为全省5915 个单元、近12 万家“四上”企业提供服务,累计开展直播培训689 次,设置“小灵统”智能咨询,方便企业自主查询答疑解惑。“企业健康诊断”应用基于健康综合评价体系,探索政府公共数据从服务政府为主向赋能企业发展并重的新路径,累计发送预测预警信息19.7 万余条,排查风险隐患企业5319 家次,有650 余家企业得到精准帮扶。
3.提升经济形势分析研判能力。一是聚焦经济形势全面感知。依托经济形势分析图谱,围绕经济在合理区间内运行的核心指标,从GDP 核算因素分析、三大产业、三大需求、要素投入、社会预期维度,跟进监测省委、省政府重大决策部署,实现从经济宏观分析、行业或产业的中观分析、企业的微观分析相结合的经济形势画像。二是聚焦重点指标目标监测跟踪。构建具有自我学习力的GDP 预测预警模型,通过建立生产函数和影响因素两个模型,对未来最近一期GDP 进行趋势性预测;通过比较GDP 各相关因素指标实际增速与目标增速、各设区市当期实际值与年度目标差异,对增速滞后指标、地区发出预警,助力实现“目标选择—全面感知—预测预警—目标跟踪”闭环管理。
(三)助力统计监督更加智效有力
1.提升执法检查针对性。建立企业数据质量码,以单个调查对象最近一次核查或检查的最大差错率为依据,分色赋码显示数据质量情况。以一套表联网直报单位填报时的修改、异常等行为数据为依据,构建预警规则模型,实现对企业、专业、地区数据质量情况的实时风险预警。累计一级预警单位1.6 万家,问题检出率已达37%,远高于日常“双随机”抽查。
2.提高统计核查协同度。开发掌上核查模块,实现核查数据可保留、核查痕迹可查询、核查结果可自动汇总,解决专业核查负担重、易出错、缺乏统筹造成多头重复检查、线索移交执法程序不流畅等问题。同时实现信息实时更新、精准查询、自动汇总、智能分析。实现与“大综合一体化平台”执法监管数字应用平台互联互通,执法检查和案件查办信息推送和数据共享,提高执法检查和行政处罚规范化水平,避免“宽松软”。
3.推动统计监督常态化。通过“日常监督”模块及时记录党委政府、职能部门和统计机构统计法定职责履行情况和防治统计造假工作情况,实现线上常态化监督,并为实地督察提供参考。推进统计监督与纪检、组织、巡视、审计监督贯通协调建立多跨协同,实现线上线下、全方位、立体式监督协同。
| 问题与建议
统计大脑建设取得了阶段性的成效,但对标预设建设目标,对照实战应用效果,还有不少问题需要正视。比如数据归集力度与数据安全责任风险矛盾,统计业务对大脑功能现实需求和统计大脑创新需求开发的矛盾,统计大脑对应用正向支持与应用对大脑反哺的矛盾,本地系统建设先行创新与国家统计局统一部署的矛盾等。我们应充分认识统计大脑建设的长期性和艰巨性,对标“数据治理、业务协同、应用集成、智能共享、改革支撑、安全可靠”的开放性统计智能生态目标,兼顾安全与发展、当前与长远、守正与创新,建立动态评估和调整机制,稳步推进各项建设。当前,重点从三方面完善迭代。
(一)坚持安全底线,着力完善数据资源体系
完善权限体系,根据组织架构同步人员信息,开通统计大脑各应用权限体系,实现省市县三级、其他政府部门统计相关人员按权限查看使用各应用的目标,并自动对接人员信息,实现人员岗位变动后权限自动调整功能。完善数据归集机制,补充各类基层表、综合表、部门指标等充实数据库内容,对数据库填报数据进行验证及纠错,对各专业逾期未报指标进行提醒催报。完善数据共享机制,修订完善数据共享归集规则,为推进共享回流提供制度保障。完善数据安全机制,建立健全数据安全和隐私保护机制,确保数据的完整性、保密性和可用性。
(二)坚持实战导向,着力完善智能化功能体系
根据应用反馈持续推进算法模型的训练和优化,实现GDP 战略目标管理等现有业务模块智能化能力演进升级。持续丰富知识图谱内容,更新经济形势图谱、统计法律法规图谱、统计调查制度在内的知识图谱库,实现模板化智能分析文章编辑。创建便捷组件,实现数据治理平台、AI 一站式服务平台等各技术性平台功能的便捷化操作,更好满足统计人员对数据加工、预测预警、大屏构建等自定义业务功能需要。
(三)坚持系统观念,着力完善综合集成体系
以统计大脑为底座,进一步优化统计大脑与各应用的综合集成模式,推动各应用数据、组件、业务智能模块的集中沉淀。强化综合统筹,减少重复功能建设,实现跳转更加顺畅,用户体验更加友好。以统计大脑为统一操作平台,不断完善丰富“我的智能中心”模块,并由省级向市县层级延伸。以统计大脑为驾驶舱展示窗口,集中直观反映省市县三级统计数字化建设成效。对标国家统计局智慧统计,积极争取浙江省节点建设,实现上下数据贯通、系统衔接。