APP下载

中国体育单位名录库研制中的关键问题探索

2018-11-09张微微

体育科技文献通报 2018年11期
关键词:核查名录层级

张微微,张 立

第一作者简介:张微微(1991-),女,北京人,助理工程师,本科,研究方向:体育信息。

作者单位:国家体育总局体育信息中心,北京 100061 Sport Information Administrative Center of General Administration of Sport, Beijing 100061, China.

1 前言

《国务院关于加快发展体育产业 促进体育消费的若干意见》(国发〔2014〕46号)文件中明确指出,要加强行业管理,“完善体育及相关产业分类标准和统计制度”。体育单位名录库建设是完善体育产业统计制度工作中的一项重要内容。受承担国家体育总局体育产业管理转移职能任务的总局体育器材装备中心的委托,总局体育信息中心专项工作团队在2016-2017两年里承担并创新组织开展了体育单位名录库的结构设计、工程建设、数据处理和应用管理等研究与服务工作,这是我国首次开展网络版的体育单位名录库建设项目,为各级体育部门开展体育产业基本单位核查、规模核算、产业管理和专题研究等工作提供了技术支持。其名录库数据结果为核算、发布我国2015年、2016年体育产业规模发挥了重要的基础作用。在两年多的建设周期里,项目组主要对体育单位名录数据采集处理流程和数据库技术支撑、管理平台的网络结构设计与技术实现、名录数据的属性设计和元数据的规范建设、名录数据的统计利用、多年名录数据的管理与检索利用等问题进行了探索。

2 研究对象与研究方法

2.1 研究对象

从国家统计局的国家基本单位名录库中检索出的部分单位名录数据信息,经各级地方体育部门组织审核并逐级报送的体育单位名录信息,部分地方体育部门自行采集到的体育单位名录信息,以及上述数据的采集、处理和共享利用等过程。

2.2 研究方法

本项目主要采用了文献研究、走访调查、逻辑分析、软件编程与平台开发等研究方法。具体包括:通过查阅文献,对相关数据元、数据库、体育产业研究等文献进行综合分析;通过走访国家统计局相关部门、部分地方省市体育产业管理部门、有关专家等,明确体育单位名录库建设需求,确定专用的库检索主题词;根据体育产业研究需求,逻辑分析体育单位名录各字段属性间的关系,确定数理统计模型等。

3 研究结果

3.1 体育单位名录库数据采集和处理流程分析与数据库技术实现探索结果

3.1.1 数字化处理从国家和地方统计局等部门检索获得的相关单位名录数据

体育产业统计作为国民经济核算体系中的一部分(1),体育产业统计工作必须遵循的一个原则是体育部门要与国家统计部门密切合作,在共享已有统计数据的基础上开展体育产业统计基础数据建设活动(2)。

经走访调研相关部门,项目组了解到国家统计局在经济普查数据基础上建立有国家基本单位名录库,国家体育总局体育器材装备中心首先按照《国家体育产业分类》(3)对应的130个国民经济行业代码从国家统计局基本单位名录库中提取出相关单位名录数据251万条,然后由项目组用专用主题词对其进行检索处理,之后,在总局经济司和体育器材装备中心的统一组织下,项目组将初步的体育单位名录数据下发给全国31个省区市体育局所辖的地市、区县体育局,基层区县体育部门对所得到的名录数据有组织地进行了上门走访、电话咨询等实地核查,根据核查结果对库中数据进行增删、修改等处理。

部分省区市体育局从省统计局、工商局、税务局、教育局、民政局等行政机构同样利用行业代码抽取和专用主题词检索等方法获得地方数据115万条单位名录数据。这些省区市的数据在下发基层体育部门之前由项目组将其与总局下发数据进行融合处理,然后才下发区县体育局。

2016年调研设计、实际使用的专用主题词主要包含有“运动项目名称”“体育”等专有词汇116个。

3.1.2 对上述数据进行自动查重比对、自动分类等数字化处理后形成可分发核查的调查数据

在对多源数据进行融合处理的过程中会产生许多重复数据,查重比对功能可以帮助用户尽快找出并修改或删除处理系统中出现的重复数据。具体做法是:比较数据的“组织机构代码/统一社会信用码”和“单位名称”两字段内容,当出现一个或两个重复字段内容时,即可初步判断此类数据为重复数据。系统软件针对重复数据提供了同页比对的功能,便于基层体育部门的工作人员进行修改、删减处理,本级账户可采取更改或不更改两种处理方式,对不更改的数据可直接流转到下一步,对拟更改的数据用户可通过比对方式对其进行修改、删除等操作,最终达到只保留一条准确数据的目的。

体育单位名录数据通过系统的自动分类功能实现了分类处理,具体做法是:将名录数据中的国民经济行业分类代码字段内容按《国家体育产业分类》文件[1]中与体育分类代码的对应关系用编程方法进行了自动匹配,使许多单位名录信息中自动生成了体育分类代码,对因有一对多或多对一代码而导致无法自动匹配的类别,软件提供了人工匹配功能。

另外,为方便体育单位名录数据实地核查和修改、增删记录等工作需要,系统还提供了自动显示调查表主要字段解释内容、多字段批量处理、对各数据记录修改前后用不同底色显现以示区别等功能。

3.1.3 为四级联网核查、报审体育单位名录数据提供数据库技术支撑

根据体育单位名录核查工作需要,项目组调研设计了体育总局分发数据,区县体育部门组织实际核查与上报,地市和省区市体育部门逐级审核与上报,体育总局终审与封板数据等信息化流程。

在国家体育总局体育器材装备中心的统一领导和各省区市体育局的具体组织下,区县级体育部门组织调查人员到体育机构所在地,现场核对单位名录信息,之后通过软件将相关数据上报给地市级单位用户,地市级单位用户审核后将数据上报省级用户,以此类推最终将各级核实过的数据上报给国家体育总局用户,从而完成了每一条数据的流动过程。体育单位名录库管理软件具有较强的审核纠错管理功能,区县级实地核查和体育总局、地市、省级三级审核的过程,保证了体育单位名录数据的准确性。

图1 体育单位名录核查、报审信息化流程图示

3.2 体育单位名录库管理平台网络结构设计与技术实现探索

在分析上述名录数据采集、审核流程的基础上,项目组组织开展了开发体育单位名录库软件开发及调试使用工作。具体采用了echarts+jquery辅助开发工具,在有限时间里完成了网络版“体育单位名录管理平台”的软件开发和部署建设任务,形成了系统管理员+四层级管理用户的平台框架,搭建了共建、共享的体育单位名录采集利用平台,实现了多级、同步导、录、增、删、查等多种应用功能,其中,系统管理员拥有用户账号管理、检索分类、排重处理、分派任务等功能,国家、省区市、地市、区县四级调研审核单位用户拥有密码管理、分类处理、分级核查、增删改查等功能。

项目组设计的体育单位名录库的信息采集结构是:以国家统计局的基础名录库为基础(与体育相关的国民经济行业代码有130个),依托各级体育局,最终实现了1个总局、31个省/区/直辖市、340个地市、3020个区县等众多用户的同步四级审核、分类处理、增删改查的即时、动态的网络传输系统构架。

图2 四级、多用户同步审核、处理体育单位名录

3.3 体育单位名录属性设计和元数据规范建设探索

3.3.1 体育单位名录属性设计

经走访国家统计局设管司、服务业司、核算司、普查中心等部门处室负责人和相关专家,调研设计了体育单位名录元数据基本属性,在满足今后长期与国家统计局普查中心开展数据交换及体育产业统计核算需求的条件下,项目组研究了体育单位名录的基本属性信息,初步设计了体育产业单位名录基本情况表。在过去两年的实际应用基础上,根据体育产业单位特点及管理部门的管理需求又逐步补充增加了相应指标,形成了现行的体育产业单位名录基本情况表。

表1 体育单位名录基本属性及相关字段设计一览表

3.3.2 研制体育单位名录元数据规范

体育单位名录信息不仅是体育产业统计的基础内容,也是体育信息化建设所需的基本数据,我国竞技体育、全民健身、体育产业、体育管理等领域的信息化建设同样会因有各种体育单位的参与而需要规范的名录信息。因此,在开展体育单位名录库建设的同时,项目组在调研相关体育信息化工作实践、咨询中国标准化研究院高新技术与信息标准化研究所等单位专家的基础上,联手山东体育产业发展中心和北京吉瑞德商科技有限公司开展了体育单位名录元数据规范研究。

体育单位名录元数据规范主要是通过一系列数据属性来表示体育单位名录数据的,这些数据属性主要包括:数据标识、中文名称、同义词、说明、数据类型、长度、数据精度、计量单位、值域、版本、约束/条件、最大出现次数等。规范文本主要由体育单位名录基本属性元数据列表、管理属性元数据列表和信息分类代码集构成。

作为体育单位名录库研制探索中的一项附带成果,体育单位名录元数据规范已于2017年通过了全国体育标准化技术委员会的立项评审,目前已并进入到了征询意见和修改文稿阶段。

3.4 体育单位名录数据的统计利用探索

在调研、分析数据内部结构规律的基础上,项目组创新开发、实现了体育产业单位名录基本属性信息的自动统计等功能,可以为各级体育产业管理等相关机构开展体育产业统计工作所参考,促进实现了体育单位名录数据的使用价值。另外,统计结果图表也有辅助数据审核的功效,统计中如果出现明显异常数据(如金额、人数数量过大等)情况,则可引起相关方面注意,以便有针对性地进一步核查、修改,以确保数据的准确性。

系统所提供的可直观显示统计结果的图表有12组。

(1)不同体育类别的体育机构数量统计图表:依据国家体育产业统计分类内容,可以直观统计和显示每个大、中、小分类中的体育机构分布数据图表,其结果可为行业管理部门研究体育产业重点领域发展政策提供数据参考。

(2)不同层级地区体育机构数量统计图表:该图表直观显示各省区市、地市、区县域内体育机构数量的统计结果,可以为各级体育部门促进发展体育产业工作提供数据支持。

(3)不同体育类别各层级地区体育机构数量统计图表:以各层级地区及体育产业分类两个条件开展体育机构数量统计,其图表显示结果有助于各级体育管理部门掌握所辖区域内从事不同体育产业类别活动的机构的分布情况。

(4)不同体育类别各大行政区划体育机构数量统计图表:按照东北、华北、华东、华中、华南、西南、西北等七个行政区划进行不同体育产业类别的机构数量统计,可以直观反应当年体育产业活动的区域化分布状态。

(5)不同体育类别不同机构属性体育机构数量统计图表:图表直观显示不同体育类别的不同登记注册类型、营业状态、机构类型、控股情况、主/兼营、会计制度类型等属性下的体育机构数量,有助于国家相关职能管理部门全面掌握不同体育类别下的各属性机构分布状况。

(6)不同层级地区不同机构属性体育机构数量统计图表:直观显示不同层级地区的不同登记注册类型、营业状态、机构类型、控股情况、主/兼营、会计制度类型等属性下的体育机构数量,有助于不同层级的体育管理者详细掌握辖区内不同属性的体育机构分布状况。

(7)不同开业时间体育机构数量统计表:可以反应每年从事体育产业活动的机构的数量及其年度变化情况。

(8)不同体育项目体育机构数量统计表:反应从事相关体育项目的体育产业单位数量。

(9)不同层级地区各机构类型经济指标统计表:对不同层级地区、不同机构类型体育机构的营业收入等主要经济指标数据的统计结果,有助于国家相关部门全面了解机关、事业单位、社会团体、企业、民办非营利机构等不同机构类型的产业活动经济状况。

(10)不同层级地区国民经济行业类别体育机构数量从业人数经济指标统计表:对省区市、地市、区县不同层级地区不同国民经济行业类别机构的营业收入等经济指标和从业人数的统计结果,可以为核算各层级地区辖区内的体育产业规模、统计体育产业从业人数直接提供数据支撑。

(11)不同层级地区各体育类别体育机构数量从业人数经济指标统计表:对省区市、地市、区县不同层级地区不同体育产业类别机构的营业收入等经济指标和从业人数的统计结果,可以为推动体育产业重点领域工作提供参考。

(12)不同层级地区不同机构属性体育机构数量从业人数经济指标统计表:对省区市、地市、区县不同层级地区不同属性(登记注册类型、营业状态、机构类型、控股情况、主/兼营、会计制度类型等)机构的营业收入等经济指标和从业人数的统计结果,可以为精细化开展体育产业管理工作提供参考。

3.5 体育单位名录库的多年数据管理与检索利用探索

在对2015年的体育单位名录数据进行核查、修改、上报之后,要进行不可更改的数据封闭处理。但系统仍可提供对封板数据进行查询、统计的功能,查询字段有:单位名称、所在地(省区市、地市、区县等)、体育产业类别、营业状态、机构类型、控股情况、登记注册类型等。根据封板数据查询统计结果,可形成相关数据列表和部分统计图表。

该系统同时具有分年度数据管理功能,可以查询不同年度的体育单位名录信息,以此方便对体育单位名录数据开展对比研究。

图3 2015、2016两年不同体育产业类别的体育单位数量分布图示

图4 2015、2016两年不同区域的体育单位数量分布图示

上图展示了我国2015、2016两年体育单位数量在不同行业类别、不同区域分布条件下的变化情况,反应了我国体育服务业增长、体育用品制造业下滑以及华东、华中、华南区域增长较快的体育产业发展态势。

4 结论与建议

4.1 结论

4.1.1 在充分调研和为期2年的实践尝试基础上,本项目探索出了共享国家统计局的国家基本单位名录库数据、查重和分类等数字化处理以及独立数据库管理全国体育单位名录信息的基本流程和四级联网核查、报审名录数据的技术路线。

4.1.2 根据实际需求,项目组开展了调研设计、开发建设和调试部署体育单位名录库管理平台等活动,探索实现了在体育总局信息化安全保障体系下运行国家、省区市、地市、区县四级并行核查处理和逐级审核的数字支撑技术,为我国2016年、2017年组织开展体育单位名录核查与体育产业统计核算工作提供了有效技术支撑。

4.1.3 根据体育行业特征及产业统计工作要求,项目组在国家统计局提供的国家基本单位名录库基本属性字段基础上,研究并增设了“体育产业类别”“运动项目”“主要经济指标”等多个字段,基本满足了体育单位名录实际调研与核算工作的需要;同时还创新立项了“体育单位名录元数据规范”研究,丰富了我国体育信息化标准体系建设内容。

4.1.4 调研设计了反应我国体育单位现实状态及其内在关系的数理统计模型,软件自动生成了可视化的数据统计图表结果,直观体现出国家、省区市、地市、区县各层级不同区域分布、不同体育类别、不同机构类型、不同国民经济行业类别、不同运动项目、不同经济状态等条件下的体育机构年度数据统计图表,为各级体育部门开展体育产业规模核算和统计研究工作提供了数据支持。

4.1.5 为更好地挖掘使用体育单位名录数据,本项目探索了对2015、2016两年度数据进行封版管理、自动统计和可查询利用的功能设计与技术实现方法,为开展多年度体育单位名录数据的追踪和对比研究创造了条件。

4.2 建议

4.2.1 2016、2017年使用的体育单位名录库软件是在有限的时间里边设计边开发、边调试边修改边使用的,尽管该软件在支撑开展体育单位名录库从无到有的建设中发挥了探索作用,但其系统构架的整体性还存在一些不足之处,建议在主要功能得以基本满足和有相关经费保障的前提下,在组织开展新年度体育单位名录核查工作之前,有必要对该数据库软件进行全面优化升级改造。

4.2.2 尽管网络版的体育单位名录库研制活动围绕了解全国体育单位分布现状、研究核算体育产业规模等工作进行了多角度探索,但在数据采集、数字化处理、信息化共享等方面还有许多便捷、实用、有效的技术(如移动终端、数字地图等)可以进一步引进应用,建议在今后年度的体育单位名录核查工作中逐步实现技术提升。另外,建议部分统计结果数据能够逐步面向社会开放使用。

4.2.3 在现有国家、省区市、地市、区县四级联网核查、审报的基础上,建议逐步拓展增加运动项目协会的相关功能设计,以此推动体育单位名录核查和数据库建设维护工作更加精细、丰富和完善。

4.2.4 建议在体育单位名录库建设和相关数据管理基础上,拓展设计体育产业重点领域监测管理信息系统和工作机制,以此进一步完善体育产业统计与核算工作制度。

猜你喜欢

核查名录层级
独立软件体系核查要点浅析
科室层级护理质量控制网的实施与探讨
2022.3上榜派出所名录
《心理学报》2021年度审稿专家名录
层级护理模式对血液透析患者的影响
太极拳列入联合国非遗名录
浅谈仪器设备的期间核查
参展商名录
职务职级并行后,科员可以努力到哪个层级
食品检测实验室仪器设备期间核查实施方法