新型智慧城市下政务数据资源存储时限的研究
2021-03-10徐海涛李凡瑞
徐海涛 李凡瑞
(1.重庆信息通信研究院,重庆 401336;2.重庆市大数据应用发展管理局,重庆 401120)
0 引言
智慧城市的概念诞生于欧美地区,却在我国得到了快速发展。2012年,《国家智慧城市试点暂行管理办法》的发布拉开了我国智慧城市建设的序幕[1]。2016年10月9日,中共中央政治局第三十六次集体学习中指出,以推行电子政务、建设新型智慧城市等为抓手,以数据集中和共享为途径,建设全国一体化的国家大数据中心,推进技术融合、业务融合、数据融合,实现跨层级、跨地域、跨系统、跨部门、跨业务的协同管理和服务。党的十九大报告也提出,要“加快建设创新型国家”,为建设科技强国、质量强国、航天强国、网络强国、交通强国、数字中国、智慧社会提供有力支撑。2020年,全球迎来了新冠肺炎疫情(简称“疫情”)大考,深入地暴露了传统城市发展的短板,部分智慧城市建设落实情况较好的城市,运用互联网、大数据、人工智能等信息技术手段提升了城市治理及管理的精细化、智能化水平,成功为疫情控制提供了有效协助,其他建设较差的城市则陷入瘫痪状态。事实表明,城市数字化治理是当前新型智慧城市建设下的重要课题,而城市数字化的建设离不开数据的集中存储与管理。
1 政务数据存储时限问题分析
近年来,我国新型智慧城市建设迎来了新一轮的建设高潮。新型智慧城市的建设离不开以数据存储为核心的大数据资源中心建设,统筹规划政务数据资源与社会数据资源,打通数据壁垒,破除数据孤岛,加快实现公共性,服务的数据进行集中存储是新型智慧建设的重要意义所在,如需做好各行业、各部门数据大集中、大融合后的存储管理,保证数据实时共享、价值共享、有效应用,实现存储数据循环流动,构建合理的“数据退役机制”,全面提升数据存储自身净化及新陈代谢能力,强化数据资源有效聚合和资源集约使用,打造良好数据存储生态,数据存储时限的研究与管理将是无法绕过的重要命题。
1.1 关乎数据潜在价值的持续发挥
大数据时代,数据已上升为国家战略,各国都在逐步重视数据的采集、存储、保护和应用,数据已成为推动数字经济发展和数字社会转型的重要动因。不论政府治理还是商业的发展都可以通过对存量数据进行分析来找出不同事物、不同主体之间的因果联系,于细微之处洞察先机,提升决策的精确性和科学性,而并不是依赖于数据的随机采样。然而,不论是数据的分析还是数据的挖掘都需依赖数据的存储与积淀,频繁的数据采集和数据的增量存储致使数据体量会越来越大,数据分析时可提供的样本就会越来越多,可分析的维度就会越来越广,不同应用、不同场景下所释放的价值也会有所不同。但随着时间、应用场景和应用方式的改变,各部分数据的访问频次和访问需求都不尽相同,所展现出的价值也相差较大。数据存储时间的界定既要让这些高价值和低价值的数据充分释放其潜在价值,又要充分考虑高价值数据、低价值数据和零价值数据在不同条件下相互转换的可能。因此,数据存储时间的长短将直接关乎着数据潜在价值的发挥。
1.2 关乎数据存储经济成本
随着社会经济的发展和时间的推移势必将促使数据生产速度的大幅跃升。个人数据、公共数据、社会数据的采集和存储正在呈几何方式增长。由于各行各业数据属性和特征各异,难以对数据存储的时间形成统一的规定,导致数据的采集、传输、存储、分析和销毁很难形成有效闭环,数据存储内容无法做到“新陈代谢”,数据存储数量只增不减,数据存储方式只进不出,这将意味着需要更多的存储介质和存储空间来容纳海量数据。物理存储介质和存储空间的增加同时也导致存储成本的线性增长,根据主流云服务商提供的高效云硬盘块存储服务收费限价1 GB每月0.95元计算[2],每年1 PB数据存储成本最高将达1200万人民币,而根据国际数据公司(IDC)预测,至2025 年,全球数据量将达到 163 ZB[3],而我国数据总量预计将跃居世界第一,全球占比有望达到27%以上。因此,数据量井喷式增长,将直接导致存储的经济成本线性递增。
1.3 增加了数据安全管理的难度
数据安全,即通过管理和技术措施确保数据有效使用和合规保护的状态。数据采集来源多样,成分复杂,全部集中存储,这些数据融合起来后可产生新的敏感信息,不法分子可以利用这些信息来进行身份窃取、保险欺诈和税务欺诈等违法犯罪行为[4]。在存储方面,要防止各种网络攻击,以免造成数据损毁和泄露;在数据管理方面,要做好数据分级分类和脱敏加密处理,建立数据安全索引;在数据使用方面,要做好数据出库后的全流程监控管理,确保数据使用安全。因此,数据安全关乎国家安全,数据体量越大,数据安全管理的难度越大,合理的数据存储期限管理将有利于降低数据安全管理的难度。
1.4 有利于健全数据存储生态
目前、数据存储作为大数据生态建设中的重要环节,是一切大数据处理、分析、开发、应用的基础。从物理介质上看,数据存储依赖于硬盘、U盘、磁带、光盘、存储卡等设备;从数据获取的角度考虑,可以分云存储、本地存储、网络存储。存储机制也在跟随应用场景的改变不断进行升级和创新,国内外各种存储产品也如雨后春笋,竞相发展,存储技术正加速迭代和更新。数据存储时限的研究将弥补数据生态建设在这一块的空白,促进数据存储生态建设健康发展。
1.5 数据生存周期管理的必要求
数据生存周期包含数据需求、数据的设计与开发、数据运维、数据退役4部分。其中,数据退役是对历史数据的管理,根据法律法规、业务、技术等方面的需求对历史数据的保留和销毁,执行历史数据的归档、迁移和销毁工作,确保组织对历史数据的管理符合外部监管机构和内部业务用户的需求,而非仅满足信息技术的需求[5]。因此,数据存储时间的设定有利于建立合理的数据退役机制,数据存储“有进有出”“有增有减”,如此数据生命周期管理才能真正落实,形成有效闭环,不断催生新的创新应用,促使数据产出优化升级,提升数据的附加值。
2 政务数据存储时限法律规范分析
2.1 国内法律规范分析
从国家层面法律规范分析,目前对个人信息存储有原则性规定,对日志数据、交易数据、个人不良信息等有存储期限规定,但仍有很多数据存储时限无明确规定,且存在行业规定各不相同的问题。对数据存储时限有具体要求的行业,其行业数据存储一般分为永久性存储或定期存储,其中定期存储时限多为规定最短存储时限(即不少于某个时限),且不同行业的数据固定存储时限差异较大、无共性要求可遵循。例如,《网络安全法》规定网络日志留存不少于6个月;《电子商务法》规定商品和服务信息、交易信息保存不少于3年;国务院《征信管理条例》规定个人不良信息保存为5年;《网络预约出租汽车监管信息交互平台运行管理办法》规定运营数据保存时间不少于6个月;《中华人民共和国反恐怖主义法》《公安视频图像信息应用系统 第3部分:数据库技术要求(GA/T1400.3-2017)》仅公共安全视频图像,采集保存期限从反恐、日常监管等不同使用需求就存在30日、90日和6个月等作了不同要求。
从地方法律规范看,大多数省市均未对数据存储时间进行明确或纳入规划进行考虑,部分省市在出台的地方性法规政府规章中略有设计,如《贵阳市政务数据资源管理办法》《陕西省民政数据资源管理暂行办法》对日志记录保存时间有明确规定,上海市《上海市“一网通办”电子档案管理暂行办法》中对“一网通办”电子档案保管期限有明确规定,其他地方性法规暂未对数据存储时间进行约定。
个人信息方面,个人信息存储涉及个人隐私,我国于2020年10月正式出台《中华人民共和国个人信息保护法(草案)》,对个人信息处理、跨境传输及保护进行了相关规定。同时,我国《民法典》规定处理个人信息,应当遵循合法、正当、必要原则,不得过度处理;《网络安全法》规定网络运营者不得收集与其提供的服务无关的个人信息;国家互联网信息办公室发布的《数据安全管理办法(征求意见稿)》规定网络运营者保存个人信息不应超出收集使用规则中的保存期限,用户注销账号后应当及时删除其个人信息(经过处理无法关联到特定个人且不能复原的除外)。表1为我国数据存储实现部分法规规范分析。
2.2 国外法规规范分析
国外关于数据存储时限的法律规范多倾向于个人数据、隐私数据的存储时限,对个人信息存储有不得超出数据处理目的进行采集和存储时间最小化等要求。例如,欧盟《通用数据保护条例》(GDPR)规定,数据控制者和处理者对于能够识别数据主体个人数据的保存时限不得超过数据处理目的的必要。新加坡《个人数据保护法令》规定,一旦保留的个人数据不再符合收集个人数据的目的,且保留对于商业或法律目的属于不必要的,机构不得继续保留包含个人数据的文档,或必须删除可将个人数据与特定个体关联到的手段。德国《联邦数据法》强调个人对数据的主导权,并规定了个人信息收集、使用、传输等多种场景下的存储规定,如数据收集时必须告知存储数据的目的;在交易中为传输目的而处理的数据,5年后检验表明无需继续存储需删除。其次,如美国《隐私权法》、日本《个人信息保护法》、韩国《个人信息保护法》、英国《数据保护法典》、法国《在个人性质数据自动处理方面保护个人的公约》、瑞典《个人数据法》、丹麦《个人数据处理法》都对个人信息存储保护有相关规定。
3 政务数据存储时限的管理措施
目前,国内外尚未建立数据存储时限的系统性管理体系,各行业对于数据存储时限要求复杂、差异性大,建议从以下几个方面着手对政务数据存储时限进行管理。
3.1 统一指导,整体规划
国家出台相关政务数据存储时限管理指导性意见,依据各部委采集、存储的数据特征,从数据存储管理角度出发,本着需求导向、资源节约、规范管理原则,按照数据存储时间最小化、存储资源节约化、存储策略规范化的总体要求,出台指导意见,有序推进政务数据存储管理工作。各省(市)依据国家出台的相关指导意见结合地方实际,制定地方性数据存储时间相关指南,指导地方各部门各行业开展具体的数据存储相关工作,指南的编制应依托高端专业智库、行业资深专家,充分采用线上、线下相结合方式展开调研及论证,明晰数据存储时限工作推进需具备的组织保障、总体原则、规则流程、关键步骤、最终目标。指南的编制与出台将为地方政务数据存储管理添上厚重的一笔,有利于保持各地方大数据存储中心政务数据的鲜活性,节约必要的经济成本;同时,对数据存储生态建设、政务数据潜在价值挖掘、政务数据风险存储风险防控具有重要意义。
3.2 建立规范化管理体系
由于各行业数据特征各异,数据存储使用的方式方法也不尽相同。因此,行业各主管部门应统筹建立本行业的数据存储时限相关标准规范体系,如市场监管、卫生、环境、教育等部门都有法人类、卫生健康类、生态环境类、教育资源类等数据信息,这些数据存储多久、数据体量有多大、数据如何更新等只有本行业主管部门及相关企事业单位了解,各部门应积极发挥主观能动作用,在各行业及行业内细分领域积极开展数据存储时间相关规范的研究,或将数据存储时间纳入现有规范建设体系。其次,标准规范划分出个人数据和其他数据的边界。目前,国家出台《中华人民共和国个人信息保护法(草案)》规定了个人信息数据的权属,采集方式和处理规则,划分好二者边界可以有效避免标准规范与国家法律的相互矛盾,确保国家法律的威严和主体地位。第三,将数据管理存储时限与地方信息化项目审批进行关联,由地方大数据主管部门联合发展改革部门、财政部门依据地方数据存储时限相关管理指南,在信息化项目审批过程中对部门数据存储时间、存储容量、存储方式等进行审核,逐步建立完善的地方数据存储规范化管理体系。
表1 我国数据存储实现部分法规规范分析
3.3 分类管理,因“数”制宜
在个人数据存储方面,应本着合法、正当、必要原则,不得收集与履职无关的个人信息,不应超出收集使用规则中的保存期限。超出保存期限的应采取删除、脱敏等妥当措施及时处理。在业务数据存储方面,建议充分尊重各部门现行数据存储时限最短时限规定,但对超出存储时限的数据应明确转存转储时限要求。原则上,应在满足实际工作所需前提下,尽可能降低转存转储时限,并尽可能通过硬盘、光盘等存储介质对数据转存转储,有效节省数据存储空间。在公共数据存储方面,应综合考虑数据安全、数据共享、开放应用、数据要素市场培育及数字经济发展的需要,按照高可靠、可扩展、高效率、集约化、规范化的原则,对自然人、法人等唯一性的用户信息数据、地图类数据,建议以数据更新方式存储最新数据;对社保缴纳等业务办件类数据,建议按照各部门存储最短时限进行存储;对部门业务审核数据,按照各部门存储最短时限进行存储;对电子证照类数据,进行永久性存储。
4 结束语
近年来,各省市分别成立大数据局或大数据中心,统筹管理本区域内政务数据、社会数据,并完成本省市大数据资源中心的建设工作。数据的存储是一切数据处理、分析、应用的基石,数据存储时限的规定可以为数据更新、数据安全、数据应用等方面提供有力支撑,不断推进各地区数据共享开放,释放潜在数据价值,助力地区数字经济高速发展。