政府数据开放与数据利用路径研究
2021-02-16任冉冉刘新萍
任冉冉,刘新萍
(上海理工大学,上海 200093)
近年来,在大数据技术的驱动下,政府数据开放在世界范围内蓬勃发展。政府部门是重要的数据保有者,将这些数据开放出来供社会进行再利用可以带来巨大的经济效益、社会效益,也是政府大数据战略中最关键的一环。政府数据开放是培育数据要素市场、释放数据价值的重要基础,也是促进经济发展、民生改善,提高政府治理能力、政府透明度和政府公信力的重要举措。国家层面高度重视政府数据开放工作,2020年4月9日,国务院公布的政策文件《关于构建更加完善的要素市场化配置体制机制的意见》将数据列为第五类生产要素。《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》中提出要“扩大基础公共信息数据有序开放,建立国家数据统一共享开放平台。”《中国地方政府数据开放报告(2021上)》显示,截至2021年4月底,我国各省市上线的数据开放平台已达174个,报告显示,各省市数据开放平台虽日益增多,但数据利用成果依然产出不足,高价值数据开放量仍不够。[1]
虽然我国政府数据开放在政策与地方实践持续推进,但是在开放过程中依然存在大量困惑和问题。[2]政府数据开放主体不知道数据该怎样利用,能朝哪个方向利用,而数据利用主体不清楚数据的含义及数据开放主体有哪些数据可以被利用。出于对数据安全的考虑,政府数据开放主体对数据被滥用造成的后果存在担忧,极大多数高需求、高价值的数据难以开放。实践中出现了数据供需不对等、政府数据开放不足等问题,政府数据开放最初目标和现实状况之间还存在一定差距。[3]因此,如何减少数据开放主体对数据利用风险的担忧,降低数据获取的难度,满足数据利用主体的数据需求,促进我国政府数据开放中高价值数据的开放,充分释放政府数据开放的价值,是值得深思与研究的问题。
一、文献综述:政府数据开放利用现状梳理
政府数据开放是释放数据价值的前提,数据开放本身并不是目的,数据价值获得的完成还需要经过数据利用,使政府数据被利用起来并创造出社会和经济价值才更有意义。[4]政府数据开放的宗旨就是鼓励社会创新应用,只有数据利用主体对开放数据进行创新利用,由一个概念上升到实际的方式方法进行实践,才能实现开放数据的价值创造与新的治理效果。[5]
在学界,研究人员也对政府数据开放利用进行了不同角度的研究。温祖卿和郑磊选取我国82个城市政府数据开放情况作为研究样本,主要观察其数据利用的产出并得出我国政府开放数据的利用产出水平仍然不高的结论,根本原因也不是数据利用者能力不足或者没有数据需求,而是数据供给不足。[6]汤志伟、郭雨晖从用户类型、数据利用的方式、环境、效果等不同视角出发,采用文献分析法研究我国政府数据开放的利用环节,发现目前我国相关文献比较稀缺,政府开放数据利用的深层关系还有待挖掘。[5]杨正、田进采用政策文献计量方法,从行政层级、政策外部结构和内部主题特征三个维度来构建的分析框架,对我国政府数据开放利用的政策体系进行探讨和研究。[7]王晶和王卫等根据价值模型,采用吸收能力理论对数据价值释放中用户的影响进行阐释,构建政府数据价值实现的理论框架。[8]范佳佳通过文献调研,选择“全评价”理论框架中的评估方法,对政府数据开放利用效率从三个维度,包括数据利用深度、广度以及影响力来评估,提出从应用场景、多方参与、人才建设、宣传推广、政策这五个方面来提高我国的政府开放数据利用效率。[9]段尧清等主要研究了对开放数据的关注程度和实际利用的程度之间是否有线性关系。[10]迪莉娅的研究视角是政府主体,通过构建成熟度模型对政府数据开放的成熟度进行研究与分析。[11]周文泓等采用案例分析法从开发主体和开发方式两个方面,调查和解析了国外政府开放数据,并提出了我过政府数据开放利用的针对性优化策略。[12]
总而言之,研究机构和学者从数据利用、数据价值实现、数据开放成熟度等多角度以定量或定性的方法对政府开放利用开展了研究,来探索高效开展政府开放数据的利用途径。“数据开放——数据利用——数据价值实现”是一个动态的系统,数据开放主体与数据利用主体两者之间的动态互动关系对政府数据开放的价值实现过程决定作用。[13]
我国的数据开放水平仍然处于初级阶段,面临着深入推行存在难点、开放层次深度不够、各地区发展不平衡、开放数据法律依据不足等问题。[14]王法硕和王翔在研究数据开放利用及实现路径研究中,基于扎根理论的质性研究构建开放利用的影响因素模型,指出政企战略合作是开放政府数据利用的有效行动策略。[15]数据开放主体和数据利用主体进行合作是较为安全可行的政府数据开放利用模式,是实现资源互补,促进政府开放数据增值的最佳方式。
本文从政府数据开放许可协议入手,以上海市为例介绍平台通用协议与普惠金融场景授权协议,讨论场景式政府数据开放路径,并提出构建“一对一”数据开放许可模式来促进政府数据开放与数据利用。
二、研究方法
(一)案例研究法
本文选取上海市作为案例进行研究,着重介绍上海市探索的普惠金融场景应用数据开放。在数据开放的政策要求、目标与理念上,对数据利用的要求与扶持上,上海市都表现突出。[16]我国政府数据开放实践中,上海作为先行城市对政府数据开放已经探索了多年,其政府数据开放水平在国内属于领先地位,积累了极其丰富的经验。上海市早在2011便进行相关调研,研究政府数据开放的可行性,并于2012年上线了国内首个政府数据开放平台“上海政府数据服务网(www.datashanghai.gov.cn)”。为了鼓励社会对开放数据增值开发与创新利用,释放数据能量,让数据造福社会,举办了SODA大赛。截至2021年8月底,上海市政府数据开放平台开放数据项近五万,开放一亿多条数据,数据资源涵盖经济建设、民生服务、城市建设等12大领域。上海市政府数据开放平台开放数据量大、数据主题多样化、数据来源部门多元化、数据浏览量和下载量较多,具有较强的代表性。
(二)数据采集
本文数据主要来源于上海市政府数据开放平台(https: //data.sh.gov.cn/index.html)的公开资料与深度访谈所得资料。首先,通过登录注册上海市政府数据开放平台来获取不同类型数据开放条件、数据开放平台通用协议内容等。其次,为深入了解普惠金融场景应用数据开放模式和实践成效,通过对6家银行与8家企业进行深度访谈获取访谈资料。访谈对象主要是金融机构和企业负责数据利用的业务部门工作人员。访谈时长一般为1—2小时,内容主要涉及到各金融机构与企业对政府数据资源的需求、利用方式、利用现状、利用成效、对政府数据开放的期望等内容。
本文对研究数据进行深入分析,探讨有条件开放类数据场景式开放许可模式,并结合普惠金融场景应用提出”一对一“数据开放许可模式。
三、政府数据开放通用协议与场景协议比较分析——以上海市为例
政府数据开放中,数据开放主体一般按照分类分级的规则进行数据开放。一般来说,分类分级规则是指将数据按照其敏感程度确定数据类型,将数据分为非开放类、无条件开放以及有条件开放类数据三种类别。当前,政府数据开放中,一般是通过政府数据开放许可协议的方式来实现的。政府数据开放许可协议是从安全角度出发,将数据开放主体和数据利用主体之间的权利义务关系以签订契约的方式进行规定,从而保障数据不被滥用,防范数据利用风险的发生。作为数据开放中的重要元素,政府数据开放许可协议在保障数据可被自由免费利用、传播中具有重要作用,对政府数据开放深入推进中数据许可协议商业模式的发展也具有一定的意义。[17]平台通用协议主要针对无条件开放数据,用户同意平台协议规定是数据获取的基础。有条件开放类数据获取在此基础上还需要采取申请的方式才能获得数据,具有较多的限制与要求,数据获取比较困难,可利用程度不高。上海市探索的普惠金融场景应用许可模式在有条件数据开放中起到了重要的作用。
(一)上海市政府数据开放平台通用协议
使用协议或者网站声明向数据使用者告知数据的免费性、自由使用数据的权利和数据的自由传播与分享,是各个地方政府数据开放平台都会采取的授权方式。上海市政府数据开放平台通用协议《使用条款》说明主要由网站服务内容、授权声明、接受条款、收费政策、免责声明、网站保护等几部分内容构成。
在开放数据的免费性、自由使用权利、数据自由传播与分享上,上海市数据开放平台通用协议中规定只有在此平台上“成功注册并完成认证”的用户,才能免费获取平台上现有的无条件开放类数据。对于有条件类开放数据,要进行申请,依特定条件来享有免费获取利用数据的权利,平台保留部分数据加工产品收费访问及收费获取的权利。除此之外,要求用户清楚说明成果中数据的来源渠道以及下载日期,对所作数据分析都要清楚表明是个人或公司的行为,不允许用户转让数据资源获取利益。
由上述可知,政府数据开放的开放数据平台通用协议是一种一般性协议,类似于法律告知,是用户在使用平台时或进行数据下载时必须要同意的,规定了用户的权利和禁止性行为。在此协议下政府数据开放主体与数据使用主体达成一致,可以任意下载无条件开放类数据。但针对有条件开放类数据,目前的政府数据开放主要采用申请制,还存在较多的数据利用限制与要求的问题,数据获取比较困难。政府数据开放中只有开放出更多的高价值数据,才能更好的满足数据利用主体的需求,数据开放主体与数据利用主体双方共同创造的经济与社会效益才能越大。
(二)上海市普惠金融场景数据开放
普惠金融场景应用数据开放是由政府主导、多方协作进行的,涉及到政府、银行、企业三大利益主体。普惠金融场景构建的优点在于可将数据开放主体与数据利用主体置于同一场景内,交流协作,解决数据开放主体与数据利用主体之间信息不对称的问题,在一定程度上可以避免政府由于交流沟通不足、缺乏信任导致的政府数据开放量不足、高价值数据难以开放的问题。政府可以先选择其信任或者在白名单中的银行进行合作,根据效果进行安全评估并进行扩大试点银行范围。
1.普惠金融场景应用背景介绍
上海市大数据普惠金融场景应用是上海市首个政府数据开放示范应用。早在2018年初,上海市银保监局在调研后梳理并提出了缓解银企信息不对称的13大类,78大项信息需求,共涉及14个政府业务部门与公用事业单位。2018年4月,为了打破“信息孤岛”,上海市人民政府成立了上海市大数据中心。在数据资源共享体系构建完成的基础上,首批普惠金融场景应用试点数据开放开始了,选定了对银行来说需求较为迫切的8家部门数据,作为上海市政府数据开放的首个行业应用。8家业务部门免费为银行提供了300多个与普惠金融相关度较高数据字段,首次向商业银行开放。
2019年,国内首部关于政府数据开放的地方性规章《上海市公共数据开放暂行办法》出台后,按照上海“五个中心”“四大品牌”建设和高质量发展的总体要求,为帮助受到疫情冲击的中小微企业和民营企业融资,上海市政府多个部门与相关单位,针对上海市中小微企业融资的痛点、堵点、难点问题,启动上海市大数据普惠金融试点应用建设工作。
2.普惠金融场景应用授权协议
普惠金融场景中数据开放利用过程中涉及政府部门、银行业金融机构和企业三方面利益相关者,通过信任机制作用下签订普惠金融场景应用授权协议,银行在全面了解企业的经营情况后对企业的诚信度、还款能力做出准确判断,从而做出贷款决定,有效推动了银行金融业领域的可预期和不可预期价值的实现,释放数据价值,普惠金融场景价值实现过程如图1所示。
图1 普惠金融场景价值实现过程
2019年,上海市大数据普惠金融场景应用试点上线运行,首批选定了4家试点银行与上海市大数据中心签署《上海市公共数据开放普惠金融应用数据利用协议》,并基于开放的公共数据开发专项产品。上海银行业金融机构通过加强整合工商、司法、人行征信及行内外各项风险大数据,与上海市大数据中心、上海市银税互动平台等机构实现数据的在线交互机制,不断完善普惠金融线上产品,优化风控体系,增强普惠金融应用的服务能力。上海市已推出的电子政务云与市公共数据开放平台在经企业授权后向银行开放与企业的经营情况密切相关的公共数据,银行在获得这些数据后可以运用大数据技术、人工智能等科技手段,快速对企业“精准画像”,以提高贷款审批的效率,对中小微企业中诚信经营的公司可给予相对更多优惠利率的贷款。当企业第一次申请贷款或者办理续借贷款等相关业务时,银行可以向企业提供一份《企业公共数据查询、使用授权书》,企业填写完成后,银行经授权便可查询公共数据了解企业相关信息。
平台会结合银行实际需求,在融资应用功能定位设计方面,一是建立信息数据质量约束标准。根据银行提升授信审批效率、创新信贷产品、优化风控模型需求,对来自不同部门的信息,形成质量约束标准,以便建设标准化数据接口;二是实现实时采集和定期推送。在获得企业授权后,银行通过平台提出查询请求,平台可提供一定时期内的企业数据,对已获得贷款企业,根据贷后管理需要,平台按一定频次将信息推送至对应银行,期限与银行信贷期限相匹配;三是确保数据安全。为推动银行更有效、安全地利用信息数据,上海银保监局牵头起草了企业授权书模板和数据利用签约协议。对数据的获取和使用明确约束,保障客户和公共数据安全,贷款到期后,银行要按协议要求于30个工作日内销毁授权客户除信贷档案以外的公共数据。
3.分批分阶段签订协议开放
普惠金融场景应用数据是上海市人民政府办公厅提供的有条件开放类数据。主要通过向银行开放所需数据,支持银行业务流程优化,从而加大对中小微企业的信贷投放,为中小微企业应对疫情的影响助力。普惠金融场景应用采取的方法是分批分阶段与试点机构签订授权协议进行开放。
2019年12月23日,上海市公共数据普惠金融试点应用一期上线,上海市政府选定了首批4家试点银行签约合作。 随后各相关部门与银行通力合作,启动了第二轮普惠金融应用,在2020年2月28日,上海市大数据中心与包括中国银行上海分行、平安银行上海分行、泰隆银行上海分行等14家试点银行签约上线。2021年5月19日,上海市大数据普惠金融场景应用启动2.0版本,新增签约上线试点银行9家,此外还与3家金融市场签约,并首次与3家保险机构签约合作。至此,上海市普惠金融场景应用中合作的金融机构试点参与数已达33家。
4.普惠金融场景应用数据开放成效
首批4家试点银行利用开放的相关数据项创新开发了一系列信贷产品,包括“沪惠贷”“数据e贷”“浦发数聚贷”“沪信优贷”等。与传统金融产品相比,这些产品具有明显的优势,方便快捷,大大提高贷款效率,第一批试点银行成功为400多户中小微企业提供了金融服务。第二批试点开始后,两批共18家银行在相关数据调用次数、服务企业数上再创新高,为企业提供了超700万亿贷款的数据支撑。2.0版本的普惠金融场景应用还增加了涉农管理、民政管理等政府数据向金融机构开放。上海市普惠金融场景应用模式的创新,审批流程与审批方式的优化,使得中小微企业金融服务的可获得性与便利程度持续提高。
四、结论与建议
虽然政府数据是在政府部门的业务管理过程中产生的,但归根到底是取之于民,与公众息息相关,数据取之于民也该用之于民,应在各个行业领域中被创新应用并实现其价值。尽管政府数据开放是大势所趋,但由于受制于现有法规政策、管理体制机制与技术等因素,目前在具体实践中障碍重重,推进的不尽如意。[18]原因在于数据开放是对政府部门传统封闭组织文化的挑战,对数据开放主体来说要承担不可预知的风险,付出更多的人力、物力和财力,因此,政府数据开放主体普遍持有的态度是尽量少开放,甚至不开放数据,这种态度对政府数据开放的价值实现产生严重的不利影响。[8]
(一)场景式数据开放模式
在政府数开放中,数据开放主体对利用方向与利用方式不甚了解从而引发担忧,数据利用主体则对数据含义与可利用数据有哪些也不清楚从而限制了数据利用效果,因此,上海市探索的普惠金融场景式数据开放的方法具有一定的借鉴意义,普惠金融场景应用是将数据开放主体与利用主体共同置于一个场景中,一起讨论政府数据的含义、利用方式,许可协议签订等。普惠金融场景应用取得了良好的成绩,如果能够在社会的各个领域进行推广,如社会保障、卫生健康、智慧生活、环境监测与发布、三农服务等,其释放的公共价值是不可估量的。
(二)“一对一”数据开放许可模式
鉴于此,结合普惠金融场景应用数据开放模式,针对有条件数据开放,可构建基于信任的“一对一”数据开放许可模式。各主体之间的信任关系对政府数据开放具有巨大的影响,“一对一”数据开放许可模式本质是构建并管理政府数据开放主体与数据利用主体之间的信任关系。在该模式下,当数据利用主体通过数据开放平台初次提出有条件开放数据申请时,首先提交企业或个人的专业评估报告信用报告等,数据开放主体根据一定的评价标准对该数据利用主体进行评估,与其签订“一对一”定制许可协议,由此得到系统信任。数据利用过程中,数据开放主体可根据声誉机制与系统信任的共同作用,以及数据利用的追踪与反馈情况来衡量对此数据利用主体的综合信任程度。将数据利用主体的综合信任度、合作历史信息进行量化,得到一个较为准确客观反映数据利用主体可能性行为的信任值,进而来确定是否将其纳入白名单。屏蔽掉不诚实或信誉较低的数据利用主体,将综合得分高的数据利用主体纳入白名单,在此后有特定领域数据开放的项目时,可优先考虑白名单中的企业或个人进行合作。通过“一对一”数据许可模式进行数据开放,在信任机制与声誉机制的作用下,可以有效的防范数据利用风险,也为数据开放主体选择可信度高的合作伙伴时提供便利。