日本开放数据利用模式分析及其启示
2022-03-11梅傲柯晨亮
梅傲 柯晨亮
关键词:开放数据;公共数据;数据使用者;数据治理;日本
在这个高度信息化的社会,数据的重要性不言而喻。政府作为强势的行政主体,天然拥有收集社会数据的合法性,通常收集数据作为决策的依据使用。然而在這个强调创造力的时代,政府保守的数据利用方式已无法满足当下生产力发展的要求。开放数据无疑是一个好的开始,政府开放数据与政府信息公开的差异之一便是前者强调数据的“利用与再利用、激发社会活力与社会创造力”[1],而非仅局限于后者的“对公众知情权的保护”。故本文的重心在于探讨日本开放数据的实际利用情况,结合日本开放数据制度规范的讨论,试图从“实然”角度探讨数据开放制度的发展道路。
本文以日本开放数据的实际利用情况作为研究对象,主要有以下若干原因:①日本开放数据起步较晚,相较于其他欧美国家,日本更为保守。事实上,自2011年3.11大地震后,开放数据战略才正式提上日程,但在短时间的发展之后,日本取得的成绩斐然,在最新的《开放数据晴雨表》中,日本得分68,世界排名第7,在亚洲仅次于韩国。同样,中国的开放数据起步较晚,直到2015年国务院出台《促进大数据发展行动纲要》才将政府数据开放提升到“国家战略”地位。因此,研究日本开放数据制度“后来者居上”的经验,对我国具有极大的参考价值;②日本与中国同属儒家文化圈,二者的文化具有一定相似性。同时,我国即将面临老龄化、少子化等与日本相同的社会问题,而日本数据开放的主要目的之一即为解决日本面临的生育率降低与老龄化问题[2]。通过对日本开放数据的比较研究,可以为解决我国即将面临的社会问题提供宝贵的经验;③中日两国法律体系具有一定相似性,日本为大陆法系国家,而中国的法律体系脱胎于大陆法系,故而在法律层面有更多的学习空间。
1日本开放数据相关政策与法律
以2011年日本大地震的灾后重建工作为契机,日本开始推行开放数据战略。时至今日,其仍在为开放数据大战略继续布局,积极推进。伴随着日本数据开放的全过程,日本政府于各个阶段的文件中表达其对开放数据利用的态度与规制。
需要明确的是,与我国不同,日本并不使用“政府开放数据”一词,取而代之的用语为“开放数据”(オープンデータ),其既包括政府所拥有的数据,同时也包括行政法人及非政府组织(独立行政法人、その他民間団体)所拥有的数据。在日本《开放数据基本指南》中,其对开放数据的定义为“在国家、地方政府和企业拥有的公共和私营部门数据中,以适用于以下任何一项的形式公开的数据被定义为开放数据,以便任何人都可以通过互联网等容易地使用(处理、编辑、再分发等)公共和私营部门数据。①适用于商业或非商业目的的二次使用规则的数据;②适合于机器读取的数据;③可免费使用的数据”[3]。
在有些文件中,日本政府会使用“公共数据”(公共データは)作为对“开放数据”的同义表达。为保持对日本政府公文转述的准确性,文中均使用日本政府文件中原本用语。
关于日本开放数据的政府文件,最早可以追溯到2012年7月4日IT综合战略部(IT総合戦略本部)发布的《电子政务开放数据战略》[4]。该文件开宗明义,于第一节直接说明开放数据战略的意义与目的,其中之一即为“经济活性化、行政效率化”,并于下文补充道:①希望通过市场对公共数据的二次加工,促进商业创新与企业的效率提升;②希望国家与地方政府对公共数据进行精细分析,以实现“行政效率化”。同时,在下文的具体利用原则中,也明确表达,无论是否以营利为目的,均鼓励公共数据的利用。但由于该文件的目的为启动日本“开放数据”战略,故未能具体规定公共数据利用方面的问题,仅提供了“著作权管理、利用条件、使用者与提供者责任”等方面的指导性的完善方向。
为促进公共数据开放战略的推进,IT综合战略部于2013年6月14日发布了《促进电子政务公开数据路线图》[5],该文件对上次《电子政务开放数据战略》提出的许多亟待完善的问题进行了具体的安排,尤其是在公共数据的利用方面。其中明确提出几项具体的措施以便相关主体利用开放数据,包括:“明确公共数据的使用责任与版权限制、采用适合机器阅读的数据格式、提高访问的便利性、提供API接口”。并且直接指出了发展公共数据利用的优先领域,即“白皮书、防灾减灾信息、地理空间信息、人的移动相关信息、预算结算、采购信息”。
此后,日本政府相关职能部门又陆续发布了若干与数据开放相关的政府文件,包括2016年5月20日高级信息通信网络社会推进战略本部发布的《开放数据2.0》、2016年12月14日IT综合战略部颁布的《促进公共和私营业部门数据使用的基本法》、2017年5月30日日本政府内阁制定的《世界最先进的IT国家创造宣言》。
据日本数据开放网站收录,最后一份有关开放数据的官方文件为2017年5月30日IT综合战略部发布并于2019年6月7日修订后的《开放数据基本指南》[6]。该指南完整地提供了开放数据管理与利用的规制办法。同时,该文件仍秉承日本政府对数据开放的积极态度,不仅对于开放数据的开发与利用积极倡导,而且还在文件中提到了对相关专业人才的培养规划与举办促进开放数据使用活动的建议。
从以上日本政府出台的文件来看,可以归纳总结出日本政府对于开放数据利用的态度,即:①社会本位,日本开放数据战略开启的契机即为地震灾后重建,之后日本政府对其始终秉持相同态度,保持利用开放数据服务社会的初衷,鼓励利用者以公益目的利用开放数据;②不排斥适当的商业目的使用,从日本政府对开放数据的定义就可看出,被视为“开放数据”的数据可以在商业目的下被使用,也可以免费使用。这表明日本政府希望在开放数据的利用为公众带来福祉的同时,开放数据的使用也可以激发商业创新与经济活力;③长远布局,日本政府重视开放数据战略的长远发展,早期布局,创建全国性开放数据共享数字平台,重视相关专业人才培养,同时积极举办开放数据利用的比赛与活动。
2日本开放数据利用案例评析
“徒法不能以自行”,探究日本开放数据战略的实际运行状况不应局限于政策与法律层面的讨论。下文中将以开放数据实际利用案例作为研究对象,探究日本开放数据相关政策与法律的实施效果。
2.1开放数据使用案例分类
日本国家级开放数据网站提供的开放数据使用案例,经统计共24个,其中大多均为公益用途,仅用于“防灾”的使用案例就有9个,而其他用途包括科普、环境保护等,大都具有公益性质。同时,这些数据的使用主体既包括行政主体,也包括私人企业,二者数量参半。
当然,该网站仅为公共数据使用案例的不完全统计。实际上,因日本政府对开放数据使用的包容态度,使用数据没有太高的门槛,无须过多审查与批准。结合日本政府对开放数据的定义来说,开放数据原则上是可供自由使用的,因此,即使开放数据被使用,数据公开者也无法得知数据的具体使用情况。故而日本暂时还没有一个对开放数据实际利用案例全面的统计。
日本IT战略办公室举办了一个名为“开放数据100”的活动。该活动目的是为开放数据的使用者提供案例作为参考,有意愿分享的使用者可自愿申请参加活动分享使用案例。截至2020年10月8日,该活动已经收集到80件开放数据使用案例,使用案例被分为3类,分别为私人企业使用案例、地方政府使用案例及使用开放数据的活动。该活动为使用者自愿参与,数据具有一定的广泛性与代表性,且样本数量足够,故而可以借此简略研究日本开放数据的实际使用状况。
经过统计,私人企业利用开放数据案例共34件,地方政府利用开放数据案例共44件,使用开放数据的活动案例共2件。
2.2开放数据的使用目的与方式
从这份数据中观察,在34个私人企业利用开放数据的案例中,虽然过半数仍然为公益目的而使用数据,但已经出现许多商业使用的案例。譬如GEEO公司使用开放数据以提供日本房地产价格数据。同时,一些企业对开放数据的使用方式也并非纯粹的公益化,它们同时融入了一定的商业元素,譬如ミルモ、アイネット公司提供护理所、托儿所查询与咨询服务,ZAIM公司使用公共数据来提供给使用者其医疗费用的账簿。除此之外,使用公共数据的大部分企业均有自己的APP平台,通过在软件上提供广告或其他付费服务,皆具有获得隐性商业价值的空间。
虽然“开放数据100”活动提供了数据使用者的基本资料,但并未提供使用者实际商业用途以及商业收入的结构性分析。基于以上资料判断,日本私人企业使用开放数据,具有商业利用的可能性与空间,但暂时并不能得知通过利用开放数据可以为企业带来多少实质的经济效益。
而在44件地方政府使用开放数据的案例中,按使用目的可以分為两类:
第一类以社会为服务对象使用开放数据,且基本全部属于公益目的的使用,共32件,其中掺杂着2件以服务旅游业为目的的商业使用案例。经过归纳总结,政府使用开放数据的形式主要为提供地图与实时交通信息、极端天气灾害预警、城市基础设施查找与报修。其中最为常见的使用方式为提供地图信息,譬如会津若松市使用开放数据提供全市消火栓地图、佐贺市使用开放数据提供本市WIFI地图。
第二类案例共12件,其使用目的皆为服务于行政活动,其中5例为开发开放数据使用工具,所以实际使用开放数据服务行政活动案例仅为7例。使用开放数据的主要目的有两个,一为利用开放数据减轻行政工作人员的工作负担;二为地方官员利用开放数据制定政策。而其中使用开放数据的主要模式为通过公开开放数据,而减少公民提出“信息公开”请求的数量。
使用开放数据的活动仅为2例,一个为2019国际数据开放日活动;另一个为通过使用开放数据发掘各地特色文化的活动。
2.3各类型开放数据使用比例
经过统计,有关地理信息的开放数据使用频率最高。尽管在各个使用案例中,多种开放数据被组合使用,且并未直接注明有哪些类型的数据被使用,但最保守的统计,至少35个案例使用了有关地理信息的开放数据。而其他类型的开放数据被使用频次普遍较少,经统计除有关地理信息开放数据外,其他各类型开放数据,各自最多不超过5个案例被使用。
至于被使用的开放数据的格式,同样,由于每个案例可组合使用多种格式的开放数据,且该网站提供的信息有限,所以难以精确统计各种格式开放数据被使用的数量。但仅就经过粗略统计可得知,其中CSV格式的数据占据近半数,对于其他格式数据具有压倒性优势。同时,笔者统计了日本国家级开放数据网站上提供的开放数据格式,其中PDF格式反而占据绝对数量优势,共计13512个,而CSV格式数据仅有2805个。进而排除了因提供不同的数据格式数量上的差异,从而造成的使用频次差异的可能性,也彰显了CSV格式开放数据受到使用者喜爱。CSV数据是一种简单通用的数据文件格式,被广泛用于跨程序的数据转移,这种易于被机器识别的数据受到使用者青睐更表明着,就数据格式而言,其方便易用性应该被数据提供者更多考量。
通过对以上数据的分析,可以总结出日本开放数据实际利用的几个特点:①为公益目的使用开放数据的情况占据多数,使用者大多遵从日本政府在开放数据倡导文件中的指导,以服务大众、服务社会的目的使用开放数据;②私人企业开始尝试以商业目的使用开放数据,或者在向社会提供公益服务的同时,顺带取得商业收益;③使用开放数据以达到“行政效率化”的尝试方兴未艾,地方政府使用开放数据服务于行政工作的案例不多,且使用模式较为保守、单一,其仍在探索开放数据的恰当使用模式;④最值得关注的是,在使用目的分类中,虽然已有“预防犯罪、医疗、教育等”分类,但仍单独开辟出“少子化、老龄化”一栏,且有8个案例被包含其中。该点足以体现日本政府为对抗老龄化与少子化所付出的努力。
3日本开放数据利用模式路径研究
通过对以上日本开放数据政策、法律文件及实际利用状况的分析,可以看出日本在开放数据战略的实施中已实际取得一定建树,并形成了相对较为成熟的公益与商业行政相结合的利用模式。具体而言,公益、商业、行政作为日本开放数据利用模式的“三驾马车”,共同推动日本开放数据制度的良性发展,就现状而言,公益方向的数据利用模式趋近成熟,无论是数量还是多样性表现均十分优秀,其无疑是开放数据的最大推动力,同时,商业、行政方向的数据利用已出现壮大势头。公益作为数据开放的“合法性”护身符,其重要性自不待言。而商业、行政作为数据开放的经济支撑与内在动力,二者的重要性并不亚于公益目的。按照日本模式的规划,通过政策激励等手段,经过一定时间的发展后,商业、行政方向的数据利用规模将迅速扩大,三者所占份额差距将快速减小,以实现开放数据制度可持续发展的目标。探讨日本开放数据战略从纸面到现实的实现路径,可以看到其在政策制定、双向互动、商业化尝试上的亮点。
3.1日本政府的政策驱动奠定良好基础
21世纪初,日本信息技术的高速发展在结构上被动式驱动开放数据制度的发展,并为接下来日本政府的能动整合提供了良好的基础[7]。而日本政府于第二个十年以主动积极的态度推进开放数据战略的实施,且提供大量的政策与法律的支持,从而促进了成熟开放数据利用模式的形成。
首先,日本政府为开放数据的使用提供了巨大的空间,从其对开放数据的定义来看,不但不限制开放数据为使用目的,且不对开放数据使用的前置过程设限,无须经过其他繁琐的行政审批或批准程序;其次,日本政府鼓励数据的多样化使用,从最初的《电子数据开放战略》到最新的《开放数据基本指南》,日本政府对于开放数据的使用目的一直保持着兼容并蓄的态度。“经济活性化、行政效率化、信息透明化”三大目标为日本政府始终强调,并向使用者提供相应的使用指导;最后,日本政府有意通过使用开放数据缓解老龄化与少子化问题,在法律文件与政策文件中多次强调该点。而数据使用者的确回应政策呼吁,于该领域深度耕耘,颇有成果。
3.2使用者与开放者双向互动构建成熟使用模式
虽然日本数据开放战略是由政府大力推动的,但其并非纯粹的单方发力式行为,日本政府希望积极地与数据使用者展开双向互动,从而弥补因自身视角局限性而可能造成的施政方向错误。首先,数据开放者主动向数据使用者提供使用指导,通过举办数据应用比赛、数据利用案例分享的方式,培养数据使用者的利用能力,开拓使用者的研发思路,进而显著提升数据应用效率;其次,数据使用者拥有机会参与开放数据相关政策的决议,譬如IT战略综合部下辖的数据行政开放调查机关就会定期邀请开放数据的使用者参加会议,在与数据使用者交流沟通的同时,给予数据使用者机会,参与有关开放数据的政策制定,从而使政府更加客观、周全地制定有关开放数据的法律与政策。
3.3开放数据商业化使用的尝试打开可持续发展的前景
日本开启开放数据战略以帮助社会治理为初衷,但若要谋求该战略的长远发展,绝不能仅凭承担社会责任的企业的无私付出。以合适的形式,开启开放数据的商业化利用模式,并非玷污开放数据的公益基因,反而是帮助开放数据战略走得更长远的必经之路[8]。首先,企业普遍制作使用开放数据的APP,从而在提升数据易用性、可视化的同时,也为企业带来了通过广告、推广等方式以获取商业利益的潜在空间。此外,企业开始进行纯粹商业化利用数据尝试。虽然纯粹的商业利用不会带来直接的社会效益,但通過加强经济创新的尝试,可以开拓空白市场、增加就业岗位,从全局看,商业化使用开放数据在获得经济利益的同时,也一样会对社会产生一定的积极效应。
4日本开放数据模式对我国的启示
客观地说,我国开放数据水平较日本仍有一定差距,在《开放数据晴雨表》中我国得分仅为31,不足日本的一半。具体来说,我国开放数据战略开启时间较短,相关的政策与法律不够完善,无法给予相关行政主体明确、有效的指导。同时,缺少国家级数据开放平台的支持,导致数据分级分类的混乱与授权协议的模糊。除此之外,政府向数据利用者提供的使用指导不足也导致开放数据的实际利用效率难以有效提高。通过对日本模式的研究与分析,结合当下中国开放数据战略实施的现实困境与相关社会文化背景,可以得到如下的启示。
4.1政府制定具有针对性、执行性的法律与政策
为促进开放数据战略的实施,日本政府制定了一系列的法律与政策。从最初的《电子政务开放数据战略》的高屋建瓴式原则性指导开始,后续的法律文件与政策文件的具体性、可执行性逐步提升。在最新版本的《开放数据基本指南》中,虽仍有部分原则性指导内容,但基本半数以上条文均为具有明确性、针对性的内容。
而我国关于开放数据的法律文件和政策文件在这一点上则表现得不尽如人意。截至2020年10月,已有38个地方出台了与开放数据相关的法律法规,尽管在数量上有了巨大进步,但在法律法规的质量上仍存在较大提升空间,全国范围内的法规政策依然存在效力不高、针对性不强等问题。有的学者也将这种情况概括为“倡导性有余而规则性不足”[9]。以成渝地区开放数据政策为例,在颁布的政策中,命令型与激励型政策较多,而能力建设型与系统变化型政策相比之下数量较少,故而政策的具体可执行性较为不足[10]。就我国现状而言,开放数据政策与法律的制定通常由政府主导,只有在最后流程才会咨询外部人员[11]。因此,依笔者意见,我国开放数据战略相关的政策与法律制定应更多地听取相关从业者的声音,可以利用互联网平台,在政策与法律制定的初期,给予相关群众提出建议与意见的渠道,进而改善与提升拟定的政策与法律的针对性与实际可执行性。
4.2政府建立全国性数据开放平台
日本依照政策的指导,建立了全国性数据开放平台,同时,地方政府也建立了各自的地方级数据开放平台。除此之外,各专门行政机构、一些非政府组织也建立了自己的数据开放平台,进而形成了金字塔型的数据开放平台结构。建立一个全国性数据开放平台的优势是显而易见的,不但可以向使用者提供一个最全面的数据搜索与收集渠道,而且可以产生向各地方性平台提供指导的示范效果。
我国地方数据开放平台的建立速度之快如雨后春笋一般,已从2017年的20个增长到2020年的142个,但至今尚未建立一个全国性的数据开放平台。由于缺少全国统一性开放数据平台,导致我国当下的数据开放平台出现数据分类分级混乱的现象,进而更导致了数据授权许可协议缺失的问题出现[12]。若要真正贯彻数据开放战略的执行,建立全国性数据开放平台无疑是迫在眉睫的。建立一个全国性的数据开放平台,不但可形成我国开放数据统一元数据的标准,更能消除数据公开者与数据利用者间的信息不对称,进而为开放数据的应用提供更好的供给端支持[13]。
4.3政府明确数据利用的授权协议
日本政府对于开放数据的利用限制有十分明确的表达,其在《开放数据基本指南》中明确表示了对开放数据利用的限制。其允许任何人通过互联网以商业或非商业目的的方式使用开放数据,并且明确表示除有合理依据不允许二次利用的以外,所有开放数据均允许二次利用。且从前文实际应用案例来看,日本企业使用开放数据的多样化也实然证明了日本政策的有效实施。
而我国在这方面的表现则不尽如人意,根据复旦大学2020年发布的《中国地方政府数据开放报告(2020下半年)》显示,已有54%地方数据开放平台提供了数据开放授权协议,但部分地方平台缺少相关的规定表达[14]。即便在存在相关表达的地方中,其质量也参差不齐,大都只有单一类型的授权协议,只有四川与上海制定了多种类型的授权协议[15]。正所谓“刑不可知,则威不可测”,如果不能明确开放数据的利用规则,则会大大影响使用者的使用积极性。同时,缺少明确的相关表达不仅会挫伤使用者的积极性,因数据使用的限制、责任不明确,数据公开者也会选择不公布部分数据以减轻承担未知责任的风险[16]。承接上文,解决该问题最大的助力便是建立全国性数据开放平台,由国家层级提供数据开放相关授权协议,进而使数据公开者与利用者都摆脱悬在头上的“达摩克利斯之剑”。
4.4數据开放者明确使用者需求
从日本的使用案例不难看出,就现阶段而言,日本的数据利用者对准备选择使用的开放数据的种类和格式具有明显的权重差异。为了使开放数据更有效地被使用,以更好地达到“经济活性化、行政效率化、信息透明化”目的,数据开放者应该在一定程度上“投其所好”。若要达到此效果,则需要数据开放者与数据使用者之间的双向沟通。因此,《开放数据基本指南》第四条第2款中直接规定,政府有义务反映开放数据使用者的需求,在全面了解使用者需求的基础上,公开使用者真正需求的数据。而日本IT战略办公室举办的“开放数据100”活动就是一个很好的实例,日本政府通过该活动收集具体的开放数据使用案例,进而归纳总结现有开放数据使用情况,以实现对未来数据开放方向的战略规划。
现阶段我国缺少全国性质的开放数据平台,各地方平台处于“群龙无首”的状态,暂时无法从全局的角度对数据开放进行全局规划。同时,现阶段我国政府部门对数据利用者需求的了解意识不足,较少与公众进行互动[17]。但保持数据开放者与使用者的双向互动是促进开放数据战略良性实施的必然要求。因此,政府应该发挥其主观能动性,一方面,广泛收集用户数据使用的反馈;另一方面,打开交流窗口,给予使用者充分的沟通渠道,从而提升所提供的数据与用户需求的契合度,做到“工欲善其事,必先利其器”[18]。
4.5政府向数据使用者提供使用指导
日本在执行开放数据战略的过程中,对于开放数据具体的应用提供了许多指导措施。日本政府制定的一系列有关开放数据的文件中,一脉相承地强调了向使用者提供数据使用指导的重要性。而日本在近年来举行了多次“开放数据应用大赛”的同时,组建了多个指导开放数据使用的组织,以加强对数据使用者的指导,譬如开放数据利用促进委员会、内阁秘书处下属的开放数据工作组。同样,上文多次提到的“开放数据100”活动的举办初衷便是通过提供具体的使用案例以供预备使用者或正在使用者进行参考,该活动也是向使用者提供指导的一种方式。
但就我国而言,尽管已有41%的地方举办过综合性或行业性开放数据创新利用比赛,但各地开展利用促进活动的持续性不足,仅12%的地方能连续举办活动,对于数据使用者提供系统、全面的指导仍存在不足。我国政府应该大力加强开放数据利用比赛举办的持续性与实际有效性,同时,拓展指导方式的多样性,利用互联网平台更好地达到“授人以渔”的目的。
5结语
本文以日本开放数据制度为研究对象,出发点为中日两国具有的一定相似性,但在学习其经验时反而应该放大二者的差异性。故而在今后的相关研究中,应在充分比较分析两国社会文化背景的基础上,探讨日本经验本土化的可能性,以避免生搬硬套日本经验,从而造成其在我国“水土不服”的现象发生。
3209500338242