APP下载

英国政府开放教育数据的实践与启示

2020-03-30苗珍珍翟军林岩李剑锋

中国教育信息化·高教职教 2020年2期
关键词:英国

苗珍珍 翟军 林岩 李剑锋

摘   要:开放教育数据是保障教育公平和促进终身学习的重要举措之一。英国政府的开放教育数据实践走在了世界的前列,对我国实施《教育信息化2.0行动计划》具有借鉴意义。文章采用网络调查和文献分析方法,介绍了英国政府开放教育数据的情况,包括概念界定、类型分布和典型应用等。结果表明,英国的开放教育数据应用已经相当深入和广泛,并取得了实际效果。我国在开放范围、数据标准和开发利用等方面存在较大差距,应参考和借鉴国际先进经验和做法。

关键词:开放政府数据;开放教育数据;英国

中图分类号:D630 文献标志码:A 文章编号:1673-8454(2020)03-0013-06

一、引言

來自政府的教育数据,作为一类高价值数据资源,一直是各国政府开放数据的重点领域[1]。在美国,由教育部实施的“教育数据计划”(Education Data Initiative)是白宫领导的“开放数据计划”(Open Data Initiatives)有机组成部分,于2012年1月推出了开放教育数据(Open Education Data,OED)的专门社区(education.data.gov)[2]。

致力于开放数据世界引领者的英国,也于2012年6月出台《教育部开放数据战略》[3],并承诺:①开放“全国学生数据库”(National Pupil Database,NPD)等重要的数据集;②采用开放数据标准(open data standards)和五星质量模型(five stars data quality scheme)发布数据,持续提升数据质量;③建立完善的用户反馈机制;④培育教育创新产品的应用市场等。在最新的第五版(2018版)“开放数据晴雨表”(Open Data Barometer,ODB)上,英国继续领跑全球(总分76),在教育数据集(主要是初等和中等教育绩效数据)上的得分是95(满分100)[4],而我国的总分是31,教育数据的评价分数是50,不仅落后于发达国家,也落后于我国的统计数据集(80分)和公共合同数据集(65分)。

我国学者密切关注英国开放政府数据的发展情况,开展了其政策、元数据、交通数据、国家信息基础设施、目录聚合机制等的研究[5-9],但还未有对英国开放教育数据的研究。本文则聚焦于开放教育数据,总结英国的成功经验和做法,以期为我国在推进教育“互联网+政务服务”背景下,实施教育政务数据的共享开放提供借鉴和参考。

二、相关概念

2004年在英国成立的非营利性机构“开放知识国际”(Open Knowledge International,OKI)专注于在数字时代推进各种形式的开放数据和开放内容——无论是政府数据、科学研究数据,还是公共领域的文化内容等[10]。OKI旗下的“开放教育工作组”(Open Education Working Group,OEWG)在线出版了《开放教育手册》[11],给出“开放教育数据”的两层含义:以教育为目的的所有开放数据,也是“开放教育资源”(Open Educational Resources,OER)的一种;或者来自教育机构和教育实践的数据,可被任何人免费使用,有助于提升工作效率和学生决策等。

OEWG将狭义的教育数据分成五类[12]:学生数据、课程数据、用户生成的数据、政府数据与机构数据,如表1所示。广义的OED还包括出版物和文献资料库(如ACM、DBLP、OpenLibrary)、知识库(如Wikidata、DBpedia、Freebase)等。

为实现系统间的互操作、数据集成和知识共享,一些OED采用了关联数据技术,成为“教育关联数据”(Educational Linked Data,ELD)[13],如University Linked Data、 OER Linked Data等,日益成为快速发展的“数据万维网”(Web of Data)的一部分。

三、英国教育开放数据的建设情况

1.“Data.Gov.UK”上的教育数据

截至2019年8月,英国国家开放数据平台“Data.Gov.UK”上共发布4.8万多个数据集,设置“商业与经济”“环境”“交通”“国防”“社会”和“教育”等12个主题。其中,教育主题下的数据集1171个,分别来自教育部、国家统计局和威尔士政府等近百个中央政府机构或地方政府。

“Data.Gov.UK”上并没有二级主题分类。参照表1。本文对1171个数据集进行分类,在五个子类中,机构数据最多,占比34%;课程数据次之,占比29%;其次是学生数据(18%)、政府数据(11%);用户生成数据最少,占比(8%)。各类中的典型数据集如表2所示。

这些数据集中的数据资源以各种文件格式存在,居于前三位的是HTML、CSV和XLS,如图1所示。其中,CSV、XLS、XML、KML、JSON和RDF等都是机器可读的格式,从技术上保障了数据的开放性。来自大英图书馆的英国国家书目(British National Bibliography,BNB)数据集(www.bl.uk/bibliographic/datafree.html)是教育主题下唯一的五星级关联开放数据,包含约400万条数据记录,不仅提供了RDF/XML和TURTLE两种格式的文件供下载,还提供了SPARQL编辑器和查询端口。

“Data.Gov.UK”平台的元数据项“Licence”给出了数据集的开放许可,从法律上保障了公众对数据的使用权[14-15]。采用的许可有国际上较为流行的CC0许可(Creative Commons Zero)、知识共享许可(Creative Commons,CC)下的CC-BY许可(Creative Commons Attribution)和CC-BY-NC许可(Attribution-Non Commercial)等[16-17]。更多的(890个数据集,占76%)则是英国国家档案馆根据本国情况,以CC许可为基础建立的“开放政府许可”(Open Government Licence,OGL),目前已经发展到3.0版本。此外,191个(占比16.3%)数据集处于“未发布”或“已发布未开放”状态,平台将其开放许可信息设置为“未指定许可”。

可见,英国政府开放数据的发展与开放数据领导者——开放知识基金会(Open Knowledge Foundation)所提出的“开放数据应当从技术支持、法律保障两个层面出发”[18]要求相契合。

2.教育部的开放数据

据统计,教育部及其下属机构在“Data.Gov.UK”平台上共发布548个数据集,无疑是开放教育数据的最主要提供者。英国教育部属于内阁部门,其下有教育标准局(Ofsted)、资格认证和考试管理办公室(Ofqual)、学生办公室(Office for Students)等19个机构。在开放数据上,教育部负责监督各下属机构的工作进展情况,承担数据的汇总、审核和许可等职责。

除了“Data.Gov.UK”,英国政府的公共发布平台(www.gov.uk/government/publications)是中央政府机构开放数据的另一个重要渠道。依据信息自由法,公共发布平台上的数据被称为“透明数据”(transparency data)[19]。截至2019年8月,教育部及其下属机构共发布透明数据集414个,分为五类:①教育、技能数据;②政府数据;③与儿童相关的数据;④健康、社会保障数据;⑤机构数据。

教育部(含下属机构)在两个平台上共发布962个数据集,其中有106个同源,即重复发布。对比发现,公共发布平台上数据的时效性和完整性要好于“Data.Gov.UK”平台。以“School Capacity”(学校容量)数据集为例,两个平台上的主要元数据对比如表3所示,其中三个元数据项一致、五个不一致。

去除重复,两个平台中的856个数据集分属“教育”“社会”“政府支出”“商业与经济”“健康”和“交通”等10个主题,如图2所示。其中,“教育”主题下的数据集最多,为651个,占比76%。根据OEWG的观点,这些非教育主题下的数据,由于来自教育机构,也属于“开放教育数据”的范畴。

四、教育数据应用

《英国教育部开放数据战略》重视培育数据的应用市场[3]。目前,已有许多建立在教育数据集上的应用案例,如表4所示。这些应用大多与“学校选择”相关,主要目的是帮助学生基于学校的位置、课程和学习方向等信息选择就读学校,有利于所有受教育者平等地获取最佳教育资源。

1.LSA——伦敦学校地图

为解决伦敦教育资源分配不均的问题,大伦敦当局于2013年开发了“伦敦学校地图”(London Schools Atlas,LSA),并成为市长计划(Mayor's programme)的一部分。

LSA是一个依托“Locrating”定位工具,结合学校数据、区域数据和通勤时间数据等建立的开放式地图服务。此外,LSA还用到了泛伦敦地区学校的需求预测数据(Pan-London School Place Demand data)、教育被剥夺指数(DCLG Indices of Deprivation)和伦敦各区分类数据(London Output Area Classification),这些数据可在伦敦开放数据网站和“Data.Gov.UK”上获取。

2.Unistats——高等教育课程比较网站

Unistats(unistats.ac.uk)是英国高等教育课程比较的官方网站,由教育部学生办公室、威尔士高等教育资助委员会、苏格兰拨款委员会和北爱尔兰就业与学习司共同资助建立,旨在为学生在选择大学和学习方向时提供公正、可靠的参考信息[20]。

英国高等教育的八个部门联合开发了Unistats数据集,它由一个“kis[文件更新时间].xml”主文件和若干个csv格式的实体文件组成。Unistats数据集可在数据托管平台或“Data.Gov.UK”上获取。此外,该网站提供了API(应用程序编程接口),允许用户把数据实时嵌入到第三方应用中。

Unistats提供本科(包括全日制与非全日制)阶段所有课程的信息,包括学生满意度、毕业生去向与薪资水平、课程授课方式与评估结果、费用信息等。

五、对我国的启示

2018年1月,发改委等三部门印发《公共信息资源开放试点工作方案》,确定在北京、浙江和贵州等五省(市)开展“建立统一开放平台、明确开放范围和建立完善制度规范等”的试点工作,将“教育”确定为重点开放的领域之一[21]。2018年4月,教育部印发《教育信息化2.0 行动计划》(以下简称《行动计划》)[22],實施该《行动计划》被列入2019年政府工作要点[23]。《行动计划》中的“数字资源服务普及行动”包括建设数字教育资源开放共享机制;“教育治理能力优化行动” 包括推进教育“互联网+政务服务”、连接教育政务信息数据和社会宏观治理数据、分步实施教育政务数据的共享开放等。

在此背景下,可从以下三个方面借鉴英国“开放教育数据”的经验与做法。

1.扩大教育数据的开放范围

从表2可见,英国教育数据在五个子类上均有分布,说明数据开放已相当深入和广泛。根据复旦大学数字与移动治理实验室于2018年11月发布的《中国地方政府数据开放报告》[24],我国已有57个地方政府建设了开放数据网站,大部分设有教育相关的主题或领域。笔者对数据集较多的13个数据平台进行调查,包括北京、上海、广东、贵州、山东、贵阳和哈尔滨等。共辨识出教育数据集1786个,参照表1对其进行二级分类,发现我国开放出的数据集绝大部分(占88%)是“机构数据”,包括机构基础信息、通知公告、招生信息和教职工信息等;其次是“政府数据”(占7%),包括业务公开、政策文件等;而利用价值极高的“课程数据”、“用户生成数据”和“学生数据”的占比均不足5%。与英国的对比如图3所示,可见我国教育数据开放的分布很不均衡,大量数据还“深藏闺中”。下一步应努力扩大开放范围,鼓励更多的政府部门(不仅仅是教育部门)开放教育相关的数据资源。

2.建设数据标准

数据标准(data standard)是数据的命名、定义、结构和取值规范方面的规则和基准[25]。《英国教育部开放数据战略》明确指出,在开放政府数据中要采用各种数据标准[3],如合同数据标准,各部门从2016年11月起开始采用由开放合同合作组织(Open Contracting Partnership)开发的“开放合同数据标准”(Open Contracting Data Standard)[26]。

在元数据层面,“Data.Gov.UK”采用了CKAN元数据、W3C DCAT和GEMINI地理空间元数据标准。在数据模式层面,由地方政府协会联合地方电子政务标准机构、地方当局以及数据用户,开发了关键领域的数据模式标准。所有模式皆以XML格式发布在地方政府协会官方网站(schemas.opendata.esd.org.uk)上。目前,该网站发布的教育数据模式有54个。

我国《公共信息资源开放试点工作方案》的工作目标之一是制定一批数据标准规范,实现各部门、各层次的统一开放[21];《行动计划》也明确指出“以一致的方式发布数据”[22]。实践上,各类数据标准建设的滞后是形成“数据孤岛”和“数据碎片化”现象的主要原因。例如:各平台“幼儿园”数据集的元数据和数据模式在数量、名称和类型上的不一致(如表5所示),不利于应用程序跨平台获取数据并进行数据整合。因此,我国应加强数据资源的元数据标准及数据模式标准的建设、推广和应用。

3.保障数据质量,促进数据的开发利用

2018年9月,在开放数据原则被广泛接纳10周年之际,万维网基金会出版《ODB报告——领先者版》[27]。该报告指出,开放数据仍任重道远,各国应通过加强数据治理和提升数据质量,促进数据的深入应用,并在政府服务、社会创新和经济发展上产生积极影响。

由上文可知,英国基于教育开放数据培育了一批实用性较强的应用,这主要归功于其良好的数据质量。英国通过数据标准和国家信息基础设施建设,及采用五星评级模型和开放数据证书认证等手段保障数据的质量,其教育开放数据已全部达到三星级或以上水平,在ODB的评估中仅在“标识符”(Identifier)指标上丢了5分,保证了数据的可用性。

目前,我国开放教育数据的数据质量问题突出。根据ODB的评估,我国教育数据存在“不是机器可读的格式”、“缺乏开放许可和标识符”等问题。我们的研究也发现[28-29],我国的开放数据还处于“重开放、轻质量”的阶段,数据中普遍存在完整性、时效性、规范性和准确性等质量问题,教育数据也难以幸免。图4展示了北京市“社区学院”数据集的质量问题,包括数据值缺失、格式不一致等。

过时、不准确等“脏数据”的存在势必影响到数据的有效利用。对我国开放数据平台中的“数据应用”栏目进行调查发现,教育领域的应用并不多,少量的应用也基本上处于创意阶段,没有提供应用程序的网站或APP,如哈尔滨市幼儿园信息在线查询系统、济南图书馆移动阅读APP、北京市EShool等。大量的数据集与少量的应用形成极大反差,表明我国的开放教育数据还处于初级阶段,还需要持续改善数据质量、促进数据的开发利用,以及与社会生活、经济发展的深度融合。

六、结束语

联合国发布的报告认为,开放数据有助于实现联合国《2030年可持续发展议程》的目标[30]。而开放教育数据是实现教育目标(UN Sustainable Development Goals,Goal4)的措施之一,该目标是“确保面向全民的公平教育及促进终身学习”。

研究发现,我国在开放范围、数据标准和开发利用等方面存在较大差距,在实施教育政务数据的共享开放时应借鉴国际先进经验和做法。下一步将开展教育开放数据的质量评价与保障机制研究。

参考文献:

[1]翟军,李晓彤,林岩,开放数据背景下政府高价值数据研究——数据供给的视角[J].图书馆学研究,2017(22):76-84.

[2]Aneesh C and Zakiya S. Unlocking the Power of Education Data for All Americans[EB/OL].https://obamawhitehouse.archives.gov/blog/2012/01/19/unlocking-power-education-data-all-americans.

[3]DfE: open data strategies[EB/OL].https://www.gov.uk/government/collections/dfe-open-data-strategies.

[4]Open Data Barometer[EB/OL].http://opendatabarometer.org.

[5]朱貝,盛小平.英国政府开放数据政策研究[J].图书馆论坛,2016,36(3):121-126.

[6]赵蓉英,梁志森,段培培.英国政府数据开放共享的元数据标准——对Data.gov.uk的调研与启示[J].图书情报工作,2016,60(19):31-39.

[7]曾粤亮.英国政府数据开放平台交通数据的建设现状调查与分析[J].情报资料工作,2017(5):22-28.

[8]翟军,翁丹玉,袁长峰,林岩.英国政府开放数据的“国家信息基础设施”建设及启示[J].情报科学,2017(6):109-116.

[9]刘汪洋,翟军,梁艺多,程序,谢真强.英国政府开放数据的目录聚合机制及对我国的启示[J].图书馆,2019(4):53-59.

[10]Open Knowledge International[EB/OL].https://okfn.org/about/.

[11]The Open Education Working Group[EB/OL].https://education.okfn.org/.

[12]Open Education Handbook/Types of Open Data[EB/OL].https://en.wikibooks.org/wiki/Open_Education_ Handbook/Types_of_Open_Data.

[13]Pereira C K,Siqueira S ,Nunes B P ,et al. Linked data in Education: a survey and a synthesis of actual research and future challenges[J].IEEE Transactions on Learning Technologies, 2018.

[14]范佳佳.中国政府数据开放许可协议(CLOD)研究[J].中国行政管理,2019(1): 23-29.

[15]黄如花,李楠.国外政府数据开放许可协议采用情况的调查与分析[J].图书情报工作,2016,60(13):5-12.

[16]Khayyat M, Bannister F. Open data licensing: More than meets the eye[J].Information Polity, 2015, 20(4):231-252.

[17]迪莉娅.政府数据开放许可适用研究[J].图书馆,2014(6):91-93.

[18]Open Data Handbook[EB/OL].http://opendatahandbook.org/.

[19]Freedom of Information Act 2000 [EB/OL].http://www.legislation.gov.uk/ukpga/2000/36/contents.

[20]New website will help students pick the right degree course[EB/OL].https://www.gov.uk/government/news/new-website-will-help-students-pick-the-right-degree-course.

[21]中网办发文[2017]2号.中央网信办、发展改革委、工业和信息化部联合印发《公共信息资源开放试点工作方案》[Z].

[22]教技[2018]6号.教育部关于印发《教育信息化2.0行动计划》的通知[Z].

[23]教育部2019年工作要点[EB/OL].http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/s5987/201902/t20190222_ 370722.html.

[24]复旦大学数字与移动治理实验室.中国开放数据指数[EB/OL].http://ifopendata.fudan.edu.cn/report.

[25]GB/T 36344—2018.中华人民共和国国家标准:信息技术 数据质量评价指标[s].

[26]CabinetOffice.Open Government National Action Plan 2016 to 2018: mid-term self assessment[EB/OL].https://www.gov.uk/government/publications/open-government-national-action-plan-2016-to-2018-mid-term-self-assessment.

[27]World Wide Web Foundation. Open Data Barometer Leaders Edition: From Promise to Progress[EB/OL].http://opendatabarometer.org.

[28]李晓彤,翟军,郑贵福.我国地方政府开放数据的数据质量评价研究——以北京、广州和哈尔滨为例[J].情报杂志,2018,37(6):145-149.

[29]翟军,李晓彤,苗珍珍,李剑锋.我国开放政府数据“脏数据”问题研究及应对——地方政府数据平台数据质量调查与分析[J].图书馆,2019(1):42-51.

[30]Department of Economic and Social Affairs.UN E-Government Survey 2018[EB/OL].https://publicadministration.un.org/egovkb/en-us/Reports/UN-E-Government-Survey-2018.

(編辑:王晓明)

猜你喜欢

英国
英国的环保
Fancy a curry?Millions do!
When is the festival?
欧盟同意英国“脱欧”再次延期申请
Myths and legends-South Asia(Thailand)
Reading skills praCtice:A train timetable
Myths and Iegends-Europe
Writing skills practice:A social networking site
Myths and legends-Polynesia Southwest Asia(Ancient Mesopotamia-Sumer)
Myths and legends-Polynesia