数字媒体领域开放数据的应用路径探析
2019-05-10杨璧菲
杨璧菲
摘 要 大数据时代,开放数据在数字媒体领域体现出极高的利用价值。文章结合具体案例,通过对国内外开放数据在数字媒体领域应用现状对比分析,发现我国基于开放数据的数字媒体应用尚未普及,且服务性不强,由此提出了开放数据在数字媒体领域的应用路径,即收集高质量可机读的开放数据集、对数据集进行整合分析、进行数据可视化呈现和交互式操作、建立基于用户的“众包”数据平台。
关键词 数字媒体;开放数据;应用路径
中图分类号 G2 文献标识码 A 文章编号 1674-6708(2019)233-0007-02
开放数据是指政府或其他组织机构向社会公布的数据,这些数据是免费提供的,并可用于任何商业或个人目的[ 1 ]。目前,国内外都进入了开放数据实践的应用阶段,尤其是在数字媒体领域,开放数据的创新性利用创造了重要的价值。本文结合具体的实践案例来分析开放数据在数字媒体领域应用现状,并为我国的开放数据数字媒体实践提供应用路径和建议。
1 开放数据在数字媒体领域应用现状
基于政府开放数据建立起来的应用程序涉及民众生活的方方面面,针对不同用户需求设计,解决用户的特定问题。移动应用程序随着智能移动设备的快速发展得到了广泛应用,基于政府公开数据资源的应用程序以移动应用程序作为主体,同时也包括非移动应用程序,解决了用户生活中的实际问题、服务用户的生活、满足用户特定的信息需求,大大节省了用户检索和分析政府公开数据的时间和精力[2]。
1.1 国外开放数据在数字媒体领域的应用现状
目前国外利用开放数据创建的数字媒体应用程序数量很大,类别多样,例如地理交通、医药卫生、教育信息、社区生活、天气环境等。目前,美国利用政府开放数据开发了近400多个应用程序。根据美国政府开放数据网站(Data.gov)显示,所提供的应用程序类别有政务信息、金融经济、交通出行、地图定位、医药健康、教育信息和社区生活等几大类。以应用程序“Raids Online”为例,该应用程序是基于地方警署的开放数据建立起来的,对公众和执法部门免费开放并对违法犯罪活动进行自动标记以提醒用户注意个人安全。用户可以在交互式地图和分析仪表盘上查看和过滤犯罪类别、行为、时间、地点等犯罪数据,了解所在地的犯罪活动。同时,用户还可以通过该应用程序,向当地执法部门发送社区犯罪活动报告或紧急报警,以帮助减少违法犯罪行为的发生[ 3 ]。以“Raids Online”为代表的这类应用程序特点包括:基于政府的开放地理信息数据,或与其他相關数据开发相结合,免费为用户提供特定领域的信息服务。
1.2 国内开放数据在数字媒体领域的应用现状
与国外相比,目前中国国家数据平台(data. stats.gov.cn)尚未提供具有服务用户功能的应用软件。但随着相关技术日趋成熟,公众对此类软件的需求不断增长,国内地方政府在该领域做了一些积极的尝试,例如北京市政务数据资源网提供的“游北京”和“爱健康”App;上海市政府开发了“中国上海”App,主要用于政府门户网站发布政府信息,缺少服务为主体的内容,与普通民众的日常生活脱节,失去了服务大众的意义。不过,北京、上海等地政府和企业联合举办的一系列开放数据创新应用大赛在开放数据数字媒体应用方面取得了一定的成果。以“SODA上海开放数据创新应用大赛”为例,从网站公布的20个典型应用的类别来看,主要有道路交通、民生服务、卫生健康、公共安全和社会发展,与政府独立开发的应用程序来看,大赛中的作品所涉及到的数据类别更加亲民,更有利于解决一些民众切实的问题,也能引起民众对基于开放数据应用程序的关注和使用。以伦敦大学学院Space Time Lab团队开发的一套共享单车电子围栏站点选址和运营优化系统为例,系统包括4个功能——最佳站点选择、最佳容量配置、搬运策略规划和运营效果可视化。此系统首先利用了上海政府数据开放平台所提供的AQI数据、重点污染源监督性监测、实时雨量、水厂水质监测和食品溯源数据,再根据上海市区一个月的摩拜运营数据,建议了2 000个电子围栏车站的最佳位置,站点间最大距离350米,每站最大容量50辆车,每周搬运一次,即可实现自平衡。如此,整个上海市区只需要7万辆车,就可以满足90%以上的用户需求,这将大大提高运营效益,缓解高峰时段供需失衡,提高用户体验,避免单车停放无序,保持城市秩序。通过动态交互可视化,该系统可实时展示各站点的使用情况和搬运效果。方案不仅可以帮助共享单车公司优化运营,也可以协助交通部门有效地管理和评估共享单车服务[ 4 ]。
虽然这些应用程序确实有可圈可点之处,但是也存在着一些问题:我国缺少国家层面基于开放数据的数字媒体应用;政府主导的应用程序内容大多为政务信息公开,服务性较弱;政府开放数据应用大赛中创建的一些平台和系统后续没有真正投放到使用和进行普及,而仅停留在设计层面。
2 开放数据在数字媒体领域的应用路径
2.1 收集高质量可机读的开放数据集
开发应用程序的第一步是收集数据集,第一种方式是直接从政府开放数据平台上下载原始数据,并且数据格式需要是开放和可机读的;第二种是直接使用平台上提供的应用程序编程接口(API接口,Application Programming Interface)。与下载方式获取数据相比,接口使数据使用者可通过参数有选择性地获取所需的数据用于特定的使用目的,以实时高效满足不同应用场景下的数据需要。开放API也是政府开放数据平台针对应用程序开发者所提供的政府公开数据利用途径,通过调用API,用户可以在自己的网页中插入某地地图,进行公交路线和自驾导航等查询功能。有些类型的数据如交通类型的数据API接口采集的是近乎实时的数据,利用这些数据,基本可得到城市交通数据的实时反馈。
2.2 融合技术对数据集进行整合分析
通常情况下开发者会同时收集几个甚至十几个类型的数据集,这些数据既有政府开放数据平台提供的数据,也有团队收集处理过的数据,还有来自互联网的开放数据。这些数据有各种形式、来源和格式,这就需要对它们进行清洗、整合、挖掘和分析,通过算法技术,将庞大且繁杂的数据进行整理和串联,形成应用系统最基础的数据支撑。比如上海的“城市安全宜居服务系统”使用了蚁群算法、遗传神经网络、朴素贝叶斯分类等相关算法用于进一步整合、分析和挖掘数据,并使用空间识别技术融合了21个城市大数据,在一张交互式地图上呈现了上海的真实面貌。
2.3 对数据分析结果进行可视化呈现和交互式操作
数据集的整合分析所得到的结果必须以可视化的方式呈现,交互式地使用才算基本完成对应用程序的开发。通过视觉的方式将复杂、抽象、难懂的数据转化为可读性强的图像呈现给受众。可视化的形式有很多,可以采用静态的也可以用动态的呈现方式,程度的分级通常用不同的颜色来表达,例如在交通地图类应用程序里,用绿色、黄色和红色代表道路的拥堵程度,绿色畅通、红色拥堵,除此之外,还可以使用密集的视觉图像来标明事故多发地段,使用户一目了然。除了观看上要符合受众的审美习惯,更重要的是操作便利性,使市民能更好地融入到系统当中,使他们能真正感受到使用这些数据带来的便利。其中,需要强调的是操作方面的交互式体验,交互式体验能让用户有更多的自主性,能决定自己如何使用数据。同时,应用程序还应该具有良好的用户与开发者之间的互动机制,包括如何使用更好的数据、使用开放数据的方式、可视化形式和平台建设等,帮助开发者进行未来的规划和策略的制定。
2.4 建立基于用户的“众包”数据平台
当前的开放数据大多数来自政府,很多数据缺乏完整性、实时性和真实性。因此,不仅需要融合现有的大数据资源,还要把政府和民众也串联在一起,形成新的实时更新的数据库。建立基于用户的“众包”数据平台,每个人都可以是数据源,因为他们每天使用的手机等智能设备记录了大量有价值的城市信息,因此用户不再是被动的信息接收者,更是城市建设、管理的参与者。充分利用智能设备的数据相互连接、相互共享,将封闭的数据从信息孤岛中脱离出來,使它们变成社会化数据。但是,社会化的数据不是将孤立数据进行叠加,而是可以对其进行数据分析和挖掘,发现社会运行规律,从而可以为社会更好的发展提供指导。
3 结论
在大数据环境下,开放数据将成为这个社会发展新阶段重要的生产资料和创新动力,我国在利用开放数据进行数字媒体建设方面还有很大的提升空间。充分挖掘和利用高质量的开放数据,完善数据集在数字媒体应用中的可视化和交互性,使数据取之于民、用之于民,开发出更多服务性强、高质量的数字媒体。
参考文献
[1]毕秋灵.数据新闻中的开放数据应用[J].湖北社会科学,2016(7):190-194.
[2]邸弘阳,任思琪.政府数据公开网络平台的数据管理与利用方式研究[J].图书馆杂志,2017(1):88-96.
[3]Raids Online Crime Mapping[EB/OL].[2019-3-4]. http://www.cityofconroe.org/departments/policedepartment-home-page/raids-online-crime-mapping.
[4]上海市政府数据服务网[EB/OL].[2019-3-4].http://www. datashanghai.gov.cn/query!queryTypicalGdsDataInfoBy Id.action?type=1&dataId=111102018006.