APP下载

基于大数据技术的科普创新探索*

2022-10-12李翊萌

科技与创新 2022年20期
关键词:科普分析

曹 金,刘 悦,李翊萌

(1.中国科普研究所,北京 100081;2.深圳市南山外国语学校(集团)大冲学校,广东 深圳 518057;3.中国纺织出版社,北京 100027)

数据洪流下大数据将成为各行各业竞争与发展的关键基础,从经验科学、理论科学和计算模拟科学3种科研范式,跨越到如今大数据时代下数据密集型的科研范式,大数据作为新的科学研究范式,已经逐步被运用到教育、媒体、医疗、科研等多个领域,并运用广泛。国务院印发的《全民科学素质行动规划纲要(2021—2035 年)》提出要建设即时、泛在、精准的信息化全媒体传播网络,服务数字社会建设,指出通过实施智库科普建设工程,推进科普与大数据等技术深度融合。如何将大数据技术应用于科普工作中,提升科普工作的全体性、效率、相关研究广度、探索性,引导从事科普的科技工作者更好开展科普活动和科普工作,具有重要的理论与实践意义。本文旨在研究在科普中以及与科普有关的领域中运用大数据技术的典型案例,从而探索运用大数据技术深化科普工作的路径与方向,加速构建数字经济形态下智慧科普工作新模式。

1 研究现状

随着互联网技术的发展,大数据时代已经到来,大数据具有多样化(Variety)、大量化(Volume)、速度化(Velocity)、价值高(Value)的“4V”特征,科普网络舆情分析、实时更新城市交通信息、刷脸支付、基于数据的危情预警机制等都依赖于大数据技术。大数据科普是科普中的大数据,是大数据技术的重要使用范围,对科普的变革发展有着巨大的潜在价值。大数据技术在生产、管理、研究和使用方面主要有数据挖掘、数据管理、可视化分析、预测性分析4 种研究方法。

在互联网广泛普及背景下,数字鸿沟逐渐缩小,各领域也开始广泛使用大数据技术开展工作与研究,但科普的大数据应用研究少于其余领域。在知网上搜索主题关键词,如“大数据 科普”“大数据 教育”“大数据 媒体”“大数据 医疗”“大数据 科研”,出现的论文数量如图1 所示。从一定程度可看出,国内目前对大数据科普的研究相较于教育、媒体、医疗、科研4 个领域,在发表中文论文数量上,要少很多。再搜索北大核心及Cssci 的有关论文,发现在科普、教育、媒体、医疗、科研5 个领域中已发表的论文数量分别为 37 篇、5 607 篇、3 923 篇、1 234 篇、1 191 篇。可见国内对大数据科普的研究基础较为薄弱,且阅读相关论文发现其理论研究不深入,仅是浮于表面的分析与介绍,缺乏相关的系统研究与理论支撑。

图1 相关主题词搜索分布情况

研究如何在科普领域中运用大数据技术,是科普发展的必经之路,未来的科普发展在数字化背景下必将逐步引入大数据技术。分析如何正确运用大数据技术到科普中,具有重要意义,能够为引领科普信息化发展提供路径。

2 大数据在多领域的创新应用案例分析

2.1 教育领域

教育大数据分析是当前学界关注的热点问题,科大讯飞的“智慧课堂”的提出开拓了教育大数据分析新的研究视角,为教与学的优化提供数据支撑,实现了基于数据的教育。“智慧课堂”已经形成了完整的体系,曾在某重点中学学生群体中使用2 年有余,积累了大量的过程行为数据与学业结果数据,为研究数据分析提供了大数据的支撑。智慧课堂数据挖掘分析是一项十分复杂的系统工程,以师生互动指数分析为例,阐述数据挖掘分析的过程。师生互动指数分析的基本框架为:通过针对教师和学生在智慧课堂平台产生的行为数据进行分析,遵循实用性、发展性、全面性、可行性等原则选取指标,建立师生互动的评价指标体系,全面客观地展现教师与学生的互动情况。智慧课堂利用教育数据进行挖掘分析,可为受教育者量身定制学习目标、计划、方案、资源,有助于实现“因材施教”,为个性化智慧发展提供技术支持。

美国各州学区都安装了有利于进行数据收集分析研究的管理系统。学校管理者可以通过数据驱动决策系统查看年级、全校乃至整个学区学生的学习情况。如果发现低效的课堂和学习表现不佳的学生群体,管理者会依据学习分析结果决定是否给予特定的干预。对于更大范围的异常表现,管理者会依据学习分析数据调整管理策略,以适应教师更好教和学生更好学习,数据驱动决策系统有助于帮助学校领导建立持续的改进方案。

2.2 媒体领域

大数据正深刻地影响社会经济发展和人们的日常生活,也已经成为新闻采编中的“热词”,抓住大数据发展的契机,可以提升新闻采编的速度。信息冗余、信息过量是当前社会存在的突出问题,大量无用、无效和不准确信息会影响新闻采编的效率,影响新闻的时效性。因此在大数据环境下,新闻采编人员应以大数据为支撑,提前做好基础性工作,根据大数据揭示的规律特点,主动挖掘新闻,制造新闻价值,提升新闻采编效率。

由央视财经联合国内权威政府部门、智库,顶级互联网公司和大数据研究院共同成立了中国经济生活大调查数据联盟,重磅打造“美好生活指数”系列数据产品。数据联盟成员将通过线上线下渠道,向全网推送“美好生活指数”调查问卷,以调查的大数据为支撑展开新闻采编工作,就会大大提升新闻采编的速度。该大数据应用的创新点在于大数据具有对数据进行自动校正与预测功能,能在概率与数理统计方面进行观测,不仅能抵消错误数据造成的影响,减少不确定性,还可发现相关性关系,生产出具有前瞻性与预测性的新闻产品。

2.3 医疗领域

医患矛盾一直以来都是全社会高度关注的问题。目前诸多医学院校的医学人文素质教育教学资源有限,内容陈旧,缺乏时效性,难以呈现当前社会现实问题。因此构建具有针对性与时效性的医学人文素质教育对于提升医学生人文素养,减少医患矛盾冲突的发生,构建和谐医患关系有着积极的作用。此想法的提出迎合了当下新冠疫情的时事热点,对医患事件分析和教育体系进行分析,依据大数据的分析来优化人文素质教育体系。

构建基于医患纠纷案例大数据的医学人文素质教育体系的深化改革模式,并通过全面系统客观的评价,可以为医学人文素质教育改革提供更有价值的参考与依据。基于医患纠纷案例大数据的医学人文素质教育优化体系的实施模式如图2 所示。首先,采集“医患纠纷案例”与“医学人文素质教育”相关数据,构建医患矛盾与人文教育大数据,形成动态、可视化平台,其中包括对“医患纠纷案例”观点的挖掘以及构建医患纠纷案例与医学人文素质教育知识图谱;其次,结合大数据结果进行深层次、全方位地剖析两者之间的关系,揭示二者之间的因果关联,探索从基础医学教育的体系上化解医患矛盾的产生机制;最后,以医患纠纷案例与医学人文素质教育的大数据挖掘和分析为支撑,开展医学人文素质教育体系优化研究。

图2 基于医患纠纷案例大数据的医学人文素质教育优化体系的实施模式

2.4 智库领域

传统的社会科学研究机构目前尚未具备“功能完备的信息采集分析系统”,要在大数据环境下进行科研作业,需要建立全景式大数据的信息采集储存分析系统和科研协同智能推荐操作平台。广东智库信息化平台能够在短时间内实现跨学科领域专家的协同合作和资源共享。平台致力于实现“互联网+大数据”环境下各研究机构或决策部门的资源共享,是广东智库各科研机构资源的整合者。平台设有智库视野、专家库、数据中心、知识定制、知识社区等多个板块,并通过智库链接,与全球智库建立“大连接”关系。智库信息平台利用大数据智库信息化平台为载体,通过建立基于大数据的智能采集加工分析系统,为跨时空科研协同创新提供了情报大数据支持。智库平台的优势在于创建了线上与线下结合的科研协同工作流,从而能够实现多个虚拟课题组同时并发,在云空间多系统支撑的网上研讨写作,进而实现专家利用最大化效应。

美国智库战略预算与评估中心(CSBA)收集战争数据,运用战争推演方法,通过建设仿真作战模型,能够预测未来的战争场景,该中心具有联合一体化应急模型评估工具,收集了众多国家和地区的战场环境和作战计划等数据,在此基础上进行系统建模,为美国制定军事对策提供数据参考。

2.5 科研领域

随着大数据技术不断成熟,将大数据技术应用在科教评价领域能够使科教评价的多样性、方法的可行性以及评价体系的完整性等方面得以体现。

杭州电子科技大学中国科教评价研究院提出利用Cite Space 软件对科教评价领域进行可视化分析,通过可视化能够较为直观地观测科教评价的发展过往、当前研究热点及潜在发展趋势,进而找出科教评价目前存在的问题和发展方向。具体实施模式如图3 所示,首先通过整理文献梳理出科教评价概念的演进以及科教评价的应用实践,使用Cite Space 可视化软件对检索收集到的数据进行数据来源分析和文献时间分布分析,通过可视化可以较为直观地观测科教领域的发展过往、当前研究热点及潜在发展趋势,最后进行研究热点分析和研究趋势分析。大数据在科教评价领域的应用突破了传统科教评价在范式和方法上的不足,可以深入挖掘出更多可量化的评价指标,也为科教评价的指标体系建立提供正确的向导,科教文本的数据搜索更加精准,多维度、多层面的角度使科教评价更加具有借鉴意义。

图3 大数据应用科教评价实施模式

重庆市规划和自然资源调查检测院建设了大数据平台,大数据平台定制了空间计算、属性统计、机器学习、数据输出等多个类型的模型,搭建了征地、供地和储备技术审查等多个业务应用系统。该平台利用集中连片度分析模型,快速统计了细碎庞大的耕地集中连片度分析,并转移到全市级别统一的大数据环境计算模式中,解决了之前单机汇总耗时长难以完成任务的困难。平台在土地技术审查、永久基本农田管理、大屏展示系统等方面也进行了有效扩展,充分践行以业务需求为导向,开展大体量数据运算的实践应用。

3 大数据科普的典型案例

随着社会科技的不断发展,人们能够获得信息的途径也随之增多,能够满足人们多样化需求的智慧化科普成为科普创新的必然趋势。在信息技术不断发展的背景下,大数据在数据挖掘、数据管理、可视化分析、预测性分析方面的优势为科普工作的创新发展提供了可能。大数据观念有助于实现科普资源信息化,促进社会共享,同时也有助于对受众和热点进行精确把握,对科普效果进行全面客观的评价,从而为改进科普工作提供更加准确的思路。目前科普领域在科普平台、科普场馆、科普创新工作等方面,利用大数据技术方面进行了一些尝试和探索,展现出较为广阔的发展前景。

在科普平台建设上,湖北省科协构建的科普知识大数据库及共享平台“科普游楚天”,展示了科普网站可形成一个导航门户、三大服务环境、多种资源站点聚合的网络化科学传播平台,通过此平台整合多个科普场馆的资源,构建知识集合数据库。河南省科协开发的科普云平台系统下包括2 个子系统,分别为科普云计算系统和大数据科普应用系统。科普云计算系统主要进行云计算管理和云安全管理,大数据科普应用系统主要有科普资源管理、科普动态管理和科技创新服务管理3 方面的功能。

在科普场馆应用上,大数据时代下,科普场馆尝试利用现代技术进行科普效果的提升,积极发展创新数字媒体交互形式。无锡科技馆对科普场馆与大数据的接轨进行了研究,探索科普场馆创新数字媒体交互形式。传统科普场馆展示常常会出现信息滞后,无法跟随时代发展的问题,同时展项创新不足导致观众兴趣降低的情况也时常出现。而建立在大数据基础上的科普展馆展示可以实现内容和系统的自我更新,并且在信息获取方面可以依据参展个体的特点进行调整,智能调整交互展项的内容和参展进度,提升观众兴趣,有效获取知识。数字化科技馆可采用大数据思维的信息采集手段,如通过数字科技馆对监控路线进行分析、了解科普受众的行动路线、在展品前停留的时间、分析受众的表情以检测兴趣度,以此类分析来构建更完善的数字化科技馆。大数据支持下的学习可以整合更多形式的学习资源,有针对性地形成高效深度参展体验模式。

在科普工作实践上,除线下场馆和传统科普读物外,互联网时代的科普工作同样需要拓展渠道满足人们的知识需求。科普APP 能够帮助公众更加方便获取知识,降低了时间空间对知识获取的限制,以多种形式提供科普内容。因此良好的内容的整合与呈现是科普APP 达到更好科普效果的关键。殷丽丽等研究了基于MVP 模式的医疗科普APP,通过文本、图片、视频三种媒体形式展示医疗大数据信息,在“互联网+大数据”的背景下拓展科普知识覆盖范围,加强医疗知识的普及和宣传力度,提高用户体验。孙玉玲表示依托数据挖掘技术,机器能够洞察阅读者需求并自动生成相关知识图谱,形成选题策划的初步方案,是科普出版业的创新性发展。杨思思等分析了科普网站的信息化建设,重点表明今后科普网站的建设也要应用Blog、RSS、SNS 等经典技术,以大数据技术为支撑,推动科普受众参与互动,并能够做到信息定制化。

4 基于多领域应用的大数据科普迁移思考

现有的大数据科普形式较为单一,取得的工作成效不太显著,尚处于初步展开的阶段,结合其余领域的开展情况,提出大数据科普的迁移思考。

4.1 多领域优势聚集,迁移造就新科普

借鉴多领域应用大数据技术的模式,在科普领域中应用,是短期内提升科普信息化建设的重要参考方向。譬如借鉴教育领域的“智慧课堂”应用,可考虑打造“智慧科普”,应用智能信息技术创设高效科普环境,支持线上线下一体化、虚拟现实一体化的全场景科普应用;建设数据驱动决策系统,掌握区域内科普活动的开展情况,帮助管理者依据数据调整管理策略。借鉴媒体领域的应用,应用大数据在科普领域普查和搜集资料,提前做好科普调查的基础性工作,依据数据挖掘结果进行科普策划及发展方向分析。借鉴医疗领域的应用,建设大数据平台,对科普中出现的典型事件进行分析,有助于总结经验,探索新机制。借鉴智库领域的应用,聚集跨学科专家的科研力量,作为科普智库的支撑力量,为跨时空科研协同提供支持,减少重复劳动,实现专家协同的最大化。借鉴科研领域的应用,利用大数据进行热点关键词和前沿领域的分析,使信息呈现更加精确,同时对科普现状进行评价,把握研究方向的发展趋势,对未来进行有效预测。诸如此类的可借鉴模式还有很多,在众多优势领域聚集下,在科普领域中边试边用,终能形成大数据科普模式。

4.2 大数据助力科普,发展工作新载体

基于大数据能够更快速准确地确定大众科普需求,取得更为有效的科普传播效果。大数据的应用过程主要分为数据挖掘、数据管理、可视化分析、预测性分析,数据挖掘和数据管理能够显著提升工作效率,帮助使用者精准快速地做好科普前的准备工作。大数据科普要保证能够根据用户的科普需求进行收集指定内容的数据,并且在挖掘数据的同时可以调整挖掘方向,打造高效科普。可视化分析和预测性分析是科普工作进阶发展的重要工具,为应急科普、科普研究、知识科普提供了新形式。大数据科普要利用新技术条件,反馈给受众前沿和更具数据依据的科普内容,通过可视化分析可以减轻人工科普的负担。要建立大数据科普预测分析机制,如采取数据专业分析软件得出图表发展走向,采用三维建模的方式进行三维演示和动态推演,从而更好地为决策服务,为提升科普内容质量服务。还应利用大数据充分凝聚专家资源、科普资源,开创科普工作的新载体。

4.3 大数据科普聚焦高效,紧扣智能化平台化

建设大数据科普平台,利用大数据的智能化,实现科普智慧化发展,为实现高效科普打下了良好基础。平台化是指在大数据科普的每一步中都设有平台支撑,搭建大数据科普收集平台、大数据科普管理平台、大数据科普分析平台、大数据科普展现平台、大数据科普评估平台等,对国内外信息进行挖掘,对科普机构、科普社团、科研机构、教育结构等多个单位的信息进行挖掘,将挖掘到的数据都放入平台数据库中,实现平台的共建共享功能,最大化利用资源。智能化即建设智能化的大数据科普管理系统,通过智能化整理,将数据按机器学习识别的结果分配到各模块中。引入机器学习和人工智能技术,以自动化数据管理为主,继续采用云技术和数据分片技术完成数据的储存,整个数据管理过程是可自动配置和调整的。还应紧扣科普评价,完善利用数据的科普评价体系,以评促升,打造循环科普生态体系,发挥科普高端智库的支撑性作用。

猜你喜欢

科普分析
民航甚高频通信同频复用干扰分析
分析:是谁要过节
回头潮
科普漫画
科普漫画
基于均衡分析的我国房地产泡沫度分析
Units 13—14解题分析