APP下载

省域教学资源公共服务平台助推职业教育发展机制研究*

2018-12-07

中国教育信息化 2018年21期
关键词:公共服务教学资源资源

刘 琴

(湖南省教育科学研究院,湖南 长沙 410005)

自互联网产生以来,其在信息共享与交互层面发挥的作用越来越重要。尤其是进入“互联网+”时代,互联网已经成为人类社会必不可少的基础设施。互联网创新成果与经济社会各领域的深度融合,使得实体领域迸发出了巨大的创新力和生产力,形成了更广泛的以互联网为基础设施和实现工具的经济社会发展新形态。

在移动互联网、云计算、大数据、物联网、人工智能等一系列新技术不断改造经济社会活动的同时,越来越多的人开始意识到一个问题:在这样一个信息爆炸的时代,限制我们思维和表达的阻碍不再是信息匮乏,反而是信息过量,确切地说,是无用无序信息的干扰与过量。

具体到教育领域,教育信息化的概念是在20世纪90年代伴随着信息高速公路的兴建而提出的。自20世纪90年代末开始,我国政府的各种文件已经正式使用“教育信息化”这一概念,并高度重视教育信息化工作。从2012年开始,教育信息化领域的政策集中出台,2012年3月的《教育信息化十年发展规划(2011-2020年)》对未来10年的教育信息化建设提供了指导意见和总体方向。2018年4月,教育部印发的《教育信息化2.0行动计划》(以下简称“计划”)为我们提供了最新的政策保证和工作指南。其中,计划提出实施的“数字资源服务普及行动”昭示着搭建省域职业教育教学资源公共服务平台的必要性与迫切性。

一、问题的提出:省级职业教育教学资源公共服务平台要解决哪些痛点

围绕着互联网的飞速发展,信息爆炸或者信息泛滥给人类社会带来的负面效应和潜在危机日益浮出水面。如何使信息资源得到有效的利用,提高信息的质量,已经成为一个世界性的网络难题。除了提升个体信息素养,强化自身收集、分析与鉴别信息的能力与效率外,运用最新技术手段,打造资源公共服务平台也是一个不错的技术手段。因此,为了助推职业教育的发展,搭建省域教学资源公共服务平台的意义非常重大。搭建这样一个平台,必须要回应互联网资源获取方面的痛点,才能精准地把握自身定位。具体而言,互联网资源具有如下痛点:

1.资源分散

建设主体多元化带来了资源分散的必然结果。具体到职业教育教学资源层面,除却以博客、微博、公众号等形式的个体(团队)运营资源和以百度文库、道客巴巴等为代表的大型资源共享网站。职业教育资源相对集中的分布点大致还包括微知库、智慧职教和国家精品课程资源网等国家级资源库平台,超星、网易等多家公司运营的MOOC类网站,还包括世界大学城、省级微课网和学校资源中心等平台。细细梳理下来,不难发现,这些资源站点还是太多了。

2.资源使用率不高

在互联网时代,教育资源使用率不高一直困扰着相关部门。即使是国家级层面的资源站点平台,同样有着这样的问题。曾有一个国家级课程平台,其资源使用排行显示了这样的尴尬数据:排名第一的课程,使用达数万次,但深入研究排名前100位的课程,会发现从前20名左右开始,课程的使用次数低于三位数。这是一个沉重但又非常现实的数据,也反映出了教学资源使用率不高的现实痛点。

3.资源使用不方便

由于教学资源分散,很自然地产生了资源使用不方便这一痛点。资源使用不方便,主要表现为两点:一是资源获取不方便。很多资源站点平台,对于资源的下载是有限制的,这些限制往往表现为积分和收费的不同形式。二是资源使用不方便。各个资源站点平台的格式、使用逻辑都不一样,使得其很难与学校的教学平台进行系统对接,更遑论教学过程管控和开展数据分析了。

4.资源更新速度难以保证

互联网教育资源的后续更新维护往往会成为一个非常大的问题,相当比例的资源建成即告完结。其根本原因在于缺少市场化的资源交易机制,单纯地依赖财政投入和个人热情难以确保资源更新的覆盖面和持续性。

5.资源质量鱼龙混杂

在信息爆炸的时代,互联网资源质量良莠不齐、鱼龙混杂是普遍现象。教育教学资源同样如此,造成这一现象的原因,细究起来大致有三点:一是资源更新速度难以保证;二是资源提供方素养的差别对教学资源质量产生的影响;三是资源平台机构方对数量的追求更容易实现,而对质量的把控成本缺极高。而这些痛点带来的现实后果就是高质量的教学资源获取难度越来越大。

6.资源的知识产权保护形势堪忧

抄袭、盗版等侵权行为在互联网时代成本变得更低、途径相对隐蔽。因此,一些优质教育资源的作者或机构,出于保护自身知识产权的需要,在资源上线方面持谨慎和保守态度。这也在一定程度上限制了优质网络教育资源的传播和获取。

二、解决策略:省级职业教育教学资源公共服务平台应具备的功能设计

针对当前网络教育资源存在的痛点,应充分利用大数据、人工智能等先进技术构建省级职业教育教学资源公共服务平台,从技术和渠道层面解决上述问题。该资源平台的建设,需要满足如下功能:

1.资源采集功能

针对当前各类教育资源分散的痛点,平台应能够采取必要的技术手段,以较高的覆盖面采集相关的资源到平台。在数据采集过程中,各采集频率需要根据业务需求、数据量大小等灵活制定,可采集的数据类型包括分布式数据信息、关系数据库中的结构化数据、各种类型的半结构和非结构化数据、静态及高低频知识数据等,并且能实现对数据质量进行监控和迭代优化。

2.自动分类与存储功能

资源采集系统汇聚起来的数据还处于无序、杂乱状态,甚至其中可能还会存在陈旧过时信息和错误信息。所以平台应能够针对采集的原始全量数据及增量数据构建原始数据仓库,实现业务系统原始数据和增量数据的全量数据备份,同时为校内数据积累提供数据存储。对原始数据仓库数据清洗及标准化处理,分析适配,形成数据分析表,入库存储。对传统的关系型数据库,也包括XML等半结构化数据,以及以视频、音频、文本和其他形式存在的非结构化数据,将按残缺数据、错误数据和重复数据进行处理,把结果集入库,并记录清洗结果,形成标准化数据库仓库,最后通过建模分析,针对模型建立模型分析主题数据仓库。平台同时提供高效的数据管理及检索,可通过对数据平台的授权向外提供数据访问接口,实现订阅式的数据共享。

3.自动评级与推优功能

在对采集资源进行分类存储的基础上,平台应能够通过对用户的精准分析和对资源的智能识别排序,将适合用户需求的优质资源及时推送到用户层面。

4.交易功能

随着我国经济社会的不断发展,对知识产权的保护体系日益完善。尊重他人知识产权、维护自身合法权益的意识在民众中也越来越普及。作为一个省级的职业教育教学资源公共服务平台,可以积极探索通过协议支付、在线付费等方式,探索教育资源的交易机制,切实保护原创者的劳动成果,推动优质资源建设的可持续发展。

三、具体方法:省级职业教育教学资源公共服务平台功能实现的技术手段

为更好地确保省级职业教育教学资源公共服务平台应具备的功能,必须及时采用较为成熟的技术手段,确保上述功能的有效实现。具体而言,该平台可采用的技术有:

1.运用大数据爬虫系统采集处理教育资源

大数据爬虫系统(爬虫系统管理平台)紧跟世界发展潮流,采用目前流行的Python3开发软件,针对高教行业背景自主研发各类爬虫脚本,能够实现全网主题网页的数据爬取,也能够完成增量式网络爬虫和Deep Web网络爬虫。该爬虫系统管理平台具有突出的可用性、高可扩展性,能处理PB级别以上的数据,可采集各种类型的互联网数据,同时具有分布式网络请求调度以及丰富的页面结构解析能力,能够为高校管理、服务、教学和科研方向爬取数据,从而为高校用户进行海量数据深度分析,并挖掘数据潜在的核心价值。

具体而言,爬虫系统应该能够实现下述功能:

(1)通过专业教学资源大数据采集系统,对专业教学资源的大数据进行采集,能够对各种不同类型的数据格式进行实时数据采集和过滤、去重处理,内置行业词库,可自定义。采集数据的速率要能够满足专业教学资源大数据平台的要求。

(2)专业教学资源大数据采集系统需具备本地与云端的联动能力,共同采集专业教学资源的互联网大数据,采集范围包括但不限于教育部网站、世界大学城官网,采集类型包括但不限于微课、课程、素材、培训等。

(3)对采集的数据能够进行多种方式的搜索,采集的专业教学资源相关结果可自动排重,结果排重,支持URL的排重方式以及利用内容的相似性进行排重。需具备图片资源与动态资源的采集能力。

(4)对采集的互联网数据能够进行自然语言处理,为存储和分析挖掘功能做好数据准备。

(5)系统需具备信息检索、文本挖掘能力,对数据自动分类;对高职教育领域的关键词、关键字可单独分类采集;具备自动计算数据信息热度的能力并排序,形成关键字;对某时间和区域内高职教育行业热点内容进行统计分析和趋势预判,给出相应决策依据。

2.运用Sunm-InCenter大数据平台提供公共服务

Sunm-InCenter大数据平台采用业内领先技术,基于Hadoop大数据框架进行深度定制开发,结合自研的可视化ETL工具、建模分析、流式处理等核心技术,针对高教行业背景自主研发了企业级智能大数据平台,是当前是教育行业成熟案例最多的大数据服务平台。

Sunm-InCenter能处理PB级别以上的数据,可图形化地采集校内业务系统数据、互联网数据以及设备日志数据等,同时具有强大的实时和离线计算能力,以及丰富的数据挖掘分析能力,能够为高校管理、服务、教学和科研方向提供深度的数据处理和高效的计算与挖掘分析。

具体而言,在平台的实际运营中,大数据管理平台(框架如图1所示)要实现下述功能来确保公共服务功能的有效落地:

图1 大数据管理平台框架图

(1)信息处理和存储

①在数据存储方面,需提供具有高可用性和扩展性的关系数据库、列式存储数据库、文件系统、内存数据库等多种存储系统,以支撑各类业务结构化数据、半结构化数据、非结构化数据、海量实时数据的存储和访问需求。

②将采集到的数据完成数据抽取、清洗、转换、装载的整形过程。

③为不同专业教学资源大数据应用场景提供不同的存储方案,将数据加载到不同类型的存储,例如关系数据库、非关系数据库和HDFS文件系统。

④支持按照预先定义好的数据仓库模型,将数据加载到数据仓库进行分析。

(2)数据挖掘和分析

①通过数据挖掘引擎完成各种专业大数据的分析,对大量数据进行分布式处理,能够对采集挖掘的信息和导入的信息,进行进一步的数据分析,根据要求输出可用信息。

②数据分析引擎须具备以下基本分析呈现能力:信息数据传播趋势与路径分析;具备信息检索、文本挖掘能力,对数据自动分类;对高职教育行业的关键词、关键字可单独分类采集监控;具备自动计算数据信息热度的能力并排序,形成关键字;对某时间和区域内教学资源的热点内容进行统计分析和趋势预判,给出相应决策依据。

③系统能够满足大规模数据处理的业务场景,实现海量数据存储及高性能计算分析。基于分布式架构,通过大规模、可扩展的并行计算框架,对海量数据提供高效的存储、计算和分析能力。

④提供离线分析挖掘和在线实时分析挖掘能力,可以做到实时分析。

(3)自然语言处理开发包

提供和开放NLP工具开发包,支持完成主流NLP工具包的一键部署,提供中文分词、词性标注、命名实体识别、依存句法分析、关键词抽取、时间短语识别、情感倾向分析、文本分类、文本聚类、层次分类、在线学习等功能。可进行文本分类、聚类、情感判断、摘要提取、文本去重等中文自然语言的语义分析等功能。

四、机制保证:省级职业教育教学资源公共服务平台如何避免沦为空中楼阁

省级职业教育教学资源公共服务平台的搭建与运营,除了平台自身的技术支撑以外,还需要组织、政策、资金、人员等多方面机制的协同作用,才能够最终实现其长久的生命力。

1.以先进技术确保资源质量是平台运营的源头活水

本文前面充分探讨了通过技术手段确保平台资源能够有更高的覆盖面、更快的知识更新速度和更精准的服务推送,这些技术手段的运用,才是平台长期持续运营的基础。

2.充分发挥省教科院组织人才优势是平台运营的重要保障

作为职业教育领域的教学资源公共服务平台,需立足于教科院的组织人才优势,才能确保平台能够精准面向适度的受众和用户。建设国家级层面的平台,势必面临我国各区域之间职业教育发展不平衡的巨大挑战。单一城市的公共服务平台,面向的对象又太少,能够利用的知识资源也有很大限制,使得投入产出难以取得平衡。而省级平台的建设,恰恰可以较好地规避上述两个问题。

3.积极探索公益创业模式,确保平台运营的长久生命力

所谓公益创业,就是社会组织、企业、非盈利组织等在经营过程中,将社会价值与经济价值创造性地融合,在保证组织不偏离公益性的同时,借助一些商业手段来实现公益组织的“造血”功能,让组织拥有更多资源和能力从事公益服务。在本平台的运营过程中,也可以积极探索公益创业的模式,积极实现“造血”与输血”的动态平衡,探索知识产权的交易模式,激发资源原创者的积极性,从而实现平台运营的长久生命力。

五、结束语

职业教育专业教学资源库是 “互联网职业教育”的重要实现形式,资源库建设是推动信息技术在职业教育领域综合应用的重要手段。我们希望借助大数据平台采集整合职业教育专业教学资源,并进行分门别类,为职业院校的人才培养和学校建设提供信息化技术支持,并以此为契机,实现“引领专业教学改革,提高人才培养质量的需要”、“实现优质资源共享,专业对接岗位的需要”、“提高‘互联网+’个性化学习,满足终身学习的需要”以及“促进中高职协调发展,构建现代职教体系的需要”等诸多目的。

猜你喜欢

公共服务教学资源资源
公共服务
基础教育资源展示
公共服务
公共服务
公共服务
丰富历史教学资源 提升课堂教学质量
一样的资源,不一样的收获
资源回收
高校冰上教学资源社会开放的意义及管理模式
资源再生 欢迎订阅