以创新能力培养为中心的信息内容安全课程建设
2018-12-01任延珍朱婷婷王丽娜姬东鸿何炎祥
任延珍,朱婷婷,王丽娜,姬东鸿,何炎祥
(1.武汉大学 国家网络安全学院,湖北 武汉 430072;2.海军工程大学 信息安全系,湖北 武汉 430033)
0 引 言
随着互联网信息传播技术和应用的飞速发展,各种色情、反动、恐怖、谣言等不良信息同时也在互联网络上得到大量传播。提高对互联网各种不良信息的监管能力, 净化网络空间已经成为目前网络空间安全的重要工作任务。信息内容安全技术是研究如何利用计算机从包含海量信息并且迅速变化的网络中, 对特定安全主题的信息进行自动获取、识别和分析的技术,是管理信息传播的重要手段, 属于网络安全系统的核心理论与关键组成部分, 对提高网络使用效率, 净化网络空间, 保障社会稳定具有重要意义[1,2]。信息内容安全是信息安全的重要分支,其相关知识、概念和技术的传授在信息安全专业教学建设中非常重要[3]。
虽然信息内容安全课程已经是教育部颁布的《高等学校信息安全专业指导性专业规范》[4]中规定的主要专业选修课程之一,但由于信息内容安全是网络空间安全中新的研究领域,学术界对信息内容安全的认识尚不一致,因此目前该课程的教学体系建设工作滞后,国内开设信息内容安全课程的学校非常少,而在少量开设的课程中,往往以信息内容安全中某个局部研究领域作为主要授课内容,缺少教学内容的全面性和系统化。由于信息内容安全是涵盖了包括计算机网络、信息论、统计学、自然语言理解、多媒体信号分析、机器学习、数据挖掘等多个学科领域的新技术,因此,信息内容安全课程的建设对于学生全面系统地了解和掌握该领域的基础知识和最新技术具有非常重要的意义,也是目前信息内容安全教学工作亟须解决的重要问题。
1 课程内容建设
信息内容安全课程是《高等学校信息安全专业指导性专业规范》[3]规定的选修内容。课程的培养目标是让学生了解信息内容安全的威胁,掌握信息内容安全的基本概念,熟悉信息内容的获取、识别和管控的基本知识和基本技术。因此本课程内容以信息内容安全技术的处理过程为主线,在总体介绍信息内容安全的相关概念之后,从信息内容的获取、信息内容的特征提取、信息内容的理解识别以及信息内容安全的多种应用方面进行介绍。课程内容的结构如图1所示,课程内容所参考的教材资料主要包括文献[5—7]。
信息内容安全概述。介绍信息内容安全的总体概念,信息内容所面临的安全威胁,国家所颁布的相关法律法规以及解决互联网信息内容安全问题的相关技术及其研究现状。
图1 信息内容安全课程内容结构
信息内容获取技术。分类介绍互联网络信息发布和交互的通信机制;介绍互联网信息发布主流渠道网页信息的获取原理及相关技术;介绍网络数据交互中数据包捕获技术的基本概念和相关技术及工具。
信息内容特征提取技术:网络信息载体类型主要包括文本、图像、音频及视频,其中文本是主流的网页信息载体。该部分是信息内容安全的核心内容,分别对文本、图像、视频、音频信息的语义内容特征的提取方法和技术进行介绍。
信息内容识别技术:该部分内容主要针对不同类型载体信息特征获取之后的信息内容安全识别、分类和聚类技术进行介绍,是各种不同类型信息载体识别的通用技术。主要包括模式匹配技术、特征分类和特征聚类技术。
信息内容安全应用:以信息内容安全的主要应用为案例,将信息内容安全技术串联起来介绍,让学生了解技术和应用之间的实际关系。由于课程时间受限,本课程主要以垃圾邮件过滤和网络舆情检测预警系统为例[8-10],介绍系统所面临的应用问题、系统架构及关键技术等。
2 实验课程安排
信息内容安全实验课程设置的目的,是通过上机操作实验,让学生将课程中所学习的理论和方法进行实践,通过授课和实验相结合,使得学生真正掌握信息内容安全的相关概念、知识,提高其应用内容安全技术的技能。实验课程的安排与授课内容基本平行同步。主要包括基本编程技能训练、网页信息获取技术实验、文本内容理解技术实验、图像内容理解技术实验、音频内容理解技术实验等五大方向。其中文本内容理解技术实验为课程核心内容,图像和音频内容理解作为介绍性的实验,让同学们体会此类多媒体的特征提取技术。该课程的实验安排主要包括8次实验课,每次4学时。实验课由老师授课,介绍总体实验环境安排、技术原理和实验方案,学生现场编程,教师辅助指导。实验课程内容的安排如下。
实验1:Python语言及Requests网页信息获取技术介绍及实践。
实验2:BeautifulSoup网页文本信息获取工具介绍及实践。
实验3:Re库使用方法介绍及实践。实例:淘宝网站信息定向爬取分析。
实验4:Scrapy高级网络爬取技术介绍及实践,实例:股票信息定向爬取分析。
实验5:Jieba中文分词工具介绍及实践,word2Vec技术介绍及实践。
实验6:朴素贝叶斯分类技术介绍,实例:垃圾邮件分类实践。
实验7:基于Python的图像处理技术介绍,图像特征提取技术和图像检索实践。
实验8:基于Python的音频处理技术介绍,音频特征提取技术和音频分类实践。
3 综合实践能力考核
该课程通过课堂授课介绍基本概念和方法,通过实验课程让学生实践。在课程的考核环节中,取消了早期的卷面考试模式,采用以创新能力培养为核心的综合实践能力的考核方式。
由于该课程所涵盖的知识面非常广,而且课程所涉及的技术大多都是目前计算机应用领域的热点技术,如果能够通过该课程让学生关注实际网络空间中的信息内容安全问题,利用所学习的方法和技术分析和解决问题,将会比仅仅通过卷面考试的方式更好地调动学生主动学习的积极性,发现其自身所具备的潜能,从而让学生感到学有所用,能够更积极主动地关注周围环境和应用需求,考虑解决方案,最终实现学生创新能力的培养。在本课程考核环节的设计中,可以采用自主选题、分组实践、综合测试的方式。
1)选题库设计。
综合实践考核的选题包括教师设计选题库和学生自主选题两类。教师设计的选题库主要围绕课程内容,根据选题所属的技术领域,主要分为以下四大类:高级网络信息爬取技术、文本内容理解技术、图像内容理解技术、音频内容理解技术。每类技术主题中设计相关的应用,构建多个选题供学生选择。学生设计选题由学生根据其兴趣点和对社会需求的分析,自行设计选题,与教师沟通确认后,加入选题库。进行选题库设计的基本原则是选题与课程内容相关、具有一定的难度和挑战性,同时须具备可行性。选题设计的挑战性是为了确保题目具有一定的难度,从而可以给学生提供面对问题、分析问题和解决问题的机会;选题设计的可行性是确保选题任务是学生在其所学技术基础之上可以完成的目标,从而使学生获得解决问题后的成就感,提高其对科研实践的兴趣。
2)考核形式改革。
学生以自由组合的方式分组,一组成员以4人以内较为合适。考核以分组为单位,同时对组内每位成员的工作内容和工作成果进行评估,确定每个人的考核成绩。考核的内容主要包括:小组课程实践成果的PPT介绍、实践报告、成果代码、个人工作情况报告。通过PPT介绍,可以锻炼学生对其工作的凝练总结和口头表达能力,实践报告的考核可以锻炼学生的文字总结和表达能力,个人工作情况报告用来评估每位成员的实践能力。
课程实践的时间是4周。从学生们最后的课程实践成果报告中,可以看出此次考核方式改革所带来的效果。所有小组都完成了其分组所选定的课题。其中部分同学由于已经提前进入科研团队开展科研工作,因此将其目前研究领域中的一些最新技术应用在内容分析选题实现中,如深度学习、生成对抗网络等技术,已经超出了本课程所介绍的内容。同时,还有部分同学在自主分析和解决问题的过程中,产生了对该领域技术研究的兴趣,初步感受到科研的魅力。这些成果都说明了,这种不设置“天花板”的考核机制能够非常有效地提高学生学习的主动性和创造性,让他们能够真正领悟到学有所用的益处。
4 课程教学与学科竞赛的相互促进
通过以上模式的信息内容安全课程的授课,很多学生了解了信息内容安全中丰富的技术,对信息内容安全技术产生了浓厚的兴趣,有了进一步深入研究相关专业领域技术的需求。为了进一步提高部分优秀学生的创新能力,武汉大学结合学科竞赛机制,鼓励教师指导本科生提前进入科研领域。目前在信息内容安全方面,学生主要参与的学科竞赛为全国大学生信息安全竞赛作品赛,武汉大学在该研究方向每年的参赛作品超过4项,从2014年起,与信息内容安全技术相关的获奖数量达到9项,其中一等奖2项、二等奖4项、三等奖3项。在参赛获奖的同时,很多学生也展现出了良好的科研潜力。多位同学在参赛过程中同时取得了学术论文、发明专利以及软件著作权等科研成果。学生通过参加大学生信息安全竞赛,进一步提高了科研实践能力,为其后续的研究生学习工作奠定了良好的基础。
5 结 语
信息内容安全是信息安全领域中新的研究方向和学科,信息内容安全课程的建设非常重要。为了顺应互联网发展对信息内容安全监管人才的迫切需求,武汉大学于2014年率先开展了信息内容安全课程建设和教学工作,通过5年的信息内容安全课程的教学实践,构建了一套完整的课程体系。该课程建设以学生创新能力培养为中心,在课程内容、实验课程以及考核机制3方面进行了全新的设计,通过“课程讲授+上机实验+综合实践”考核的方式,实现了对学生从提出问题、分析问题到解决问题的综合实践能力的培养和锻炼,将“基础性”教学转化为“实用性”教学,获得了良好的教学效果。希望武汉大学提出的信息内容安全课程的建设思路,能够为将要开设信息内容安全课程的学校提供参考。