公安高等院校数据科学专业的课程体系设计
2022-06-27陈鹏
陈 鹏
中国人民公安大学 警务信息工程与网络安全学院,北京 100038
一、引言
物联网、云计算、大数据等技术的快速发展使人们由信息时代进入了数据时代。当下,数据无处不在,万事万物皆可被感知,产生了难以计数的海量信息,而这些海量信息又进一步为人们理解社会运行从而更好地管理社会提供了难得的机遇,由此催生了数据科学的诞生。数据科学是一门新兴的学科,也是一个交叉的领域,其研究的是具体的方法、过程和系统,从不同形式的数据(包括结构化、半结构化和非结构化数据)中抽取知识,以获得对客观事物的理解和洞察[1]。近年来,随着各行各业对数据分析依赖性的增强,对数据分析人才的需求也出现井喷之势。2016年,教育部发布的《2015年普通高等学校本科专业备案和审批结构》中首次增设了数据科学与大数据技术专业,北京大学、对外经济贸易大学等高校率先设立了数据科学专业。2017年,设置数据科学专业的高校增加至32所,截至2018年,获批设立数据科学与大数据专业的高校已达到283所[2]。数据科学已成为当前最受欢迎的专业之一。
公安行业是一个数据密集型行业,经过十余年来“金盾工程”“平安城市”“雪亮工程”的建设,公安行业已初步形成了覆盖社会面的安全态势感知体系和数据管理与应用体系,并在治安防控、侦查办案、社会管理、服务民生、队伍管理等方面发挥了巨大的作用[3]。但是,由于公安工作自身特有的行业特殊性,使得公安工作的数据分析有着与其他行业不同的特点。公安工作任务包括维护社会稳定、防控和打击各类违法犯罪活动、服务社会等多个方面,因此,公安工作的数据分析就是要为指挥、情报、侦查等相关业务方向提供包括时空态势分析、异常行为识别、非结构化数据快速检索等多个方面的服务。然而,从现有的国内外高校的数据科学专业课程设置及其人才培养的目标来看,其大多数服务于各类工业和商业领域的数据分析与应用,缺少适应和满足公安工作的数据科学专业设计与建设。
为此,本文通过调查和总结国内外高等院校的数据科学专业课程体系与人才培养模式,梳理数据分析人才培养的一般规律,并针对公安工作数据分析人才的需求,分析并探讨公安院校的数据科学专业课程体系构成。
二、当前国内外高等院校数据科学专业的课程体系设计
(一)国内外高等院校数据科学专业人才培养目标分析
目前,在已设置数据科学与大数据技术专业的国内外高校中,对人才培养的目标与方向大致可分为数据科学家、数据工程师和数据分析师三个类型[4]。其中,数据科学家要能够对大数据进行分析,发现新问题,并且能在现有算法和模型的基础上构建新的算法和模型来解决新的问题;数据工程师要能够对数据进行清洗、整合、管理,为数据科学家或数据分析师的工作提供所要分析的数据;数据分析师要能够利用已有的算法、模型、计算框架、软件工具等围绕着特定的任务目标开展数据分析,但不要求对数据算法或模型进行改进[4]。现有的数据科学专业根据上述三类人才培养目标,已形成层次分明、目标明确的人才培养体系。其中,数据科学家要求具有较高的创新能力,是数据分析的基础理论、算法模型等领域的创新性人才,致力于解决数据分析中未知的基础性问题。数据工程师要求有着很强的工程实践能力,其定位为解决实际应用中的数据采集、存储、运维、管理、治理等工程性问题,致力于为大型数据分析项目提供框架性的解决方案。数据分析师则要求具有行业应用能力,其定位为利用数据分析算法和模型解决具体场景下的应用问题,致力于为行业决策提供数据分析基础支撑[4]。
在具体数据科学人才培养模式上,国内外相关高等院校均十分重视与某些专业领域的紧密结合。如美国哥伦比亚大学的数据科学专业目标定位为培养数据科学家,但在具体的培养方案上除了要求学生掌握计算机科学、统计学等基础知识外,还要在线学习金融、医疗、市场营销等领域的数据分析工具的应用[5-6]。复旦大学在其数据科学家培养项目中不仅要求学生掌握面向大数据应用的数学、统计学、计算机科学等基础理论,还要能够胜任商务、金融、生物、医药等领域的大数据分析挖掘工作[3]。北京理工大学明确提出要培养具有国际视野的大数据系统架构师、算法设计师和分析师三类人才,但在具体的培养环节上也设置了面向其他专业领域的应用分析环节,解决包括智慧城市、医疗和空间大数据等领域中的应用问题[1]。
(二)国内外高等院校数据科学专业课程体系特点
在课程设置上,通过对国内外设置数据科学专业院校的课程体系进行归纳,其课程设置大体可分为基础理论、数据计算、数据分析、领域应用和扩展等几大类[5]。
1.基础理论类课程。这类课程主要介绍正式学习数据科学前的预备知识,是数据科学专业的先修环节,为后面的数据科学知识学习奠定基础,一般由“数据科学概论”等先导课以及数学和计算机类基础课组成[5],如“概率论与统计学”“线性代数”“随机过程”“计算机原理”“数据结构”“程序设计”等课程。
2.数据计算类课程。这类课程主要介绍大数据环境下计算技术、环境、工具与平台,使学生能够掌握Hadoop、Mapreduce、Spark、Storm等基本的大数据处理框架和技术,培养其大数据工程化能力[4-5],如“物联网技术”“云计算技术”“数据管理”“数据存储与检索”“计算机网络”等课程。
3.数据分析类课程。这类课程主要介绍数据分析的基本技术与方法,特别是大数据分析技术,旨在培养学生的数据分析能力和对数据的洞察能力[5],如“数据挖掘”“机器学习”“高级机器学习”“神经网络与深度学习”等课程。
4.领域应用类课程。这类课程主要介绍数据分析技术在行业的实践应用,如“数据驱动医学”“基于大数据的商务智能”“社会管理与分析”“金融与经济数据分析”“舆情大数据分析”等课程。
5.扩展类课程。这类课程主要讲解数据科学中涉及的一些人文和社会类知识,包括与数据应用和数据分析有关的道德、隐私、法律、社会影响等方面的课程[5]。
三、公安高等院校数据科学专业的课程体系设计
(一)公安高等院校数据科学专业人才培养的目标
公安高等院校作为公安行业的高等教育机构,其主要职能是为公安行业培养能够适应公安工作要求、能够遂行公安工作任务的高水平专业人才。近20年来,随着以“金盾工程”为代表的一系列公安信息化项目建设的不断实施和推进,公安机关从传统的汗水警务向情报警务乃至数据警务迅速转变,无论是侦查办案、治安防控、社会管理还是服务民生等业务方向都形成了较为完整的数据环境和数据体系,带动了公安工作效率和战斗力的极大提升。然而与此同时,随着公安工作的数据采集、管理和应用的不断发展,对专业人才的需求也与日俱增。从目前来看,公安机关对数据人才的需求主要集中在两个层面:一是面向业务基础数据,包括感知端、移动端和平台端的数据采集、传输、存储和管理;二是面向各个具体业务方向包括刑侦、经侦、反恐、禁毒、国保、内保、治安、交管、指挥、情报等专业部门的业务数据分析。从这两个层面的人才需求类型来看,前者对人才的需求更侧重于数据工程师,其能力要求为熟悉不同类型的数据采集和传输技术、海量数据管理和检索技术,能够根据业务需求设计相应的数据采集、存储和管理解决方案并组织实现;后者更侧重于数据分析师,其能力要求为熟悉具体的业务流程和业务数据库系统,能够运用各类算法、模型和软件工具开展业务数据的分析,为业务工作提供情报支撑。因此,从公安高等院校设置数据科学专业、培养数据科学人才的必要性和行业需求来看,其人才培养的目标应同时覆盖数据工程师和数据分析师两个方向。
(二)公安高等院校数据科学专业的课程体系设计
根据公安高等院校数据科学专业人才培养的目标类型分析,将公安高等院校数据科学专业划分为数据计算与数据分析两个专业方向,并基于“教、学、练、战一体化”的公安高等院校的人才培养模式和公安一线机关对警务专业类人才“一专多能”的需求,提出并设计两个方向下的公安数据科学专业课程结构体系如图1所示。
图1 公安高等院校数据科学专业课程体系结构
1.专业基础课程。专业基础课程方面,应以打好学生的数据科学基础理论为目标,夯实学生从事数据科学的计算能力和分析能力[7]。数据计算专业方向应重点设置计算机基础方面的课程,数据分析专业方向应重点设置数学原理方面的课程,如“数理统计”“随机过程”“时间序列分析”“空间统计”“图论”“模式识别”“程序设计”等课程。
2.专业必修课程。专业必修课程方面,应以数据科学的专业技术,包括计算框架、算法模型、分析方法为主,着重提升学生的应用能力。其中数据计算专业方向应重点设置包括“云计算原理”“物联网技术”“数据管理”“计算机网络”“NoSQL数据库”“Hadoop技术架构”等在内的技术架构类课程群[7];数据分析专业方向应设置包括“数据仓库原理”“数据挖掘与机器学习”“自然语言处理”“地理信息系统”“社会网络分析”“数据可视化”“计算机视觉”等在内的分析类课程群。
3.专业选修课程。专业选修课程应以拓展学生的专业知识、提升学生的公安业务能力和数据的安全应用与保护水平为主要目标。数据计算和数据分析两个专业方向均应包括三类课程:一是公安业务通识课,主要为使学生掌握公安业务工作的基本知识,建立初步的业务概念体系,使学生充分了解当前公安各业务方向的具体工作内容,为开展公安数据应用和分析实践打下基础。二是学科前沿课程,使学生更好地把握和了解数据科学的发展动态,掌握前沿技术。要围绕大数据计算框架技术、流数据处理技术等数据科学的前沿热点理论及技术发展趋势设置相应的学科前沿课程。三是专业拓展课程,主要围绕着数据安全性要求开设相应的数据安全与法律类课程,如“数据保护技术”“公民隐私保护法律规范”等课程。
4.实践拓展环节。在实践课程设计上,可根据公安具体的业务场景设计相应的实践问题,着重锻炼和培养学生运用知识解决实际问题的能力。数据计算专业方向可要求学生根据市县级公安机关具体的业务工作需求,提出并设计相应的数据采集、传输、存储与计算解决方案等。数据分析专业方向可要求学生根据不同层级公安机关业务部门的情报工作需求,运用学习和掌握的数据分析方法,对具体业务部门的业务数据开展分析、研判和建模等实践活动。
四、公安高等院校数据科学专业课程建设需要解决的主要问题
(一)建立高水平数据科学教学团队
目前,在公安高等院校的专业体系中,已初步形成了数据科学专业建设的基础。例如,中国人民公安大学在安全防范工程本科专业下设立了警务信息技术方向,重点教授公安工作中与数据应用密切相关的知识和技能,包括警务指挥、数据分析研判、应急通信保障、信息安全保障、信息对抗等[8]。但是,从现有的专业师资来看,尚无法满足数据科学专业建设的需求。对此,可采取公安高等院校、大数据企业、公安机关三方联合的方式整合与组建教学力量。一是公安高等院校可通过校外人才引进、校内教学培训等方式,完善和提升校内教学团队水平,并承担公安数据科学专业中的专业基础课、专业必修课和专业选修课中拓展课程方向的教学任务。二是通过高校联盟、校企合作等渠道外聘其他高校或企业数据科学领域专家承担专业选修课中的学科前沿课程的教学任务。三是可通过校局合作关系聘请公安实战单位各业务部门从事数据应用工作的技术骨干民警为驻校教官,承担专业选修课中的公安业务通识课的教学任务。
(二)建立面向公安实战的实验教学环境
实验教学是数据科学专业人才培养不可缺少的环节,对于公安高等院校的数据科学专业建设而言,建立面向公安实战的实验教学环境是提升人才培养质量的重要方式[9]。然而,由于公安实战数据应用场景较多,覆盖了多达数十个业务方向,构建一个完全模仿实战的公安数据科学实验教学环境将面临着极大的硬件、软件和数据的成本压力。对此,可采取因地制宜的方式,根据不同类型公安业务的运行模式和数据应用模式设计和构建合理的实验教学环境。例如,对于交通、指挥、视侦、网安等对实时数据处理具有较强依赖性的业务方向,可依托公安高等院校的模拟城市街区、模拟指挥中心、校园安防系统等已有的物联感知体系构建相应的实验教学环境,使学生在真实的物理环境下开展相应的数据计算和数据分析教学实验;而对于情报、治安、刑侦、经侦、禁毒、反恐等对数据时效性要求不强的业务方向,可基于一般性的计算机实验教学环境设计相应的数据分析教学实验。
五、结语
随着公安业务信息化的深入推进和快速发展,建设公安数据科学专业、培养高水平数据专业人才已经成为公安高等院校面临的重要任务。本文总结国内外高校数据科学专业的人才培养目标和课程体系设置情况,结合我国公安工作对数据科学人才的需求,认为公安高等院校应着力于培养数据工程师和数据分析师。在具体的专业方向上应围绕这两类人才培养目标设置合理的课程体系,其中数据工程师应以数据计算为核心构建专业课程体系,而数据分析师应以数据分析为核心构建专业课程体系。在课程体系的层次上,除专业基础、专业必修课程外,还应在专业选修课程中着力加强对学生公安业务知识、数据前沿技术、数据安全意识和能力的培养。此外,建设高水平的教学团队和贴近实战的实验教学环境对公安高等院校数据科学专业的构建和相应人才的培养也十分重要。