大数据 大舞台
——北京科技大学大数据管理与应用专业
2020-10-14供稿崔鸿飞杨建华
供稿|崔鸿飞,杨建华
大数据,无疑是当今各行各业最具热度的概念之一。在2019年热播的影视作品《长安十二时辰》当中,大数据化身“大案牍术”,掀起一股全民了解大数据的热潮。大数据究竟是什么?大数据管理与应用专业为何而生、定位是什么? 北京科技大学的大数据管理与应用(简称北科大大数据)专业有哪些特色?你将在这里融入怎样的学习环境、获得怎样的收获?未来发展将会如何?读完这篇文章,也许你心中的“大数据”和“北科大大数据”,都会更加立体起来。
神奇的“大数据”
大数据是什么?
大数据(Big Data),顾名思义,指“大量”的“数据”。然而,仅仅数据量方面的庞大并不能完全涵盖“大数据”的特点。随着网络技术和存储能力的高速发展,数据量成指数级增加[1],逐渐演变为传统计算方法所很难分析、处理的规模。早在2011年,麦肯锡全球研究所(McKinsey Global Institute,简称MGI)就在其一份研究报告中断言[2],在可预见的未来,企业捕捉到的信息量和数据细节将不断增加,多媒体、社交媒体和物联网的兴起将推动数据的指数级增长。而维基百科对大数据的定义则体现了这种数据指数级增长的现象对生产、研究的影响[3-4],即“大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集”。
大量的数据中往往隐藏着大量的信息,很多信息甚至连数据产生者都无法意识到。比如,一个消费者可能平时并未注意到自己的消费习惯,但却会惊奇地发现,由于对某些商品的浏览行为,自己会常常收到来自购物平台首页或其他网页的广告投放,并且这些投放的确符合了当前购物需求。这种对消费者需求的预测,绝对不仅仅来自于一位消费者的历史行为,而是来自于成百上千万、甚至上亿消费者的购物行为数据,并由数据科学家构建预测模型,让模型去学习这些数据、“理解”其中的规律,才能形成对每一个消费者未来消费行为的精准预判。这只是大数据实力的冰山一角,事实上,在生产、医疗、社会安全等方方面面,大数据中所蕴含的信息,意义都非常重大,将这些信息挖掘出来、并为我们所用,将大大提升社会大众的生活质量。因此,一些学界和业界的研究者也将大数据称为“未来的新石油”[5],以此表明其重要地位,这并不是夸大其词。
与此同时,正如维基百科对大数据的定义中所展示的,由于数据量巨大,很多行业中的大数据,并不能用常用的经典方法进行有效分析,甚至用传统方法进行基本的存储和计算,都是非常困难的,这种情况随着各行业大数据意识的觉醒,在未来会更明显。不掌握有效的大数据管理方法体系,或者不具备大数据分析应用的基本计算思想,面对大数据内含的海量珍贵信息,就无法进行有效利用和挖掘。因此,在未来相当长的一段时间中,大数据管理与分析应用的能力,将成为制约个人、团队乃至整个社会发展的重要因素。为社会培养适合各行各业前沿发展的大数据人才,就是大数据管理与应用专业设立的重要出发点之一。
各行各业中的大数据
通过前面的介绍,我们可以感受到,大数据,并不是扎根于某一行业,而是面向各行各业的交叉应用。看看身边,我们就能发现,大数据的管理与应用,已经融入在生活的各个细节中。
用一个我们非常熟悉的场景作为例子。在一个惬意的周末,你睡到自然醒,换上干净舒适的衣服,洗脸、刷牙,然后吃过早饭,拿起手机,叫上三五好友,坐到沙发里谈天说地,茶几上放着零食供大家随时取用,聊到兴头,也许你们还会打开电脑,一起查一查相关的知识资料。想一想,在这个场景中,我们吃的零食、穿的衣服、用的手机、电脑、沙发、茶几,都来自于哪里?
答案是工业生产线。那么在工业生产线中,就有很多需要用到大数据的地方。比如,在生产过程中,每一台机器都有许多参数,这些参数与产品的质量息息相关。当生产流程非常复杂的时候,这些参数和产品质量之间的规律,可能就无法用一个我们熟悉的数学函数来表示。无法总结这个规律,产品质量的可控性就不足,改进产品、调整参数,就只能依靠工程师的“直觉”来不断尝试。而有了大数据,就不一样了。我们可以建立模型,让它学习很多很多组参数和产品质量的数据对。在进行大量的学习之后,模型就会总结出哪些参数可能与产品质量有关联,工程师们就可以根据这种“直观”的结论,进一步结合自己的经验,小心地调整这些参数,让产品质量的提升研究更有效率[6]。类似的,生产设备的故障排查,也能够依靠大数据,实现从“直觉”到“直观”的华丽转身[7]。
此外,生产出产品之后,往往需要进行质量控制,以往通常是由许多质检工作人员进行人工的筛查;生产过程当中,需要实时监控生产环境的安全情况,这也往往是由专门的安全人员在监控室长时间并且同时观察很多个视频屏幕才能做到的。进行这些工作需要大量的劳动力,并且非常容易产生疲劳,影响工作效率和准确率。而通过收集相应的大数据,构建决策模型,就可以大大降低人工参与的比例,甚至做到无人值守,同时还不会产生疲劳,提升工作质量[8]。
除了生产过程,后续的销售、供应链、物流、仓储,也都需要大数据与大数据分析的参与。我们可以基于以往的销售大数据,还有相关行业的行情数据,来决定生产多少产品既够用、又不造成浪费,还可以去判断把产品卖到哪里,可能卖出更好的价格。我们也可以构建历史和当前各地市场供需的大数据集,分析供应链、物流、仓储应该如何配置,才能使成本更低、物流效率更高[9]。
商业领域是我们平时接触较多、能比较直观感受到大数据魅力的场景。比如,新的一天,打开电脑,会有最感兴趣的资讯映入眼帘;打开购物网站,最需要的产品会自动出现在最醒目的位置;想看个电影,发现视频首页推荐的作品果然最喜欢,忍不住买买买。正如上一节中提到的,这些都是模型基于大量消费者的行为数据总结出来的[10-11]。
舆情安全也是一个与我们生活息息相关的大数据应用场景。自媒体时代,人人都是信息源,我们在各种社交平台上所发布的信息,都会成为我们的一个个标志和符号,它们会组合成一幅关于我们性格、偏好的画像,让别人,甚至让计算机模型了解我们[12]。很多人在发布信息的时候不负责任,甚至故意散布假消息哗众取宠,而且不仅是文本,有一种深度视频合成算法叫Deepfake[13],可以把一个人的脸换到另一个完全不相关的人身上,他的音容笑貌被完全模仿,肉眼几乎看不出任何区别,这就是由模型大量学习视频和人脸数据,构建样本空间。假新闻、假消息、假照片和假视频,对公众舆论的健康和安全都有非常负面的影响,于是就有了很多方法,来鉴别这些假的媒体信息[14-16]。
医疗领域也是大数据应用的重要领域之一。有了大数据,医院不再人潮涌动,智能导诊、智能诊疗,一切都能变得井然有序。基层乡镇以往常常被认为诊疗水平有限,而现在只需要一套智能诊疗设备和程序,就能大大提高诊断的正确率。今年的新冠肺炎疫情中,病原体怎么扩散、怎么传播,有了大数据,一切都能在我们掌握之中。成千上万医务工作者的无私付出,再加上疫情相关大数据给出的预防和筛查方向作为加成,才成就了我国疫情迅速控制的“中国奇迹”。
上面这些,在大数据的舞台上,只能算作冰山一角。如果你有心观察,会发现很多有趣并且神奇的由大数据科学提供给我们的便利。而如果你加入了大数据管理与应用专业进行学习,也许这些神奇,未来将会由你亲手创造。
漫步北科大的大数据专业
专业特色与优势
◆ 专业培养目标紧跟时代需求
北京科技大学的大数据管理与应用专业,研究人工智能、新一代互联网背景下的数据科学、大数据管理、分析技术与方法,并对工业、商业、医疗行业等多领域、多学科进行交叉赋能。在这里,你将学习到大数据分析平台的部署、管理、运维技术,画像分析、关系网络分析等大数据集成分析技术、流计算与智能算法,以及面向产业的大数据领域智能应用知识。我们以社会的时代需求为导向,希望培养出一批掌握现代管理理论、数据管理、分析技术与方法,能够解决数字化时代产业智能管理的问题,利并用商务数据进行精细分析、实现业务智能的管理决策高级专门人才,成为社会不断向前发展的新动能。
◆ 先发优势积淀教学经验
北科大大数据专业,于2019年正式获批成立,是全国获批大数据管理与应用专业的第二批高校(第一批只有五所学校)。不仅如此,在此之前,北京科技大学经济管理学院其实已招收了两届方向班,积累了丰富的教学经验。可以说,在全国各个院校的大数据专业中,北科大的大数据专业,是相当具有先发优势的。同时,北科大大数据专业,依托经济管理学院的管理科学与工程系设立。在正式设立大数据专业之前,院系已有相当多的教师,对大数据的分析和应用有了非常深入的研究,并已将其融入到日常教学中。因此,北科大大数据专业,有备而来,将直接为同学们提供一场长达四年的知识盛宴。
◆ 院系及学科背景确保专业质量
图 1 经济管理学院计算机实验室(a)与独立的图书馆(b)
北科大大数据专业,依托经济管理学院优良的教学条件(图 1),具有本科生教室、案例讨论室、学术研究室等教学配置,拥有7个专业实验室、2个研究实验室、1个数据检索实验室,配有各类教学软件和丰富的经济、金融、管理数据库,并设有钢铁生产制造执行系统技术教育部工程研究中心、北京市企业低碳运营战略研究基地、北京市实验教学示范中心等教学、实验平台,这些都将成为同学们展开大数据学习与应用实践的有力后盾(图 2、图 3)。同时,北科大大数据专业所属的“管理科学与工程”是北京市重点学科,2019年QS排名进入世界前300。而管理科学与工程系的另外一个专业,信息管理与信息系统(简称信管)专业,作为经济管理学院的老牌专业,是教育部首批国家一流专业建设点、北京市教委认定的北京市特色专业。大数据专业和信管专业协同发展、共同促进,将为两个专业质量的提升,贡献更多的力量。
◆ 师资力量雄厚护航学生成长
北科大大数据专业拥有优秀的师资保障:教师中96%以上具有博士学位,90%以上有海外名校留学研修经历,并拥有北京市教学名师2人、新世纪人才2人。教师中1人入选爱思唯尔(Elsevier)2014年中国学术论文高被引学者榜单,2人获评教育部新世纪优秀人才,2人获评北京市教学名师。老师们的研究方向包括但不限于:商务大数据分析、大数据与决策分析、工业生产大数据分析、企业大数据信息管理、物流与供应链大数据分析、数据仓库与大数据挖掘、医疗大数据分析、生命组学大数据分析等,近5年获得国家自然科学基金项目14项,其中包含重点项目2项,发表学术论文300余篇。可以说,北科大大数据专业的老师们,在学校教学与科研“薪火相传”的优秀文化中都是上得讲台、写得paper(论文)的好榜样,在北科大大数据专业进行学习,同学们不仅可以学到基本的知识,还可以紧跟科研前沿,同学们通过积极参与研究,一定可以获得非常有益的学习体验。
图 2 经济管理学院各级研究机构
图 3 北京市企业低碳运营战略研究基地
培养计划
为了确保同学们的学习效率和质量,学院精心为大数据专业的同学们设计了“通识→学科平台→专业核心→实践”的递进式课程培养体系(图 4)。课程设置经业界专家论证,获得教学委员会的认可(图 5),学院将继续努力、持续改进课程体系,以适应日新月异的技术发展和社会需求。课程设置采用了多个课程模块组,设有国际商学院认证的学科基础必修课与各类教学实践,设有专业必修课与专业选修课。专业开设商务数据分析、人工智能、机器学习、数据库原理、数据结构与算法、数据可视化、大数据基础设施、大数据分析与应用、多元统计分析、数据仓库、社会媒体分析、智能搜索引擎技术、Python程序设计基础、R语言统计分析、并行计算与分布式计算、决策优化分析方法、智能制造与工业大数据、移动互联网应用与实践等课程,为同学们提供丰富的知识基础与实践平台。
图 4 北科大大数据专业课程设置
图 5 学校及企业专家论证培养方案
实践实习
大数据学习重在应用。北科大大数据专业秉承着经济管理学院优秀的实践、实习传统,并且在学校浓厚的工程技术底蕴中,形成了“技术实践”与“社会实践”双管齐下的鲜明特色。
在技术实践方面,北科大大数据专业拥有一流的实验设施和实践平台:200核高性能服务器;300T的专用网络存储设备;万兆交换机以及云存储管理平台;可以同时供2个班(60名学生)开展大数据分析相关实验;还有新建设中的大数据分析实验室。强大的算力保障,与商务数据分析、数据库原理、数据可视化、人工智能、机器学习等专业核心课程相辅相成,并在商业分析实践、移动应用开发等丰富的技术实践课中给同学们提供了强有力的支撑。
为加深学生对专业的理解,培养学生学以致用的意识,明确未来学习的方向,学院为每位同学设置了为期一周的认识实习和为期五周的专业实习。认识实习通过参观、访问和现场座谈,帮助学生通过短暂的时间,快速地建立对企业或行业的认识轮廓,迅速扩充视野。专业实习则需要学生沉下心来,和企业进行双向选择,通过在企业进行超过一个月的工作实践,体会业界实践中的灵感和问题,建立较为深入的实践认知。认识实习和专业实习长短结合,从广度和深度两个维度,培养学生的实践能力。2019年7月8日下午,作为认识实习的一部分,北京科技大学2017级大数据专业全体同学来到位于望京绿地中心的阿里巴巴集团北京总部,与阿里健康相关专家进行了企业认识与实践活动(图 6)。同学们不仅了解到了阿里巴巴集团在电子商务领域取得的傲人成绩,也了解了其在金融、健康、物流、云计算、无人驾驶、智能家居、大文娱等领域的累累硕果,体会到大数据在各行各业中的神奇价值。通过与阿里健康相关专家进行的座谈交流,同学们也深入学习了健康大数据应用领域的相关情况。这样的一次次实习,可以帮助同学们从不同的维度塑造对大数据行业的认知,将知识体系立体化,扩展想象和思维空间,为尽早确定未来的发展方向提供帮助。
图 6 北科大大数据专业师生参观阿里巴巴集团北京总部
除了丰富的实习活动,学院还有丰富的实践课程和比赛,在“以赛促学”、“以赛促创”的氛围中,不断激发同学们的创业热情。在如iCAN国际创新创业大赛、“互联网+”大学生创新创业大赛、“挑战杯”首都大学生课外学术科技作品竞赛、北京科技大学“摇篮杯”学术科技作品竞赛、“摇篮杯”创业竞赛等各级别赛事中,学院都获得了非常优异的成绩。此外,为鼓励和支持学生实体项目的落地和转化,“经管创业实践营”项目于2015年正式启动,至今已连续举办4届,并得到了校友的大力支持,成立了专门的“经管创业实践基金”,组建了专业的“创业导师团队”,至今累计支持19支创业团队、提供支持经费近40万元。
为更好地护航同学们的实践成才,学院积极挖掘优秀校友资源,并以此为着力点,积极搭建“专业能力培养(论坛讲坛)—创新创业支持(创业实践营)—成长激励帮扶(校友捐资)—新生引领计划(成长导师)— 实习就业引航(就业实习平台)”的全过程育人平台。“教师引导”加“校友启航”,让同学们在校内校外都能有充分的锻炼机会,在象牙塔中埋头学习也能建立丰富的社会视野。
国际合作与交流
作为大数据专业的依托学院,经济管理学院高度重视国际合作与交流工作,一直将国际化发展作为我院的核心战略之一。早在2013年,经济管理学院就顺利通过英国工商管理硕士协会(The Association of MBAs,简称AMBA)认证,并于2016年6月通过再认证,取得了有效期5年的最长认证期。2018年2月,学院正式通过国际商学院协会AACSB(The Association to Advance Collegiate Schools of Business,简称AACSB)国际认证,北京科技大学成为国内第19家、北京第5家通过AACSB认证的大学。这标志着北京科技大学经济管理学院的影响力在国际同行间所受到的认可。
经济管理学院扎根国内并不断扩展国际视野与影响力,不仅积极参与国际学术会议,还积极作为发起人和组织者,邀请海内外学者齐聚一堂,交流学术成果。例如,2019年6月30日—7月2日,由经济管理学院主办、深圳人工智能与数据科学研究院协办的“第七届智慧健康国际会议(ICSH 2019)”在深圳顺利召开(图 7),来自国内外近80位专家学者出席了此次会议。此次会议以“大数据时代的智能健康”为主题,针对大数据在医疗领域中的应用,共接收论文38篇,设置了1个主会场和8个分会场进行研讨。爱荷华大学樊卫国教授主持了开幕式,亚利桑那大学Hsinchun Chen教授、香港城市大学Kwol Leung Tsui教授、马里兰大学帕克分校Guodong(Gordon) Gao教授和WeGene 微基因CEO Gang Chen博士分别做了大会主题报告并与参会代表们积极交流。相信在不久的将来,有了越来越多的同学加入大数据专业,我们将活跃在更多的学术舞台上,在更多的领域、从更多的角度上,为国内外大数据学术研究贡献更多力量。
经济管理学院还经常邀请国内外知名学者和企业的优秀管理者来学院讲学,通过与这些专家学者的互动,学生们能够了解到管理理论与实践发展的最新动向,学习到更多的先进理念和前沿知识,对于帮助学生形成国际化视野具有积极的作用。近3年来,邀请国外知名专家学者占到学校邀请学者总数的20%左右。此外,学院重视本科学生国内外交流学习,积极创新思路和拓展渠道,促进学生国内外交流学习。在国内学生交流学习方面,主要派出的学校有中国海洋大学、湖南大学、华东理工大学、华南理工大学、中南大学等。在学生国际交流学习方面,通过与国外高校的校际交流、访学研究、联合培养本科生双学位,短期进修等各类项目派出在校生赴国境外高校拓展海外经历。2015—2017年累计约有180名在校生获得了海(境)外交流机会,交流的30余所学校遍布英国、法国、德国、瑞典、加拿大、日本、爱沙尼亚、奥地利等多个国家和地区。
大数据专业毕业后做什么?
图 7 ICSH2019参会代表合影留念
大数据在各行各业中都扮演着重要的角色,加上各行业日益认识到大数据的神奇作用,因此近年来,大数据专业的就业前景尤其广阔。其中,互联网行业由于数据产生活跃、数据分析需求高,对大数据人才的需求非常迫切,并且在我国互联网用户基数巨大,大数据专业一直保持着蓬勃发展的势头。同时,大数据人才的舞台,远远不限于互联网公司。在业界,大到500强企业,小到初创公司,无论是传统实业还是金融业,也都需要大量的大数据专业人才;而随着大数据产业的不断发展,智慧医疗、智慧城市等概念的研究越来越深入,一些政府部门、医院和高校、科研院所,也都迫切需要大数据领域的人才。因此,在大数据专业,除了学好数据挖掘基本功,体会其在各个场景中的应用特点,最重要的就是不断求索自身兴趣,找到感兴趣的方向,只要找到方向,就会有施展拳脚的一片天地。
北科大大数据专业,作为国家近年刚刚成立的新专业,即将迎来第一批毕业生。我们可以从关系密切的兄弟专业也就是信息管理与信息系统(信管)专业同学们的就业情况中,窥出大数据专业毕业后的发展方向。从信管专业的本科毕业去向来看,总就业率超过95%,其中读研率为54%(国内读研率34%、国外深造率20%),另外有45%的同学直接就业。除北京科技大学本校外,选择在国内继续深造的毕业生去向包括清华大学、中国科学院大学、北京航空航天大学、北京理工大学、对外经贸大学、中央财经大学等等,赴国外深造的毕业生去向包括美国加州大学伯克利分校、美国约翰霍普金斯大学、美国卡内基梅隆大学、美国伦斯勒理工学院、英国伦敦国王学院、英国伯明翰大学、英国曼彻斯特大学等知名学府。可以说,在北科大大数据专业,无论是想专攻学术走上科研道路,还是想踏入社会成就一番事业,4年的本科专业学习都能让每一位同学自信地做出选择。