APP下载

《网络爬虫》课程中思政元素的融合与实践

2021-07-30马庆祥

科学咨询 2021年18期
关键词:网络爬虫爬虫网页

马庆祥

(重庆工商职业学院 重庆 401520)

引言

随着互联网的飞速发展,各个行业产生了海量的数据信息。传统以处理器为中心的数据采集方法,由于其存储、管理的数据量相对较小,并不能很好地进行庞大数据的采集,而网络爬虫的出现,使这一难题得以解决,能够实现对各种来源数据的采集,从而减轻了数据采集人员的工作量,提高了抽取网页数据的效率。本文是以《网络爬虫》中的部分典型工作案例为研究对象,实践并探讨了如何将思政元素合理有效地融合进该课程之中,以求帮助大数据相关专业任课教师找到更多专业课程与思政元素融合的思路和方法。

《网络爬虫》是高职院校大数据技术与应用专业、软件技术等专业的一门重要的专业课程。课程教学对象是大二学生,学生已经具有一定的大数据相关理论的基础和网络爬虫相关应用技术的基础。《网络爬虫》的主要内容包括数据采集的基本概念和基础理论知识、网络爬虫的主要采集方法和手段、网络爬虫的应用领域和前沿知识等。

为了积极响应国家、教育部在构建全员、全程、全方位育人格局的形态。并将思想政治理论教育融合到专业课程教学中去,形成真正意思上的协同效应。把“立德树人”作为教育的根本任务进行课程开发与教育教学,是目前理工类专业,尤其是信息化学科方向的相关专业在课程教学改革方面研究并探索的重点领域。

一、课程典型工作案例教学目标

以本系列课程中,“爬取网页数据并将结果保存到指定文件”典型工作案例为研究对象,先进行教学目标分析。

知识目标:了解什么是XPath,掌握XPath环境的安装,重点掌握XPath基本语法,理解掌握正则表达式的概念,能熟练应用正则表达式的基本语法,理解正则表达式的匹配原则。

技能目标:能够熟练构造lxml,使用XPath进行网页数据的提取,掌握使用正则表达式爬取网页信息并拆分网页信息。

二、课程思政目标

《全国高校思想政治工作网》是高等教育出版社主办,教育部主管,教育部思政司指导的全国高校思政工作的资源集散库、思想文化策源地和宣传舆论风向标平台。学生在进行专业课学习的同时,兼顾接受思想政治内容的熏陶。通过《全国高校思想政治工作网》的示范引导、辐射带动作用,让学生在使用爬虫技术对其进行数据抽取的每个环节中进行正向信息的获取、正确舆论的吸收和符合时代主旋律的节奏同步!同时,学生在获取数据后,可利用前端技术、网页开发技术或移动开发技术,将获取到的信息、数据,以网页、微信公众号、小程序等形式进行二次发布和展示。既起到了弘扬思政正能量的作用、又起到了技术经验交流、资源纳集、技术服务训练等拓展学习实践的目的[1]。

三、专业教学过程中思政元素的融入

(一)结合典型工作案例的课程思政环节设计

本次选取爬取的对象网页为全国高校思想政治工作网首页:

https://www.sizhengwang.cn/,具体采集抽取的内容为首页中导航模块中的文字内容。

图1:《全国高校思想政治工作网》首页导航模块

具体采集方法如下:

第一步,为谷歌浏览器安装XPath-Helper插件

图2:已安装XPath-Helper插件的Chrome浏览器

第二步,使用XPath-Helper将导航模块中的具体文字内容进行定位抽取

图3:使用XPath-Helper进行目标数据的标签定位

第三步,抽取出目标数据,并将数据保存到指定的文件中去。

图4:抽取并保存数据

(二)实现教学设计的具体方法

图5:具体代码实现

四、结束语

将《网络爬虫》这门专业课程内容和“思政元素”有机结合,可在一定意义上升华教学的目的和意义。让学生贴近时代主旋律并利用技术手段和工具方法,创造价值,实现自我提升,这是一件利在当代,功在千秋的好事。授课教师可以通过案例研讨法、读书指导法、操作示范法、探索讲授法、网络教学法等多种教学形式,促进学生的全程参与和自主探索,在潜移默化中将社会主义核心价值观植入当代青年学生的骨髓与血液[2]。

猜你喜欢

网络爬虫爬虫网页
利用网络爬虫技术验证房地产灰犀牛之说
基于Python的网络爬虫和反爬虫技术研究
基于CSS的网页导航栏的设计
利用爬虫技术的Geo-Gnutel la VANET流量采集
基于URL和网页类型的网页信息采集研究
大数据环境下基于python的网络爬虫技术
炼铁厂铁量网页数据获取系统的设计与实现
基于社会网络分析的权威网页挖掘研究
主题搜索引擎中网络爬虫的实现研究
浅析如何应对网络爬虫流量