APP下载

基于Selenium技术的大学生精神需求现状分析研究

2021-05-07范起雁

现代信息科技 2021年23期
关键词:爬虫大学生

摘  要:随着大数据时代的来临和大学生日常开展活动数量的骤增,如何应对新时代大学生精神需求变化的多样性,且合理高效地施行大学生思想政治教育改革措施是对思想教育工作的一个重大挑战。书籍阅读是满足大学生精神需求和提高大学生思想素质的重要途径。文章利用Selenium爬虫技术,采集京东图书销售榜数据,对大学生的精神需求状况做分析,通过实验数据表明,大学生所存在的娱乐化,浅显化等问题。

关键词:大学生;精神需求;爬虫;selenium

中图分类号:TP391           文献标识码:A文章编号:2096-4706(2021)23-0027-03

Research on the Current Situation Analysis of College Students Spiritual Needs Based on selenium Technology

FAN Qiyan

(Jiangxi University of Technology, Nanchang  330098, China)

Abstract: With the advent of the big data era and the sharp increase in the number of daily activities of college students, how to deal with the diversity of college students spiritual needs in the new era and how to implement the reform measures of college students ideological and political education reasonably and efficiently is a major challenge to the ideological education work. Book reading is an important way to meet the spiritual needs of college students and improve their ideological quality. This paper uses the selenium crawler technology to collect the data of Jingdong book sales list, analyzes the spiritual needs of college students, and experimental results show the problems of entertainment and superficial manifestation exist in college students.

Keywords: college student; spiritual need; crawler; selenium

0  引  言

随着互联网技术的不断攀升,网络资源模式不斷地推陈出新,信息全球化已经全面地进入了我们的生活,面临各种信息浪潮的冲击下,大学生所处的环境已经发生了改变,精神需求也呈现了多元化,复杂化,虚拟化等特征。近年来,大学生精神需求逐渐成为全国各大高校重点关注的问题,为精确了解新时代大学生精神需求的变化,正确把控培养大学生精神需求导向,引领大学生成为合格的中国特色社会主义接班人,有关对大学生精神需求现状分析的各种方法也随之产生 。

大学生的精神需求分为多个层面,通过不同层面去研究大学生的精神需求可以更加完善的为大学生精神需求问题提出合理性意见,近年来有诸多学者对大学生精神需求类做出研究:曹雪飞通过自我发展需求,人际关系的需求和社会活动需求这三个方面进行研究。张楠通过大学生的人生观,道德观和价值观进行分析凌石德通过其基础性需求,享受型需求和发展性需求进行分析。刘云杰通过发放问卷对大学生的精神文化生活需求进行研究。诸多研究对大学生的精神需求问题的各个层面进行了剖析。本文将建立在上述学者的研究上进行阅读需求对精神需求影响的深度分析。

本文的研究内容为对大学生的阅读种类和阅读习惯进行研究。通过Selenium技术所获得的京东图书阅读数据进行数据分析,挖掘大学生精神需求特征以及在新时代爆炸式信息的影响下所产生的精神需求娱乐化,浅显化等问题,并根据所存在的问题提出健全高校网络体系,开展多种线下活动等措施,此为本文的目的以及作用。

1  Selenium爬虫技术

1.1  算法流程

Selenium是最广泛使用的开源 Web UI(用户界面)自动化测试套件之一,可以模拟浏览器的操作,很大程度上降低了爬虫被服务器识别的概率。Selenium的算法流程如图1所示。设置一个通过selenium驱动的浏览器对象WebDriver,将操作Web元素的API调用转化为一段段Javascript,在Selenium内核启动浏览器之后注入这段Javascript,然后使用driver中find_element属性里的id,xpath,CLASS_NAME,name,tag,class等定位标签查找目的元素,并配合send_keys方法去指定所搜索的目的关键词,运用click方法点击确认搜索。如图1所示。

1.2  具体代码实现

(1)实例化对象。使用ChromeOptions()实例化driver对象,使用add_argument可以添加浏览器相关设置,如设置浏览器窗口大小,后台运行,添加user-agent等等。代码为:

self.options = webdriver.ChromeOptions()

self.options.add_argument(‘--headless)

self.driver = webdriver.Chrome(options=self.options)

(2)输入URL,使用get(URL)方法打开URL的所在界面,然后在搜索框中添加所需查找的内容,并点击确定,爬取过程中应设置休息时间,给页面加载一个缓冲的时间。代码为:

self.driver.get(url=https://www.jd.com/)

self.driver.find_element(By.ID, “key”).send_keys(‘图书销售榜单)

self.driver.find_element(By.CLASS_NAME, ‘button).click()

time.sleep(1)

(3)获取所需的榜单内容。获取html内容通过xpath库实现。进入所在页面后,拉取进度条到底,等待所有商品加载完成再进行提取,通过使用find_element_by_xpath查找目标元素,收集内容并进行存储。部分代码为:

li_list=self.driver.find_elements(By.XPATH,//*[@id=”J_goodsList”]/ul/li)

for li in li_list:

try:

item = {}

item[‘name]=li.find_element_by_xpath(‘.//div[@class=”p-name”]/a/em).text.strip()

item[‘commit]=li.find_element_by_xpath(‘.//div[@class=”p-commit”]/strong).text.strip()

print(item)

(4)保存爬取数据,将所收集的数据存入mongodb数据库,代码为:

self.conn = pymongo.MongoClient(‘localhost,27017)

self.db = self.conn[‘jddb]

self.myset = self.db[‘jdset]

self.myset.insert_one(item)

2  Selenium书籍数据的实验结果

本次利用Selenium获取的实验数据为纸质书籍大众畅销榜TOP10,纸质新品销售榜TOP10,电子书畅销榜TOP10以及京东大学生暑假电子书畅销榜。根据纸质书籍榜结果显示,其中小说类书籍的销售量高,具有影响力的小说上榜书籍多。学习类书籍,励志类书籍占比较高,家教类,投资管理类类书籍占比较低,如图2所示。根据电子书畅销榜分析,通俗小说类书籍所占比例较大,家教类书籍,自然科学类书籍,金融管理类书籍,计算机编程书籍,均占全榜比例较低,如图2、图3所示。

2.1  阅读种类多元专业化

根据图2、图3显示,大部分学生会关注语言学习类,金融管理类,计算机编程类等书籍,表明当代大学生普遍具有较强的自学能力和对未来规划的能力。但过多关注于专业知识的获取会使大学生忽略其个人的精神需求,并且专业化阅读会潜移默化影响大学生的思想观念,认为阅读是具有目的性而非自发性的,这对大学生的精神健康发展是非常不利的。

2.2  阅读内容浅显娱乐化

无论在纸质书中还是电子书中,通俗文学书籍都占有最大的比例,可见通俗类书籍十分契合大学生们消遣娱乐的阅读需求。面对来自各方日益增加的压力,比起晦涩难懂的铭文著作,大学生明显更偏爱于浅显易懂的文章。但这种停留于表面的文章,并不具有太多的思考价值和人文价值,其所含更多的是“快餐式”内容,长期阅读不利于大学生树立正确的思想观,以及培养具有深度的思维方式。大量阅读通俗文学作品也从侧面反映了大学生精神状态的空虚。

3  引导大学生精神需求的策略

3.1  图书馆引进优质书籍同时开展线下优质读书活动

大学生阅读呈娱乐浅显化趋势,部分原因为无法有效篩选优质书籍。为提升大学生对优质书籍判断能力,高校应采取相应措施,在图书馆引入大量经典文学书籍和专业书籍和相应的电子书籍,鼓励大学生借阅,潜移默化的影响大学生的阅读选择。高校亦可在图书馆举办大型读书活动,增加经典图书在高校内的影响力,提高大学生对经典著作的重视程度,进行读书探讨,对书籍进行更加深入的研究理解。

3.2  建立健全高校网络体系

新时代大学生是网络热点传播的重要人群之一,且对网络信息较为敏感,所以高校把控网络信息的有效性是非常必要的。建立健全的网络检测体系,定期通过爬虫技术爬取大学生近期阅读热门书籍,整理并分析大学生近期的阅读热点以及阅读倾向,有助于高校更好地把控大学生的阅读风向,做出相对应的改变。也可以防控不良书籍的传播,从根源上切断传播途径,营造良好的网络环境,培养健全人格的高素质人群。同时,建立高校网络私密交流体系,避免部分学生不愿线下与老师交流所遇到的问题,利用网络的隐蔽性和安全性,更好的深入了解大学生的精神需求并给出针对性意见,引领学生走向正确的人生道路。

3.3  培养学生阅读习惯

现高校均开设众多专业学业课程,可适当增设阅读经典选修课来缓解学业压力,同时也可引领学生培养良好的阅读习惯。选修课可由教师选择优质书籍进行精读分析,带领学生去思考经典中所含的价值。这一做法可以解决因学生专注研究专业化书籍而忽略经典阅读的问题。另外,经典选修课也可以适时推出结合大学生感兴趣类型的经典阅读榜,提高大学生的阅读积极性,给大学生提供阅读指向标。

4  结  论

读书是满足精神需求的重要方式之一,然而阅读浅显化,娱乐化,专业化等问题的出现,使得大学生健康的身心发展受到了挑战,高校必须加强对大学生阅读的关注,进行正确的引导,采取合理的措施,满足大学生的精神需求,鼓励大学生读好书,多读书,培养思想观念正确的大学生,创建读书氛围浓厚的大学校园。

参考文献:

[1] 曹雪飞.大学生精神文化需求的调查研究 [J].安徽工业大学学报(社会科学版),2011,28(2):142-143.

[2] 张楠,崔若瑜.大学生精神需求的状态分析及引领对策 [J].天津中德应用技术大学学报,2021(4):115-117.

[3] 凌石德.论当代大学生的精神需求 [J].湖北社会科学,2014(10):161-165.

[4] 刘云杰,李悄然.当代大学生精神文化需求的新特点、新变化 [J].明日风尚,2017(9):182.

[5] 左莹莹,朱丽,李皎皎,等.大学生阅读现状分析及对策研究 [J].科技视界,2021(24):65-67.

[6] 方英,王富江.互联网环境下当代大学生阅读数据调研与分析 [J].赤峰学院学报(自然科学版),2021,37(6):107-110.

[7] 卫荣娟.数字化下大学生阅读行为及高校阅读推广策略 [J].传媒论坛,2021,4(16):147-148.

[8] 刘立辰.社交媒体时代大学生阅读行为变化及引导策略 [J].湖北工程学院学报,2021,41(5):49-52.

作者简介:范起雁(2001.09—),女,汉族,江西南昌人,本科,研究方向:大数据技术;周倩(2001.08—),女,汉族,江西宜春人,本科,研究方向:深度学习。

猜你喜欢

爬虫大学生
基于Python的网络爬虫和反爬虫技术研究
Python反爬虫设计
大数据爬虫风暴
第29届世界大学生 冬季运动会精彩掠影
基于Scrapy框架的分布式网络爬虫的研究与实现
大学生就业趋势
谁抢走了低价机票
大学生“双创”进行时
暑假调查 45%的大学生仅给自己放十天假
带你进入网络爬虫与反爬虫的世界