基于情感分析算法的子女家庭教育问题研究
2021-02-19武君石媛媛
武君 石媛媛
摘 要:文章以统计学和非结构化数据分析为理论依据,以统计软件为手段,分别从知乎和今日头条两个平台选取有关我国子女家庭教育问题的相关文本数据,从数据层面对家庭教育的意见问题进行文本情感分析和LDA主题建模,以此了解我国子女家庭教育出现问题的原因和特征,提出相应改进建议从而促进子女在家庭中健康茁壮成长,也为文本情感分析技术在教育领域的应用提供实践参考。
关键词:子女家庭教育;文本情感分析;情感词典
中图分类号:TP391.1 文献标识码:A文章编号:2096-4706(2021)13-0087-04
Research on Children’s Family Education Based on Emotion Analysis Algorithm
WU Jun, SHI Yuanyuan
(School of Finance, Xi’an Eurasia University, Xi’an 710065, China)
Abstract: Taking statistics and unstructured data analysis as the theoretical basis and statistical software as the means, this paper selects relevant text data on children’s family education in China from the two platforms of Zhihu and Today’s Headlines, and carries out text emotion analysis and LDA subject modeling on the opinions of family education from the data level, in order to understand the causes and characteristics of the problems in children’s family education in China, put forward corresponding improvement suggestions, so as to promote the healthy growth of children in the family, and also provide practical reference for the application of text emotion analysis technology in the field of education.
Keywords: children’s family education; text emotion analysis; emotion dictionary
0 引 言
国内外文献重点探讨了农民工子女教育公平问题现状与对策研究和基于文本情感分析算法在不同领域的研究。对于农民工子女教育现状的研究一般采用相关政策文本分析,研究家庭关系、家庭收入对子女教育的影响,农民工子女教育现状剖析,农民工子女教育不公平现象的原因分析等。对于文本情感分析算法的研究,一般步骤为先爬取带有情感色彩的主观性意见文本,然后基于该意见文本进行情感信息提取,可视化呈现、倾向性分析,最后提出相应的改进建议等。“十四五”规划中明确强调到二○三五年基本实现社会主义现代化远景目标,其中教育问题仍是需要关注和解决的社会问题。在大数据、人工智能背景下,教育大數据时代已到来,教育大数据分析势在必行,因此有必要将数据挖掘算法引入到教育领域进行深入研究,本项目就是为文本情感分析技术在教育领域的应用提供实践参考。
1 理论综述
1.1 我国子女家庭教育现状
中国虽然有着重视家庭教育的优良传统,但是,目前我国子女家庭教育现状不容乐观,存在许多认识上的误解和实践中的错误做法。家长的教育观念影响着孩子的成长和发展,但当今父母的教育观念却存在着很多误区。例如,只把孩子的考试分数当作首要目标;只关心孩子的身体健康,却忽视孩子的心理健康等,这些错误的观念严重影响孩子的健康成长。
1.2 情感分析算法的介绍
情感分析是指通过文本来挖掘人们对于一些热门事件、某个组织、个人、产品或服务等产生的观点、态度、情感倾向等。现阶段关于情感分析方法主要有两类:基于情感词典的方法,主要依靠现有的情感词典或领域词典,以及主观文本中带有情感极性的语句来判断句子的情感,通过计算情感值来作为判断文本最终情感倾向的依据。基于机器学习的方法,主要是使用机器学习的方法,将情感分析任务作为一个分类问题进行处理,通过选取有效特征数据来完成分类任务。本文基于情感词典方法研究我国子女家庭教育问题,为情感分析技术在教育领域的应用提供实践参考。
2 实证分析
2.1 数据来源
本文运用八爪鱼软件从知乎和今日头条两个平台上抓取200条不重复的有关我国子女家庭教育问题的相关文本数据,包括标题、时间和内容三个字段,将每篇文本内容作为主要研究对象。
2.2 数据预处理
利用JiebaR包进行分词,将句子切分成一个个单独的词,经过分词处理后200篇文章的内容变为“词+空格+词”的表现形式,随后把句子当中出现频率高却又没有实际意义的停用词去掉。本文基于四川大学机器智能实验室停用词库、中文停用词表和百度停用词表构建了包含4 934个词的词典,将无用的停用词去掉。
2.3 计算关键词
词频体现了同一类文档中同一特征词是否高频的特点,而逆向文档频率则认为一个特征词在文档中出现的频数越小,其文档类别区分能力就越强。本文通过计算TF-IDF的值来说明这个词是关键词的概率。计算公式为:
TF=某个词在文章中的出现次数/该篇文章的总词数 (1)
IDF=log(语料库的文档总数/包含该词的文档数+1)(2)
TF_IDF=TF·IDF (3)
经过处理后得出200篇文档中的关键词共有63 429个,为提炼出每个文档中TF_IDF最高的n个词,分别选取200篇文档中每篇出现频率最高的前50个词,如图1所示。
由图可以看出,“爸爸”“大学”“成功”“成绩”等词在文中出现的频率很高,表明如今的家庭教育中广泛存在的一个问题,母亲成为家庭教育的顶梁柱,父亲通常在旁辅助,而有些父亲直接不参与教育,还有大多数家长只关心孩子的成绩,把每次的考试分数当做评价优劣的标准,这也是目前的家庭教育中存在的一个很大的问题。同时还出现“打骂”“棍棒”“分歧”“吵架”“愤怒”“暴力”“干预”“挫折”“犯错误”等词,这些负面词严重影响子女的心理健康。
2.4 LDA主题模型
经过数据预处理和计算关键词后,需对文本内容进行话题检测。LDA模型是一种文档主题生成模型。基于结果,我们得到这200篇文本内容都是围绕“孩子”“父母”“教育”这三类话题展开的,本文设置话题数量为3,对文本进行话题检测。LDA主题模型输出的结果如表1、图2所示。
结果表明,每类话题中所占分布比例最大的前10个词中,“孩子”“教育”“父母”“家长”“家庭教育”这几个词占比较大,尤其是“孩子”。说明这些文档中都在重点描述孩子的教育问题和家庭相关的内容。
2.5 情感分析
本文基于台湾大学NTUSD简体中文情感性词典和知网Hownet情感分析词典构建了包含21 298个词的情感词典,对这两个词典进行了汇总、查重、合并,最终使用的情感词汇库中含有9 867个中文正面情感词语和11 431个负面情感词语。对正负情感词进行权重设置,根据每个情感词表达的情感意义强度,分别将它们分成5类。正负情感词的第一类词汇属于情感表达很强烈的成语、动词、形容词;第二类词汇属于正面赞扬或负面批评的情感表达词语;第三类词汇相比第二类词汇的情感表达较弱;第四类是普通属于正面意思或负面意思的词语;第五类词汇则是一些正面或负面的名词或单独字。其中正面情感词权重分别赋值为+5、+4、+3、+2、+1,负面情感词权重分别赋值为-5、-4、-3、-2、-1。情感得分和为正值归为正面类,得分和为负值归为负面类。
这里分别选取正负情感词每一类的前5个情感词汇,如表2、表3所示。
2.6 情感得分
基于构建好的情感词典读取其情感强度,计算正面情感和负面情感得分,用正面情感得分减去负面情感得分,得到句子的情感总分,分别计算出200篇文本的情感权值和。这里选取前50篇文本情感得分和,如表4所示。
200篇文本经过计算后,共有170篇得分大于0,29篇文本得分小于0,1篇文本得分为0。其中把得分大于0的文本归为正面类,小于0的文本归为负面类,等于0的文本归为中性类。200篇文本情感倾向占比如图3所示。
由图可知,绝大多数关于我国子女家庭教育问题的相关文本都属于正面类的,关注点都在于家庭教育对子女成长的重要性,只有好的教育才能培养出好的孩子,说明人们对于解决家庭教育问题抱有正面支持的态度。极少数的文本属于负面类,对此呈消极的态度,指出我国子女家庭教育存在诸多问题,影响子女成长。
2.7 负面情感分析
为分析负面文本所闡述的问题所在,选择29篇负面文本并绘制词云图,如图4所示。
由图4可以看出,文本中频率较高的词汇有:“焦虑”“成绩”“漠不关心”“情绪”等,其中包含许多负面词汇:如“暴躁”“玻璃心”“吵架”“溺爱”“嘲笑”“缺乏自信”“矛盾”等,这些词汇都极大地表明目前我国子女家庭教育存在诸多问题。
3 结 论
本文利用情感分析算法,从实证角度分析得到目前我国子女家庭教育中存在的诸多问题,针对这些问题提出以下几点建议:
(1)家长定位好自己的角色,给予孩子最大的安全感。对孩子来说最重要的是父母的陪伴,而不是物质上的满足,父母只有定位好自己的角色,才会更有利于孩子的成长教育。
(2)多个角度看待孩子。不以成绩论孩子,更重要的是学会怎样做人、怎样学习、怎样生活,培养孩子动手创造能力,获得素质教育。
(3)树立正确的家庭教育观念。每个人都会犯错,面对孩子犯错时,家长应该采取正确的方法来对待。言中有爱,耐心教导,尊重他们,同时也不要过度溺爱。
(4)营造和谐的家庭氛围。家长教育孩子时应该以身作则,用实际行动来做示范,不乱发脾气,努力营造和谐亲切的家庭氛围。
参考文献:
[1] 张威.中国家庭关系和家庭教育的结构性特征与问题分析--基于华仁社会工作发展中心的家庭教育咨询案例分析 [J].社会工作,2015(5):11-54+125-126.
[2] 秦昌才,郭斯雨,刘译聪.家庭经济资本对子女教育获得的影响[J].福建江夏学院学报,2019,9(5):16-23.
[3] 刘保中.“扩大中的鸿沟”:中国家庭子女教育投资状况与群体差异比较 [J].北京工业大学学报(社会科学版),2020,20(2):16-24.
[4] 朱娅洁,白珂.家庭中子女受教育不平等问题分析 [J].环渤海经济瞭望,2019(3):121.
[5] 张娜,柳运昌,王若男.基于文本情感分析的社交媒体数据挖掘 [J].河南城建学院学报,2019,28(5):74-79.
作者简介:武君(1989—),女,汉族,山东潍坊人,讲师,硕士研究生,研究方向:教育大数据分析、文本挖掘分析。