APP下载

基于LS-SVM的非法律专业大学生法律素养研究

2020-02-01段兴华张小华孟田华黄荣

现代计算机 2020年35期
关键词:被调查者问卷样本

段兴华,张小华,孟田华,黄荣

(山西大同大学物理与电子科学学院,大同037009)

0 引言

中共中央、国务院曾于2004年出台文件以期提升我国大学生法律素养水平并加强其思想政治教育观念,而到2013年,我国大学生甚至青少年的违法犯罪行为不仅没有得到遏制却似乎愈演愈烈。因此,通过科学手段全面提升和改进大学生的法律素养,不仅是目前全社会的迫切需求,更是对党和国家出台各项教育政策以及依法治国政策的强有力落实。当前学术界,对于大学生的法律意识[1-3]、法律素质、法制思想教育以及大学生的违法犯罪行为的研究较多,而对于非法律专业大学生法律素养问题的研究较欠缺[4-6]。文本针对非法律专业大学生的法律素养情况,进行问卷调查和SVM预测模型研究。

1 LS-SVM简介

SVM是一种有坚实理论基础的新颖的小样本学习方法,它在小样本训练集上能够得到比其他算法更好的结果[7-9],且SVM泛化错误率低,具有良好的学习能力,学到的结果具有很好的推广性,因此,它是适合于对本文有限样本数据的研究的。LS-SVM(Least Squares Support Vector Machine)是最小二乘支持向量机的回归和模式识别软件包。Windows系统的可执行文件和源代码都为该软件所配备以便使我们能够轻松进行操作和应用。LS-SVM是原标准支持向量机的引申和扩展[10-11],最小二乘损失函数的设定是其对原支持向量机性能的一大改进,再通过其他设定的提升,这样使求解问题也更为快速准确。因此,它也被广泛应用于回归模型的预测和研究中[12-13]。LS-SVM有五种常用核函数,其中线性核函数最为常用,但对于它们在程序中的选择问题,一般没有固定解,还需要对比择优。LS-SVM的预测功能目前主要被广泛应用于股市预测、风速风功率预测、话务量预测、焦炭强度预测、养老保险满意度预测以及舆情分析预测等[14-17],但尚无对法律素养方面的相关研究。本文即通过将问卷调查与支持向量机相结合来对大学生法律素养情况进行研究,进而探究非法律专业大学生法律素养水平现状。

2 抽样问卷调查

2.1 调查对象和内容

本实验抽取了山西大同、太原、临汾、晋中和忻州市部分高校的非法律专业的各年级大学生,发放问卷总数1000份,收回有效问卷966份。本问卷的30道题目先对被调查者的基本信息(性别、年级、专业)进行收集,再从法律素养的三个方面法律知识、法律意识和法律知识应用能力来展开讨论,以方便最终对于山西地区非法律专业大学生法律素养现状的研究分析。

2.2 问卷结果初步分析

分析所回收问卷的结果显示,男女占比分别为41.81%、58.18%,说明被调查男女比例基本均衡;被调查学生的年级和专业分布如图1和图2所示,主要以低年级的经管类、理工类和文史类学生为主。

图1 各年级人数占比图

图2 各专业人数占比图

统计问卷三方面结果时,我们先将问卷调查各问题选项按照能够体现被调查者法律素养的高低程度进行打分标记,体现程度越高的选项标记的数字越大。对于某一单项选择题来说,例如,问题为“您认为您对法律基础知识的掌握程度怎样?”,A项“非常好”,B项“还不错”,C项“一般”,D项“完全不会”,观察选项可知,“A”、“B”、“C”、“D”对于法律素养体现程度依次由高到低,故用数字标记为“4”、“3”、“2”、“1”;而对于某多项选择题来说,若问题为“下列属于法律部门的是?”,A项“民商法”,B项“经济法”,C项“社会法”,D项“刑法”,E项“宪法”,F项“诉讼法”,观察上述选项可知,六个选项都是该问题的正确答案,所以被调查者选定选项越多,则得分越高,选择一个选项标记为“1”,两个选项标记为“2”…以此类推。运用上述方法即可将所有问卷选项结果转化为数字,再将三部分问卷分数分为差、中、良、优四个等级:

总体来看,位于“差”等级的人数占总被调查者人数的10.48%,“中”等级人数占74.26%,位于“良”等级的仅占48%,达优秀的占7.61%。对三个方面进行分开统计的结果如图3、4、5所示。

图3 法律知识中各分数占比图

图4 法律意识中各分数占比图

图5 法律知识应用能力中各分数占比图

观察以上三图可知:被调查者法律知识、法律意识和法律知识应用能力三方面的达标率(达“优”和“良”等级总人数)都不足30%,达优秀者更是少之又少。从法律知识部分的问卷分数来看,被调查者对问题“我国有几部大法?”的回答中,有67%的人选择了D项4部法律;在对问题“下列属于法律部门的是?”的回答中,95%的人不能完整地选择所有正确选项,这说明被调查者对于法律的构成体系、对于部门法的了解都很浅显甚至有着错误的认识;在法律意识方面,低分率明显降低,在对问题“如果由于某些因素(金钱、权利等)致使一些法律案件不能得到公正处理,此时你会?”的回答中,90.17%的人都选择了C项“依然相信法律,并且希望通过自己的绵薄之力为法律的公正贡献力量”,说明其主观法律意识并不薄弱,而对问题“如果您的学校因为您没有过英语四级而不发学位证,你认为该行为是否合法?”的回答中,只有16.66%的人选择“否”,说明被调查者虽有信仰法律的意愿,但对某些行为是否合法却不能正确区分;在法律应用能力方面,对问题“在生活中遇到纠纷时你会选择用什么手段解决?”的调查中,62.22%的学生选择私下自行解决,而只有28.86%的学生会选择用法律手段解决纠纷,说明大多数同学并不具备法律思维,不会适时恰当地使用法律手段维护权益。总言之,该地区非法律专业大学生法律素养水平较低,学生对所学法律知识的实践应用能力不强,法律素养各方面水平都有待提升。

3 LIBSVM模型预测

3.1 样本预处理

由于LS-SVM算法不能识别文字样本信息,故先运用上述提到的分数标记方法将所有问卷选项结果转化为数字,然后我们把得到的数据分成322份训练数据和644份检测数据,并把他们分别通过宏工作表转换,即可得到最终的训练样本和检测样本。

3.2 模型的建立

本文采用较为常用的gridregression.py函数来进行自动寻优,通过LS-SVM程序,得到的最优参数分别为c=1.0,g=1.0,p=0.0009765625。选用线性核函数RBF进行模型训练[18-20],得到预测模型的相关参数如下:

3.3 模型检验以及对预测结果的评价

预测值与真实值的对比如表1所示,将其转换为对比图如图6所示。

表1 真实值和预测值对比表

图6 真实值和预测值对比图

分析对比表格,可以得出,两组数据误差的绝对值远远小于1,从对比图也可看出预测值与真实值基本重合。这说明模型预测很准确,偏差极小。

此外该预测模型得均方误差MSE=3.12768^10-6,平均相对误差为E=2.41246^10-5,这说明,对于前面核函数的选取,参数寻优和预测模型的构建步骤都十分合理,且该方法是适用于本实验文字样本的处理预测的,且可靠性非常强。通过上述对问卷结果的分析,我们可看出本次问卷设计基本合理,通过对问卷各部分问题的剖析我们即可了解该部分相应情况,且便于从中寻求解决之法。综上,LIBSVM适用于对选题小样本数据的预测,通过小部分训练数据样本来预测大部分检测样本确实行之有效,这也对我们研究其他类似文本或数据提供了一定的指导和参考。

4 结语

本文将LS-SVM这一新兴机器学习算法和问卷调查相结合来研究我国非法律专业大学生法律素养。通过问卷结果和SVM可靠的预测结果可知,山西地区非法律专业大学生法律素养远没有切实跟进我国当前法制建设的步伐,法律素养水平实不理想。对法律知识中的法律常识、一些基本法和基本的法律程序问题了解太过表面化,掌握程度不够深入;虽然被调查者基本都怀有对于法律的信仰和期待,愿意接受法律,有维护法律的意愿,但是由于法律基础知识掌握不到位,故不能正确区分很多日常行为的合法性;再者,从法律应用能力来看,虽然大多数人维法护法意识很强,但在日常生活实践中的应用能力却很弱,大多数被调查者并不会恰当地使用法律手段去维权,自身法律应用能力与其处理实际问题所需也不成正比。总之,我们可以看出当代非法律专业大学生法律素养极其缺乏,同时,其法律素养的提升空间也相当大。

猜你喜欢

被调查者问卷样本
规划·样本
00后阅读偏好的三大特点
人大专题询问之“方城样本”
随机微分方程的样本Lyapunov二次型估计
问卷大调查
问卷你做主
“官员写作”的四个样本
敏感性问题抽样调查方法研究
你为何不能幸福地工作?