新媒体视角下高校网络信息安全风险预警研究

2023-12-23李徐辉

无线互联科技 2023年19期

李徐辉

(陕西国防工业职业技术学院,陕西西安 710300)

0 引言

随着网络传播技术的迅速发展,新媒体载体层出不穷。在广大网民的积极参与和传播下,新媒体事件屡见不鲜,对社会产生了重要影响。当前时代已经成为新媒体事件频发的时代。对于高校而言,新媒体时代既有积极的一面也有消极的一面[1]。新媒体可以帮助高校教师提升教学质量和水平,但同时,在新媒体技术的传播下,学生获取新鲜资讯的途径增加,但资讯信息的真实性和可信度难以保证。网络舆情是指在新媒体技术的支撑下,公众对某一热点话题所表现出的具有一定影响力和倾向性的意见或言论。在高校网络中,网络舆情反映了特定中介性社会事项所引发的社会政治态度[2]。学生是网络中最为积极的群体,经常活跃在各类网络领域,是新媒体时代下信息传播的主要承载者。然而,由于学生缺乏真实社会的经验,对信息的辨识能力较弱,极易受到虚假信息和舆情的误导,成为其传播的推动者[3]。此外,高校网络中包含大量的信息,一旦计算机系统被非法攻击者入侵,就会造成信息泄露,对高校甚至学生本身的利益造成严重负面影响。因此,为了保障学生和高校的合法权益,避免学生受到不良信息的影响,本文将从新媒体视角出发,开展对高校网络信息安全风险预警的研究。

1 高校网络新媒体信息获取与挖掘

信息获取是对高校网络安全风险进行监测的关键环节。在新媒体视角下,只有实现对高校网络新媒体信息的及时获取,才能确保预警方法发挥重要作用[4]。一般经验表明,高校网络中的新媒体信息快速传播时间大约为6 h,本次针对信息发布至传播6 h这一时段进行研究。因此,在获取高校网络新媒体信息时,需要设置一个阈值U。此阈值是在6 h内点击率、回复率和转载率的线性组合参数,该阈值的设定应结合高校网络传播的特点和网络用户的行为习惯。通过以下内容确定阈值:设在高校网络论坛当中,针对该新媒体信息的点击率为D,回复率为H,转载率为Z。在完成设定后,根据网络新媒体信息的分析,将其重要性划分为:Z≥2H≥200D,一般D>70×(H+Z)。当D的取值小于或等于这一设定时,说明该新媒体信息引起了广泛响应,则U的计算公式为:

U=D/100+H+2Z

(1)

当达到阈值时,高校网络后台程序将自动推送数据到预警数据库中。结合以往新媒体信息在形成前6 h的D、H和Z的取值,确定U的具体取值。使用上述方式对高校网络新媒体信息进行采集,能够确保信息的全面性。在完成获取操作后,对得到的高校网络新媒体信息进行挖掘。由于计算机不能像人类那样理解文字中的信息,只能分辨0与1,所以有必要把文字的信息表达为计算机能够辨识的数据,把文字表达为数字或符号的矢量。然而,中文词汇并不能完全表达语义,而短语和句子尽管能够充分表达语义,但是经过大量的实验验证,却发现单一的短语或句子往往蕴含着多层次的意义,这给计算带来了很大的时空开销[5]。因此,需要选择特征项作为文本处理使用词用以识别文本[6]。在对文本进行挖掘的过程中,引入布尔模型,其文本表示模型可写作:D=(W1,W2,…,Wn),在该模型当中,n表示特征项的数量,Wi的取值均为0或1。当Wi的取值为1时,说明某一特征项i在文本D当中;当Wi的取值为0时,说明某一特征项i不在文本D当中。采用这种方式会在一定程度上忽略了特征项与文本项之间的关联性差异。因此,对该模型进行优化,将文本表示为由特征项组成的正交规范化矢量,接下来,对模型进行优化,可表示为:

D=(T1W1,T2W2,…,TnWn)

(2)

模型中,Ti表示某一特征项i的取值;Wi表示某一特征项Ti的矢量权重,Wi的取值一般在(0,1)之间,Wi取值越大,则说明特征项Ti越能够反映文本D中的内容;相反,Wi取值越小,则说明特征项Ti越无法反映文本D中的内容。将符合所有Ti值要求的文本汇总,实现对重要内容的挖掘。具体挖掘步骤为:收集文本文档——文档预处理——标记化——去除停用词——Stemming——文本转换——数据挖掘——评估。在挖掘的过程中,对风险特征进行提取,其公式为:

(3)

公式中,P(k)表示特征量;η(k)表示挖掘状态系数;li(k)表示文本信息数据特征量;ηi(k)表示所有文档信息数据量。根据上述基本逻辑,实现对高校网络新媒体信息的深度挖掘。

2 信息安全风险特征加权与特征降维

为方便后续对风险信息的聚类和安全预警,对信息安全风险特征进行加权和特征降维。在对各特征项进行权值计算时,必须采用词频加权法。词频加权法是一种将特征项在文章中出现的次数作为权重的方法,权重随着出现次数的增加而增大[7]。一般来说,在高校网络中,不同新媒体信息之间并没有直接的相关性,因此可分别计算各自新媒体信息的权重,词频加权的计算公式为:

(4)

公式中,tfi表示特征项Ti在文本当中出现的频率。若文本中特征项存在,则将权重值记为1,反之记为0。

为了降低预警方法的计算量和运行负担,对信息安全风险特征进行降维。只需要选取最能体现文本内容的特征项即可。常见的降维方式包括特征选择和特征抽取等,而特征抽取更加简单[8]。通过对以往新媒体事件的分析可以看出,事件主要涉及地点、人物、相关部门、事件、结局5个词语,而这5个词语也是最能体现事件整体状况[9]。所以,可将这个矢量空间的维度设定为5个维度:

D=(T1W1,T2W2,…,T5W5)

(5)

对于高校网络中本体库Hownet没有覆盖的新词,根据新词的上下文语境,对其进行综合评价,将新词的语义值定义为:

ti=0.4·ti-1+0.4·ti+1+0.2·50

(6)

公式中,ti表示特征项Ti的语义值,公式中的2个0.4表示上一特征项和下一特征项的影响系数,0.2表示平衡因子,按照下述公式进行降维调整:

(7)

通过上述方式可以实现对其降维,从而降低后续预警的误差。

3 安全风险信息聚类与安全预警

针对完成降维的信息安全风险特征,对其进行聚类分析,筛选出对高校网络运行造成威胁的风险信息,并在发现风险信息后,立即进行安全预警[10]。选择将K-means算法作为聚类算法

将聚类结果分为4种不同类型,并设置对应的D取值范围。第一类,对社会的发展和稳定有利的新媒体信息,D取值范围在0～0.25;第二类,属于高校网络中用户自娱自乐事件的新媒体信息,D的取值在0.25～0.50;第三类,属于对社会的发展和稳定有一定负面影响的新媒体信息,D的取值在0.50～0.75;第四类,会严重影响社会的发展和稳定的新媒体信息,D的取值在0.75～1.00。根据上述划分规则,在对高校网络中的新媒体信息监测时,一旦出现D的取值在0.50以上的新媒体信息,则立即进行预警,并将其剔除,避免对整个高校网络环境造成负面影响,以此实现对高校网络信息安全风险的有效预警。

4 实例应用分析

在上述论述基础上,从理论方面实现了对新媒体视角下高校网络信息安全风险预警方法的设计。为了进一步验证该预警方法的实际应用可行性,选择以某高校为依托,针对高校网络的信息安全进行风险预警。通过对预警方法在应用过程中的表现以及应用效果实现对其性能的检验。选择某一高校为研究对象,以微博平台中高校的超话作为研究区域,其研究时间设定在某一信息发布后6 h内,依据平台提供的点击统计功能记录每个内容的点击次数,统计用户与内容的互动情况及内容被其他用户转载或分享的次数,以此来开展研究。先从预警的精度角度,对该方法进行验证,将误报率作为精度检验的量化指标,对预警误报率的测定可通过下述公式计算得出:

(9)

公式中,η表示预警方法的误报率;s表示未进行预警但属于风险信息的数据量;r表示未正确匹配风险信息的数据量;m表示信息总数据量。根据上述公式,将实验结果中该预警方法的误报率记录,并得到如表1所示的实验结果。

表1 本文预警方法误报率记录

从表1中得到的实验结果可以看出,本文设计的预警方法可以实现对风险信息的安全预警,尽管随着高校网络中信息数据量的增加,预警方法的误报率出现了略微增加的情况,但在信息数据量达到10 000 Mbits时,其误报率也均控制在了3.00%以内,实验结果十分可观。通过上述实验可以证明,本文设计的预警方法在实际应用到高校网络当中时,可以实现对风险信息的有效预警,确保高校网络的运行安全,保障网络用户的个人利益不受损害。

通过上述实例,实现了对本文设计的预警方法预警精度的验证。在此基础上,为使验证结果更客观,再从本文预警方法结果的信度角度,实现对其预警精度对比。采用科隆巴赫系数反映信度,其计算公式为:

(10)

公式中,δ表示预警结果的信度值;Wi表示预警结果的方差;Wt表示预警结果的标准差。根据上述公式计算得出信度值δ,δ的取值在0～1,δ越接近1,则说明本文预警方法的预警精度越高;δ越接近0,则说明本文预警方法的预警精度越低。在预警的过程中,随着高校网络中信息总数据量的增加,记录每一时刻的δ值,并将其绘制成如图1所示的实验结果。

图1 本文预警方法预警结果信度值变化曲线

从图1中曲线可以看出,应用本文提出的预警方法对高校网络信息安全风险预警,预警结果的信度值随着信息数据量的增加,出现了略微下降的趋势,但始终高于0.7,这一变化趋势与上述误报率测试结果相符,说明实验结果具有客观性。综合上述得出的实验结果证明,本文设计的预警方法可以实现对高校网络信息安全风险的高精度预警,对于提升高校网络环境整体安全性具有极大的帮助。

5 结语

本文将新媒体作为大环境背景,开展了对高校网络信息安全风险预警方法的设计研究。新媒体与传统媒体相比,具有及时性、互动性、开放性等特点,其特性决定了突发事件爆发后,信息的传播速度更快,且影响范围更广。基于这一特点,本文设计了一种全新的预警方法,用以实现对高校网络信息的安全保护。在实际应用中,在高校网络信息安全风险预警的前期信息获取阶段,仍然存在进一步需要改进的环节,例如制定相应的服务协议、确保信息的全面性等。对此,为了使高校网络安全性得到更大的提升,针对这一方面的问题还将进行更加深入的探索研究。