基于人工智能的网络舆情大数据传播特征挖掘系统
2020-07-23罗平武斌
罗平 武斌
摘 要: 为了有效解决舆情数据传播中特征挖掘技术面临的特征挖掘滞后问题,设计基于人工智能的网络舆情大数据传播特征挖掘系统。设计网络信息传感提取模块,利用O/I顺向电流指向性电路节点端口和电机控制性匹配结构构建外围控制电路以及带状数据分布式交互接口。设计舆论数据人工智能入网协议来转换当前的网络数据格式,并对其进行舆情二次语义处理。文中使用人工智能技术,依靠Hadoop平台内部学习库中的Ma_Orduse算法和K?means算法通过有效数据文本聚类获取特征键值,以中枢结构的形式传递回中央控制器,实现当前网络舆情大数据传播特征挖掘。实验数据表明应用该挖掘系统后,舆情数据特征读入延迟降低32%,读出延迟降低27%,可以有效缓解特征挖掘滞后问题。
关键词: 舆情大数据; 特征挖掘; 人工智能; 系统设计; 数据分析; 语义处理
中图分类号: TN911?34; F272 文献标识码: A 文章编号: 1004?373X(2020)04?0176?04
AI?based propagation feature mining system for network public opinion big data
LUO Ping, WU Bin
(Shanghai University of Finance and Economics Zhejiang College, Jinhua 321013, China)
Abstract: An AI?based propagation feature mining system for network public opinion big data is designed to effectively solve the lag problem of feature mining faced by the feature mining technology of public opinion data propagation. The network information sensing and extraction module is designed, and the peripheral control circuit and banded data distributed interactive interface are constructed with O/I forward current directivity circuit node port and motor control matching structure. The artificial intelligence network protocol of public opinion data is designed to convert the current network data format and carry out the secondary semantic processing of public opinion of it. The characteristic key values are obtained by effective data text clustering by means of the Ma_Orduse algorithm and K?means algorithm in the internal learning library of Hadoop platform with the artificial intelligence technology, which are transferred back to the central controller in the form of central structure to realize the feature mining of current network big data transmission of public opinion. The experimental data show that the application of the mining system, the read?in delay of public opinion data features is reduced by 32%, and the read?out delay is reduced by 27%, which can effectively alleviate the lag problem of feature mining.
Keywords: public opinion big data; feature mining; artificial intelligence; system design; data analysis; semantic processing
0 引 言
网络舆情具有极强的复杂性、扩散性、跨越性,对于其监管和特征判定也势必需要更为先进的思维模式和更为完备的数据挖掘系统[1]。
传统化的网络舆情大数据传播特征挖掘一直面临着特征挖掘滞后的问题,很难在部分恶性舆情扩大化前进行有效的遏制。在现有技术无法对其进行有效升级和改善的情况下,势必需要引入新型技术作为支持动力。人工智能作为与大数据同时出现的集成化网络技术手段,从研究伊始就奠定了二者密不可分的协作关系。应用人工智能对网络舆情大数据进行有效的监管和特征挖掘,是现代复杂网络环境下较为可行的数据特征挖掘监管升级方案。人工智能所特有的数据时间智能化和数据拟合智能化,可以利用时间轴进行网络舆情数据传播遏制,改善滞后性问题[2]。
1 人工智能舆情大数据传播特征挖掘系统
1.1 网络信息传感提取模块设计
网络信息传感提取模块主要作为当前特征挖掘系统初始信息获取区域存在。该模块可以为系统提供大量的网络传感信息流,作为系统后续操作的原料。在实际工作中,提取模块主要通过将输入端接口电路和PC端网络数据传感器相连,获取初始网络信息流节点编号后,根据中央控制器获取当前网络信息的初始编码值和地址编码,再利用系统内设的数据存储器完成信号动态数据存储,采用无线射频的方式建立传输电流、CAN传输总线以及RS 485传输串口,为主控区进行信号传输。其详细结构如图1所示。
外围电路由采集器输入接口电路、继电器控制电路、串口电路和CAN总线电路合成[3]。其核心构建包括O/I顺向电流指向性电路节点端口,电机控制性匹配结构,采集获取电路时钟,以及一个可以保证16线程的外部电源数据转换器,4个多线程缓冲性路径接口及其核心数据传感器。提取模块内部为中央控制器,与FLASH存储器相连,具有明确的独立控制区。外部通过端口与外围电路相连。相关大数据工作人员可以根据其内部的传感器,建立舆情大数据的网络空间映射子集,方便后续管理[4]。中央控制器示意图内部结构图见图2。
中央控制器内部各个原件与多条带状数据分布式交互接口联通[5]。因为不同的舆情大数据需要基于大量的数据点击周期和数据访问次数,多条带交互接口设计可以保证提取模块在进行日常舆情数据提取中,同时进行数据的读入和读出,在一定程度上提高了数据进出效率[6]。此外针对当前舆情数据图片、视频、文字形式多样化特征,在中央控制器上设置三类不同的数据接口,即:MP/MC,OVLY,DROM。以上三类不同的数据接口可以满足现代网络环境下全部数据形式的提取和传输要求。当中央控制器成功获取数据以后,根据模块内部的数据传输结构,直接传递给FLASH存储器,获取数据寄存值,再通过存储器内部独有的传输接口进行传输。因为传感提取模块独有的数据专业化特征,可以对采集制定进行不断重复并在此基础上施加条块指令和传输指令,每个指令均根据64位传导数据进行传导。
1.2 舆论数据人工智能入网协议
网络信息传感提取模块虽然可以读入和读出大量的网络信息,但是不能直接与人工智能相关分析数据相连。从网络属性上来看,当前的网络数据属性为线上网络,也就是基础网络;而人工智能分析则需要基于已知网络,也就是局域网络。二者无法直接进行对接,所以设计增设入网协议,改变当前提取网络数据的网络属性,为后续舆情传播特征挖掘提供条件[7]。
具体转换方法是利用一定网络蓝本,确定并保证当前数据信号的随机网络代码,将其与当前人工智能网络协议的载波进行同步,从而实现网络属性变化和对接。上述过程可以将其近似的看作是一种大量驳杂的网络数据通信信号二维判定过程。根据当前无线数据信号离散傅里叶变换规则,数据传输信号在进入局域网时,信号源的时域和频域会呈现几何倍数关系。这一特征可以应用于入网协议制定中。设计将数据传输协议直接连入系统传感提取模块的中央控制区,在当前无线网络内建立端口。设中控区信号接收序列为[x(n)],信号控制端的数据序列为[y(n)],则设计入网协议的最终函数算法为:
[?xy(n)=r=1Nx(r)·y(r-n)] (1)
式中:[n]表示当前入网协议信号数据的测量关系指数;[r]为当前数据信号可执行性定义域;[?]为当前提取信息数据频域的测量关系值[8]。
根据入网协议,需要对当前信息数据的传输信号快速进行信号傅氏变换和局域网络伪随机码的智能转换,获取当前转码的阻隔值。其变换公式如下:
[G(s)=U(s)E(s)=kP1+1TIs·TDs] (2)
式中:[kP]表示数据变换的伪随机比例系数;[TI]表示當前数据常数量;[TD]表示当前数据可变换常数。
由式(2)将当前采集数据傅里叶变换下的伪随机码直接导入,并与区域网络下人工智能网络数据载波同步。如果所有的网络代码值均小于代码值,则可以直接进行入网操作。
1.3 实现舆情大数据传播特征挖掘
入网协议将数据与局域网络下人工智能相关分析数据相连后,即可对其进行舆情二次语义处理,进行数据挖掘。二次处理包括预处理和分析挖掘处理。
1) 一次处理。需要对人工智能下的采集数据以及局域网页信息进行去重和去噪处理,选择文本特征形式并将文本向量进行初始化或者格式化操作,获取局域舆情文本数据向量集,其工作流程如图3所示。
局域网络属性数据会保留原始数据域名格式,需要清洗数据HTML源代码,保留数据自身内容摘要等信息。为了便于后续分析,系统额外使用MAP_reduce分词处理技术,提取当前舆情数据词频特征,最终构建词频特征向量集合,将其保存到HDFS分布式文本库中,一次处理完毕。
2) 二次处理。其包括用于消除特征延时性的时间序列模型和传播特征分析挖掘[9]。构建网络舆情信息时间序列模型可以最大限度完成传播特征排序,抵消数据延迟。设当前多维的随机变量[Ui],则当前数网络数据为[U=U1,U2,…,UN]。设网络舆情数据在路由链路层数据值域期间的关联性特征为:
[pUθ=k=1KαkGUuk,k] (3)
式中,[α]和[u]分别表示网络舆情数据独有的特征序列波特率和响应频率。根据式(3)计算下的公式性特征,可以直接按照时间节点建立时间序列。
舆情传播特征分析是二次予以处理的核心,主要负责完成舆情信息的高度识别、跟踪舆情话题、评估舆情导向等。二次处理过程包括人工智能下的特征聚类算法,该算法可以将一次处理时获取的信息文本向量进行汇总,并对舆情数据特征进行挖掘,识别主要舆情话题。将传播特征信息提取后,更新数据向量文本,判断二者之间的关联性。如果关联性达到一定的预设标准则可以将其划分为一类情感倾向话题中。
系統的使用人工智能技术包括Hadoop平台。该平台内部学习库中的Ma_Orduse算法和K?means算法可以实现有效数据文本聚类[10]。只需要将一次处理获取的文本向量集进行有效录入,并预设聚类数据中心迭代中值条件,即可完成数据聚类,并获取文本特征信息及中心点。
此外系统引入的MAP函数,可以将文本向量集划分成不同的小块数据集合,并将其直接发送到人工智能下各数据节点的子程序中,直接进行计算任务。计算获取的特征键值会以中枢结构的形式传递回中央控制器,从而实现当前网络舆情大数据传播特征挖掘。
2 实验数据分析
实验数据分析可以验证当前系统的实际性能,提取特征数据为后续开发奠定基础。设计实验以传统数据挖掘系统为对比样本,通过验证舆情数据特征读入和读出延迟,分析判定设计系统的实际性能。
2.1 舆情数据特征读入延迟对比
为了体现实验公正,设计选用完全相同的2台计算机进行数据特征挖掘,数据库采用最新的BIRD数据库,关键词摘要的提取为多项提取。图4为实验对比系统舆情特征数据读入延迟对比结果。
图4显示了当前两种数据传播特征挖掘系统进行舆情数据特征读入时的对比延迟。实验随机选取5组进行验证。根据数据资料显示,传统挖掘系统的舆情数据特征读入延迟要明显高于本文设计的挖掘系统,经过数据统计可以判定其相差比例达到32%。
2.2 舆情数据特征读出延迟对比
按照上述方法和实验环境进行舆情数据特征的读出操作,验证对比延迟。为了更为清晰地明确数据结果,设计将对比延迟比例图转换为比例表的形式进行对比,其结果如表1所示。
根据表1数据可以看出,在舆情数据特征读出延迟对比中,本文设计的特征挖掘系统同样优于传统挖掘系统,其特征延迟要比传统系统降低27%,进一步验证了实验预测。
3 结 语
网络舆情大数据传播特征挖掘对当前网络环境监管和舆论分析具有重要意义。为了解决传统挖掘系统延迟过高的问题,设计了新型挖掘系统。该系统以人工智能为核心进行特征挖掘,进行舆情二次语义处理,可以有效降低延迟。
注:本文通讯作者为武斌。
参考文献
[1] 王艳,王慧.基于快速Spark人工智能架构的大数据挖掘算法[J].黑龙江工业学院学报(综合版),2018,18(5):85?89.
[2] 张双狮,夏一雪,兰月新,等.面向大数据的涉警舆情分析与决策方法研究[J].传播与版权,2018,59(4):185?189.
[3] 王冰纯,毛妍捷,孙滨颐,等.基于大数据背景下的人工智能客服系统[J].电子测试,2018(13):74?75.
[4] 詹劼,周纯玉.基于大数据的人工智能教育系统设计分析[J].数码世界,2018(1):146.
[5] 李亚,张小平.基于人工智能的网络评卷系统的初探[J].中国战略新兴产业,2018(28):126.
[6] 汪应.基于“人工智能+大数据”智慧校园虚拟校园卡创新与实践[J].传播力研究,2018,2(31):244.
[7] 陈德旺,章明亮,沈镛.智慧地铁:基于大数据与人工智能的新型地铁系统[J].智能城市,2018,4(19):17?19.
[8] 高塔.探究如何利用大数据挖掘技术推动人工智能发展[J].中小企业管理与科技(下旬刊),2018(5):149?150.
[9] 孙华,贾晓婷.大数据时代人工智能在计算机网络技术中的应用[J].信息与电脑(理论版),2018(9):133?135.
[10] 洪学银,李亚娟.大数据背景下人工智能在计算机网络技术中的应用研究[J].信息与电脑(理论版),2018(21):124?125.