网络计算中的智能信息处理方法研究
2023-06-07李嘉
李 嘉
(唐山工业职业技术学院,河北 唐山 063200)
1 网络计算中基于模糊矢量相关模型的信息分类和检索
在传统的计算应用领域,由于信息的技术处理能力受限以及面对的对象复杂程度较低,信息系统中的数据传输量相对较小,表达形式较为单纯,因此对信息的传输速率、信息载量、表现形态的要求均较低。但是,随着多媒体技术以及互联网技术的发展,海量的网路信息彻底改变了信息资源的分布配置方式,给信息的分类和检索带来极大挑战,传统的和经典的信息处理、检索技术已严重不能适应新环境和新问题,并严重地阻碍了信息资源管理和利用,制约了信息处理技术的发展。而基于模糊理论的智能信息处理技术能有效适应当前分布式网络的计算环境,并发展出了多种信息检索方法。基于现有的矢量相关模型VCM,引入了矢量计算,可以建立较为复杂的运算模式,并可以实现对用户搜索习惯的有效捕捉,在数据库信息和超文本信息方面具有一定的智能性[1]。
在VCM 中,进行信息处理时会将文本信息认为是一个独立的空间向量,进行数学求解时会将所有的词条量化为向量组(T1,T2,…,Ti),并对每个向量基元按照其在文本信息中的重要程度进行权重赋值Wi。将文本信息的用户搜索过程认为是文档信息的相似度匹配过程,其数学内涵是用户的查询矢量Q与被检索文档矢量D进行自相关运算,向量的夹角越小,表明2 个向量的相似度越高,因此结果越符合检索结果,其计算方法如公式(1)所示[2]。
式中:sim(Q,D)为查询矢量Q与被检索文档矢量D的自相关函数;Wqk为第k个查询矢量Q的权重;Wdk为第k个被检索文档矢量D的权重。
在大数据信息环境下,提高数据库信息和超文本信息分类和检索的查准确率和查询完整率是最基础的工作,为了突破传统信息处理技术的瓶颈,有效地将检索信息从日益膨胀的系统信息仓库中筛选出来,并将信息化和智能化推进至高层次的分布式网络信息处理、移动终端多媒体化以及综合集成式的信息数据检索中[3]。
该文基于VCM 引入模糊集概念,增加用户检索集合隶属度,提出了一种适用于数据异构化和分布化的检索模型,即模数矢量相关模型FVCM。在模型中定义用户检索集合为E={E1,E2,……,Ei},模糊集合P={Pi}为用户检索集合隶属度。通过模糊理论,可以得到用户检索矢量U和信息项矢量C,如公式(2)和公式(3)所示[4-5]。
式中:f(U*)为用户感兴趣的词频函数。
由此得到的向量的相关性如公式(4)所示[6]。
为了定量化地验证提出的FVCM 的可行性,将其检索性能与VCM 进行对比,结果如图1、图2 所示。从图1 可以看出,不同样本中VCM 与FVCM 的数据信息库查询准确率和查询完整率均呈现不同程度的波动,VCM的数据查询准确率波动幅度较大,平均值为96.27%,与数据查询准确率类似,其数据查询完整率的波动幅度也较大,平均值为95.36%;FVCM 的数据查询准确率波动幅度较小,平均值为99.14%,与数据查询准确率类似,其数据查询完整率波动幅度也较小,平均值为99.43%;FVCM 的数据查询准确率和完整率均明显大于矢量相关模型,表明提出的FVCM 具有较好的可靠性和稳定性,其查询准确率和完整率得到了大幅度提高。从图2 可以看出,不同样本中VCM 与FVCM 的超文本信息查询准确率和查询完整率均呈现不同程度的波动,矢量相关模型VCM 的超文本信息查询准确率平均值为94.26%,超文本信息查询完整率平均值为94.21%;FVCM 的超文本信息查询准确率波动幅度较小,平均值为96.47%,比VCM的超文本信息查询准确率明显提高,与超文本信息查询准确率类似,其超文本信息查询完整率的波动幅度也较小,平均值为97.96%;FVCM 的超文本信息查询准确率和完整率均明显大于VCM,表明提出的FVCM 具有较好的可靠性和稳定性,其查询准确率和完整率得到了大幅度提高。
图1 VCM 与FVCM 的数据库信息检索对比
图2 VCM 与FVCM 的超文本信息检索对比
在数据库信息和超文本信息的检索效率上分别将VCM和FVCM 的检索速率进行对比。1000ms 内VCM 和FVCM的信息检索效率如表1、表2 和图3 所示。从图3 可以看出,随着时间的增加,2 个模型的检索效率呈波动性增加且VCM 的信息检索效率明显小于FVCM 的信息检索效率。在1000ms 处,FVCM 的信息检索效率达到了90.73kbit/s,而VCM 的信息检索效率达到70.23kbit/s。由此表明,相对VCM,FVCM 在数据库信息和超文本信息的检索中具有更高的效率。
表1 FVCM 的检索效率
表2 VCM 的检索效率
2 基于自组织无线通信网络的分布式智能链群算法
分组无线通信网PRNET 是在多网络节点的协调通信基础上发展起来的。为了适应网络信息的分布式处理,自组织无线通信网SORNET 算法基于分布式控制技术,并按照链群算法LCA 解决众多网络节点的移动问题,扩大信息链路中的信息载量并提高网络通信效率。为了更加充分地利用网络的拓扑结构信息,使网络节点之间的通信从多跳式转换为单跳式,以简化网路结构的运行动作,该文提出了一种控制规则的优化图论模型链群算法CGAOG。
在优化图论模型链群算法中,网络节点i的阶数的定义如公式(5)所示。
式中:DN(i)为网络节点阶数;aij为临接节点数。
由此可以得到网络中的最大跳数,如公式(6)所示。
式中:HNmax为最大跳数;HN(i,j)为网络节点i与节点j通信时的跳数。
同理可以得到节点的平均跳数和整个网络的平均跳数,如公式(7)、公式(8)所示。
式中:(i)为节点的平均跳数;(i)为整个网络的平均跳数;n为整个网络的节点数。
原算法和新算法的最大平均跳数、最小平均跳数和全网平均跳数结果对例如图4、图5 所示。从图4 可以看出,原算法的最大平均跳数变化为3.28~3.95,新算法的最大平均跳数变化为2.99~3.44;原算法的最小平均跳数变化为1.91~2.08,新算法的最小平均跳数变化为1.21~1.43。由此可以看出,和采用原算法相比,采用新算法后网络节点的最大平均跳数和最小平均跳数均有明显降低。从图5 可以看出,原算法的全网平均跳数变化幅度不大,为2.64~3.00;新算法的最大平均跳数变化幅度也不大,但和原算法相比,其范围有明显下降,变化幅度在2.05~2.43。
图5 原算法与新算法的全网平均跳数对比
3 结论
该文基于模糊矢量相关模型VCM 提出了一种适用于数据异构化和分布化的模数矢量相关模型FVCM,基于组织无线通信网SORNET 算法提出了一种控制规则的优化图论模型链群算法CGAOG,并对比了两者的分类和检索效率、节点网络运算效率,得出以下结论:1)进行数据库信息查询时,VCM 的数据查询准确率、查询完整率平均值分别为96.27%、95.36%,而FVCM 的数据查询准确率、查询完整率平均值分别为99.14%、99.43%。2)进行超文本信息查询时,VCM 的数据查询准确率、查询完整率平均值分别为94.26%、94.21%,而FVCM 的数据查询准确率、查询完整率平均值分别为96.47%、97.96%。3)和SORNET 算法相比,CGAOG的最大平均跳数、最小平均跳数和全网平均跳数均有显著降低。原算法的最大平均跳数变化为3.28~3.95,新算法的最大平均跳数变化为2.99~3.44;原算法的最小平均跳数变化为1.91~2.08,新算法的最小平均跳数变化为1.21~1.43;原算法的全网平均跳数变化为2.64~3.00,新算法的最大平均跳数变化为2.05~2.43。