基于网页浏览业务的QoE评价模型实验及仿真

2017-09-28常莹王婧朱庆华

电脑知识与技术 2017年24期

关键词：信息量等待时间网页

常莹，王婧，朱庆华

(北京电子科技职业学院，北京100176)

基于网页浏览业务的QoE评价模型实验及仿真

常莹，王婧，朱庆华

(北京电子科技职业学院，北京100176)

QoE即用户体验质量已经成为评价网页的重要指标，在对基于图像信息的网页浏览业务QoE评价模型进行了研究后，为了得到更多用户浏览网页时的体验，该文再次研究了基于视觉信息的网页浏览业务的QoE评价模型。在对网页视觉信息进行提取的同时，有针对性地做了部分仿真实验并进行验证。

体验质量；浏览业务；视觉信息评估；仿真实验；页面分析

多媒体技术及其应用

1 基于视觉信息的网页浏览业务的QoE评价模型

首先要分析一般的网页的页面结构形式，广泛地来说，网页内容可以广泛地分为图片和文本信息两大类。基于人的视觉感知，一个网页的视觉信息量是由网页的图像视觉信息量和文本视觉信息量组成的，如公式(1)所示。

图像的视觉信息通过视觉块的出现概率图像来确定，并在不同的位置，视觉块都有不同的视觉吸引力。使用图像信息图，以获得有吸引力的重量。

2 网页文本信息量的提取

文本信息分为语法、语义和语用信息。句法信息是最简单和基本的水平，而语用的信息是最复杂和最实际的层面，语义信息的水平在他们之间。语义和语用信息是主观的指标。这可能需要采取人工智能和人类的知识库去考虑获得这些信息，这就意味着他们的获取相当困难。在这里，为了降低计算的复杂性，只考虑句法信息作为文本信息。根据香农信息理论，文本信息可以通过计算每个文本出现的概率来计算。现在模拟下面这样两个情况，情景一：

Q1：下面哪一个是哺育动物？

A、鲨鱼 B、鲨鱼 C、鲸鱼 D、鲨鱼

Q2：下面哪一个是哺育动物？

A、泥鳅 B、鲸鱼 C、鲨鱼 D、海龟

上面两个同样的问题：都是四个选项。并且每个选项里面的文字都是一样多的，按照正常的计算方法来计算，应该是两个情况所得到的信息量一样，但是事实却是不一样的，通过调查参加测试人员的反映，50个人里面有42个人认为Q2的信息量比Q1信息量多，而剩下的八人认为从本身来说，两个问题提供的信息量一样，但是从人的感觉上来说，是Q2的信息量多。

情景二：打开了两个不同的网页，一个网页内容很丰富，标题很多，涉及的内容比较多，重复的文本信息较少。另一个网页是关于一个具体事件的详细描述，文字很多，但是重复的文本信息也比较多。虽然可能总的文字数量差不多，但是因为第一个网页人的主观视觉感受比第二个网页好，将会造成人潜意识里面对于第一个网页的主观等待时间忍耐时间延长。

通过上面的分析，可以提出一种文本的计算方法，考虑使用人眼可识别的最小视觉文本信息作为统计单位。在英文中，使用独立的单词作为统计单位；在中文中，使用基本汉字作为统计单位，其他语言类似。使用下面的公式(2)计算平均文本视觉信息量Hi(I)Hi(I)：

上面式子中pi表示每个基本文本信息在整个部分文本中出现的概率，比如：在英语中，不再使用单个字母作为基本的文本信息，否则会出现上面的情况。改用每个不重复的英语单词在整个文本中出现的频率来做pi；在中文中，由于并不存在类似英文中有26个固定的字母作为基本的构造字符，中文博大精深，汉字的构造字符比起英文来更加复杂，这里就用简单的将每个单个的汉字作为基本的文本信息，同时这样也可以避免上面情况的出现。如公示(3)所示。

SiSi表示第i个文本块的大小，IitextIitext表示第i个文本块的视觉信息量。

3 实验及验证

3.1 实验准备

在每个终端都下载睿思页面分析工具，并且使用睿思页面分析工具来打开网页，这个工具会记录本次打开网页所用的时间，在每次测试之前，都要清理一下缓存，防止本地端的缓存影响到下次测试的等待时间。在此之前使用工具来提取网页上面的内容，来进行网页的视觉信息量提取。选取10个网页，这10个网页具有不同的大小，并且图像信息跟文本信息都具有很大差异，可以满足实验需求。

实验需要寻找50个非专业测试人员来进行主观测试，这也是为了防止测试人员之间的相互干扰，同时，由于实验环境的限制，仅仅能提供五台的电脑，所以需要把测试人员分成10组，每组5人进行测试。每组设置3个不同网络环境，将五个人的评分求平均值，作为主观MOS值，由此可以取得150个数据。

考虑到本文的研究内容，即提出的视觉信息量构成，所以仅仅考虑图像和文本信息，并且不考虑他们之间的复杂关系。本次测试就选取一些结构简单的页面来做实验，即既包含文字也包含图像，同时结构简单的网页，如图1所示。

图1 测试页面展示

以这个网页为例，因为这个页面的结构很简单，超级链接也不多。下载网页到本地端，得到的网页文件大小为3879KB。然后，通过计算，得出这个网页的有效视觉信息量为692.7KB大小。其中原网页中图片大小为761KB，经过视觉信息量的计算方法计算之后，只有677.29KB大小；文本信息有38.7KB大小，计算视觉信息量之后，文本有效的视觉信息只有15.41KB大小。计算发现文本信息的视觉信息量信息与图像的视觉信息量相比低很多。剩下的4个网页都通过这种方法计算出视觉信息量。

3.2 实验结果

用获得的250个数据中的200个数据来进行数据拟合，剩下的80个用来验证试验结果，同时排除明显偏离测量数据主体的测试值。通过Matlab进行数据拟合，得到公式(4)：

公式(4)中，V表示视觉信息下载速度，使用网页视觉信息量与总的网页加载时间的比值。为了验证这个评估模型与传统评估模型的性能差异，使用剩下的80测试值进行验证实验。依然使用RMSE和R-Square两个指数来说明。如表1所示。

表1 两种评估模型的RMSE和R-Square指标

Matlab拟合图像如图2和图3所示。图2中主观值与预测值之间具有很好的关联性。图3中拟合效果不好，可以看出主观值与预测值之间存在分块现象。

图2 文提出的模型的拟合函数

图3 传统评估模型的拟合函数

4 分析

单纯地使用等待时间作为因变量分析网页浏览业务具有很大的局限性，网页的展示过程非常复杂，仅仅使用一个网页的等待时间来计算网页浏览的QoE在不同的网页中是不合理的。传统模型适用于相类似的网页(结构和大小)，比如：“搜狗搜索”和“百度一下”这两个网页，他们两个之间的比较就可以简单地使用一个等待时间T来表示用户体验质量。但是当使用这个模型来比较“淘宝”和“百度”这两个网页时，大家都有感觉，在使用百度时，如果2秒打不开“百度”，就会认为网络有问题，但是如果2秒打开了“淘宝”的网页，会觉得这个网路很好，这次用户体验度会很高。我认为这就是上面两幅拟合图的差距，在第二幅图中可以看出当网页大小具有差距时，预测值会显示出一些分层现象。所以在网页浏览业务中加入视觉信息量I，使用视觉信息下载速度代替是等待时间有利于建立更优的模型。

同时，由于此次试验的网页大小不相同，相同主观MOS值情况下，等待时间随着网页大小的增大而增大，所以在图3中可以看出的分层现象，这就是由于使用了多个各不相同的网页造成的结果。而在一个网页如果内容丰富，那么用户在浏览的时候就会降低下拉网页的速度，这样就给了浏览器更多的时间来加载网页，同时在不影响用户当前阅读的情况下，提高了用户的主观质量。而在这里，简单的使用单位时间内下载的视觉信息量来更加贴近用户的主观感受，而且实验证明，这个模型具有一定的作用。

[1]林闯,胡杰,孔祥震.用户体验质量(QoE)的模型与评价方法综述[J].计算机学报，2012,35(1)：1-15.

[2]文艺林,黎文伟.移动视频业务QoE自适应测量工具[J].计算机系统应用,2017,26(2).

[3]姚会刚,黄永峰.基于BP神经网络的网络视频QoE评估[J].计算机工程与设计,2017(1)：1-6.

[4]刘延伟,刘金霞,慈松,等.3DQoE评价方法及其模型研究进展综述[J].电子学报,2015,43(3)：568-576.

[5]刘继春.面向用户体验的视频流业务质量评测方法[D].北京邮电大学,2014.

[6]罗意.移动互联网业务QoE研究[D].北京：北京邮电大学,2013.

[7]王松,刘新民,丁黎黎.基于在线信息的C2C顾客可感知风险评价研究[J].商业研究,2011(10).

[8]郭亚军,易平涛.线性无量纲化方法的性质分析[J].统计研究,2008(2).

TP393

1009-3044(2017)24-0183-02

2017-07-10

常莹(1972—)，女，北京人，讲师，硕士，主要研究方向为软件工程，移动终端技术等；王婧(1980—)，女，山东人，副教授，硕士，主要研究方向为大数据与移动云计算，移动终端技术等；朱庆华(1972—)，男，北京人，讲师，学士，主要研究方向为物联网，电子技术等。