基于图像信息的网页浏览业务QoE评价模型研究
2017-07-14常莹刘杨
常莹+刘杨
摘要:随着计算机网络的飞速发展,人们越来越依赖网络获取信息,为了得到更多用户的认可,信息的提供者必须要保证用户在浏览网页时,有良好的体验。用户体验质量,即QoE也随之被大量研究,成为评价网页的指标之一。文章通过用户体验的图像信息影响因素,提出一种基于图像信息的网页浏览业务QoE评价模型。
关键词:体验质量;浏览业务;网页渲染;图像评估;评价模型
1网页技术及QoE基本概念
1.1网页技术的组成
一个网页应用或者网站的组成部分包含:html即页面的内容、CSS即内容的样式、JavaScript即应用的逻辑效果。这三者的关系如图1所示。
1.2QoE概念
QoE即体验质量(Quality of Experience),是指用户对设备、网络和系统、应用或业务的质量和性能的主观感受。说的明确些,QoE就是指用户能感觉到的网页“质量”、“性能”或“舒适度”。
2网页浏览业务逻辑展现
网页浏览业务与文件下载业务相比较起来,交互性更强,业务逻辑更加复杂,导致影响因素和影响的方式的多样性。
2.1网页加载流程
首先用户访问网页,DNS服务器(域名解析系统)会根据用户提供的域名查找对应的IP地址,找到后系统会向对应IP地址的网络服务器发送一个http请求。然后,网络服务器解析请求,并发送请求给数据库服务器。数据库服务器将请求的资源返回给网络服务器,网络服务器解析数据,并生成html文件,放人http response中,返回给浏览器。最后,浏览器解析http response后,需要下载html文件,以及html文件内包含的外部引用文件,及文件内涉及的图片或者多媒体文件。并且在浏览器下载html文件的时候,浏览器还会同时进行渲染整个界面的工作。
2.2网页渲染流程
网页浏览业务的实现免不了使用浏览器。在访问服务器的过程中我们可能碰到的主要问题:404和500。404表示网络服务器无法获取数据库服务器返回的资源文件;500表示服务器由于某些原因暂时无法处理用户的http请求。
网页呈现的另一个重要过程——浏览器完成网页渲染。渲染引擎首先通过网络获得所请求文档的内容,通常以8K分块的方式完成。下面是渲染引擎在取得内容之后的基本流程如图2所示。
渲染引擎开始解析html,并将标签转化为内容树中的DOM节点。接着,它解析外部CSS文件及style标签中的样式信息。这些样式信息以及html中的可见性指令将被用来构建另一棵树——Render树。Render树由一些包含有颜色和大小等属性的矩形组成,它们将被按照正确的顺序显示到屏幕上。Render树构建好了之后,将会执行布局过程,它将确定每个节点在屏幕上的确切坐标。再下一步就是绘制,即遍历render树,并使用UI后端层绘制每个节点。
值得注意的是,浏览器在解析时,文件下载业务是停止的,在解析完成之后,才重新继续下载。上面的过程是逐步完成的,为了更好的用户体验,渲染引擎将会尽可能早的将内容呈现到屏幕上,并不会等到所有的html都解析完成之后再去构建和布局Render树。它是解析完一部分内容就显示一部分内容,同时,可能还在通过网络下载其余内容。这样也就造成了人们有时会看到网页整体加载出来了,但是某些部分的详细内容并没有加载出来。由于我们这里使用的视觉信息,我们并不是用单纯的页面整体文档时间,而是使用用户浏览完网页的时候,整个网页的加载时间。
3基于视觉信息的网页浏览业务的QoE评价模型
上面的这些过程任何一部分出现问题,都会造成网页总的打开时间的延长,这些过程的时间很短,并且不连续,造成了分析的困难性。所以我们一般都采用页面显示中显示的总的加载完成时间T来综合上面这些过程的运行时间,人主观的影响因素,我们通过最后的参数选取来进行平衡。同时随着心理学理学WFL在这个领域的运用,网页评估业务QoE的评估,基本上都是使用公式f1)所示。
MQoE=A·ln(T)+B
(1)
其中A和B都是固定参数,这两个参数是使用主观MOS值拟合出来的数值。作者通过实验验证出:网页内容丰富程度是会对用户的主观评价产生一些影响,虽然不是关键因素,但是也有不可忽略的影响。一般来说我们对网页信息量的获取都是通过眼睛获取信息,人对网页这种界面式的服务,一般认为网页内容的丰富程度并不是简单地加载图片,而是人眼睛看到的内容经过大脑的分析之后,大脑认为的信息量多少。所以我们在这里分析的时候,考虑引入网页视觉信息量的大小,来构建网页浏览业务的QoE评价模型,如公式(2)所示。
注:I代表视觉信息量,T代表网页加载时间,A、B为待求参数,v为视觉信息速度。同时为了与文件下载业务的QoE评价模型形成实现统一,这里我们将S/T变换为v,v单位时间内获取的视觉信息量,也就是基于视觉信息的网页下载速度。接下来我们主要进行网页视觉信息量的分析和提取。
4網页图像信息量的提取
现在关于图像信息处理的研究已经得到广泛地发展,例如:图像编码,图像解码和传输等。根据香农信息论,一个事件包含了高的信息,它出现的概率可能性比较低。因此图像信息量的提取可以通过出现可能性的测量来实现。使用图像信息理论来研究图像质量的评估,其结果表明,图像信息对人的视觉信息感知有主观的影响,并且可以用这个主观影响来建立模型。作者以视觉显著度(ROI)的方法来计算图像的信息量,并且验证了这种算法的可行性。一个视频的每个帧被划分成小片,并且这样的一个特定帧的贴片被称为空间事件。我们通过估计上面所说特定帧的空间事件的可能性获得可视信息量。图像视觉信息量提取方法如图3所示。
首先,图片被分成许多8x8的小块,每个小块B(x,y)出现在坐标(x,y)的概率表示为P(B(x,y)),用这个概率来表示小块B(x,y)的唯一性。根据信息理论,图像的视觉信息量提取可以简单地使用每个小块出现的概率来简单计算。
图片在电脑中是由无数个像素点组成的,像素是图片信息的最小组成单位,理论上我们可以把单个的像素点看作一个空间事件来计算每个像素点。但是由于人眼的识别度并没有达到那么高的程度,而且每个像素点作为一个空间事件,会造成很大的计算量。所以,我们采用8x8的图像块作为最小单位,对图像进行分块处理。另外还有一个原因就是,我们之后会使用DCT变换,使用8x8小块对于DCT计算有便利之处。
由于原始图像数据之间的相关性造成了提取块出现概率的困难。因此,有必要摆脱数据的相关性。离散余弦变换(DCT)作为一种获取独立数据的正交变换方法,在图像处理和视频编码领域获得了广泛地运用。DCT编码属于正交变换编码方式,用于去除图像数据的空间冗余。并且将图像从空间信息量变换成独立的频域分量,便于我们提取相应图像块的特征。
我们从一副图像中获取视觉信息量的步骤如下:
5结论
QoE本身是一项综合指标,影响QoE的因素有很多,本文主要研究图像信息对QOE的影响。除了图像信息以外,文字信息量的提取也对网页浏览业务QoE评价有很大影响,笔者将在后继的研究中给出相关模型和仿真。