基于认知的结构化页面风格识别
2020-11-07章蕾,董尹
章 蕾,董 尹
(合肥学院 经济与管理学院,安徽 合肥 230046)
研究表明,不同认知方式的用户在信息学习、浏览行为上有不同的偏好[1]95。因此,挖掘页面风格及用户的页面偏好的关联性对实现网站页面个性化设计及推送具有重大意义。本文在考虑网页组织的多样性的基础上,通过分析商品详情页的特点,提取页面设计属性,将页面个性特征标准化,构建高效统一的商品展示页面结构化表示模型。
一、结构化商品展示页面风格表示模型
结构化页面是指一种通过对页面版块内容、页面布局、信息展示方式等进行逻辑规划,将页面内容分解成有明确层次关系和关联性的组成部分,实现浏览者使用状况能够通过数据库进行记录和管理的页面设计方法。构建该表示模型的目标,一是依据用户的历史浏览轨迹,能更多的挖掘用户的个性页面配置属性偏好,从而推断出用户的认知风格;二是若已知消费者的认知风格,即可依据表示模型匹配出满足消费者个性化展示需求的商品页面风格和商品内容参数,进行个性化展示推荐。
风格(Style)是指由一系列要素集合具有共同的形式特征(Common Features),以某种特定的组合规则表达出来。文献[2]3025-3037将页面风格的维度进行汇总,提出了四个方面八个基本维度的页面整体风格划分方法。有大量学者认为页面的版式和布局方式是影响简洁-复杂页面风格维度的重要因素[1]96-101,如文献[3]31-36中提出页面的版式分栏越多越混合则越倾向于复杂风格。除了页面布局之外,信息的呈现方式、页面信息量也会影响页面风格。因此,用单一要素的差异难以区分页面整体风格差异,本文采用语义词汇学的方法试图找出页面风格的评价维度。页面风格是页面内容要素不同设计形式排列组合的结果,因此页面风格维度的划分和页面内容、内容设计形式、内容排列方式具有相关性。因此,可将商品展示页面设计过程模型转化为对页面内容要素(S)按照页面设计属性(D)进行表述,并以页面布局属性(L)进行编排(如图1)。
图1 商品展示页面风格表示模型
商品展示页面表示模型形式化描述如下:
W=Ξ(C)
C=Ξ(W)
W={S,D},S={SM,SP},D={DA,DM}
C={D,L},L={LA,LM},
LM∝{DM|SM,SP|}
二、基于语义意象的页面风格提取
(一)初始实验页面样本的选择及特征分析
本研究从主流电商综合平台、传统零售线上渠道、专业服务产品平台、品牌官网、促销团购平台五类产品销售主流渠道选取了25个网站的产品销售页面作为原型样本,将页面内容根据功能模块抽象并分析布局。
(二)基于词汇学方法构建商品展示网页的风格特质模型
(一)页面风格情感词原始词汇的产生
为简化实验,本研究将25个页面样本,采用“自由联想法”生成页面风格的原始词汇。利用15分钟邀请被试大学生尽可能多地写出描述页面风格的词汇。题目是:“这个页面风格是______。”676名大学生参加了测试,其中无效问卷23份。
(二)语义合并
653名被试共提供6328个词汇或短语,将重复短语合并,共确定736个不重复词。分三步筛选词汇并归类:
第一步,由两名网页设计专业的教师剔除低频词(如频次为1)和明显的不能用于描述页面风格的词汇或短语82个。第二步,选择同义词中的关键词。第三步,采用语义差异法(李克特式量表)对页面风格词汇表的准确性进行评分调查。最终获得有效问卷105份。总计8610个数据。内部一致性信度0.695,间隔一个月的重测信度在0.44~0.85之间,平均为0.75,表面效度良好。
(三)采用主成分分析获得页面风格的特质结构模型
随机生成5个正态分布的数据集,与原数据有相同的平均数和标准差。对每个数据集采用并行分析进行正交旋转的主成份分析。根据因素分析的方差贡献率(表1)和因素分析的实际效果,抽取四个主成份,构成页面风格的四个基本维度。
表1 因素分析的方差贡献率
第一主成份在“简洁、简单、便捷”等词汇上有正载荷,在“复杂、多样化”等词汇上有负载荷,命名为网页的操作感意象,其双极维度为简洁-复杂维度,正极表示页面结构简单,分栏分页不多,直接展示信息内容,操作模式以便捷为主要目的,页面信息实用,具备整体一致性的风格。
第二主成份在“扁平、丰富、突破常规”等词汇上有正载荷,在“细长、大众化”等词汇上有负载荷,命名为网页的价值观的意象。其双极维度为丰富-规范维度,正极表示页面宽阔,信息量大的个性化页面。
第三成分在“图像、活泼”等词汇上有正载荷,在“沉稳、文本”等词汇上有负载荷,命名为网页情绪感意象。其双极维度为轻松-厚重维度,正极表示页面色彩鲜艳,结构多变,多采用图像、视频等多媒体。
第四个主成份在“活跃、交互式”等词汇上有正载荷,在“封闭、专业”等词汇上有负载荷,命名为网页的活跃感意象。其双极维度为活跃-封闭维度,正极表示页面有大量外部链接、广告和推荐,提供更多产品帮助,鼓励用户分享、互动。
三、基于多元尺度相似性分析的商品展示页面风格的聚类
(一)基于多元尺度法的样本相似度分析实验
本实验以抽样方式请若干位被试者对上节中的商品展示页面样本依据个人主观感受分群。3位页面设计专家的预实验发现分群目标为4~5群时,被试者分群效果最好。被试者观察过所有样本后,把他们认为相似的样本序号填写在相同栏目内,当两对应页面为同一类时,记一分。累计所有被试的分类得分,得到相似性数值及相似性矩阵。然后将矩阵进行Multidimensional Scaling的二维至六维的多元尺度分析[4]277-287,得到表2说明六维模型对观察数据的拟合效果有效。
表2 多元尺度二维至六维指数表
表3 认知空间中各样本的坐标值
通过MDS分析得到各样本在认知空间的坐标表(见表4)。
(二)利用样本位置进行聚类分析
将MDS分析获得的样本维度坐标值作为分类变量进行聚类,结果见表4,列出了每个样本到该类别中心的距离,距离最短者可视为该类别的代表性样本。得到八类代表性样本分别为:3号、19号、12号、9号、22号、2号、7号、24号样本。
表4 聚类分析结果
四、基于嵌套随机集的页面风格与要素特征认知关系的量化实验
(一)页面风格与要素特征相关性的基本假设
通过综述行为理论与10位人机交互研究领域的专家对页面构成要素对页面风格影响的调查结果,本文对页面风格要素的考量指标提出的相关假设如下:
H1:简单-复杂风格与信息组织结构、表现形式、信息内容相关。简单风格与线性组织结构正相关;与展示风格的种类、信息内容量负相关。
H2:丰富-规范风格与信息组织结构、表现形式、页面版式、信息内容相关。丰富风格与线性组织结构负相关;与内容表现形式种类、扁平结构、信息内容量正相关。
H3:轻松-厚重风格与信息组织结构、表现形式相关。轻松风格与线性组织结构负相关;与表现形式种类正相关。
H4:活跃-封闭风格与表现形式、信息内容相关。活跃风格与图片、超链接表现形式种类正相关;与信息内容量正相关。
(二)基于嵌套随机集[5] 5089-5097的页面风格与要素特征相关性模型
页面风格与设计元素特征之间的关系构造问题可以数学描述为:
本文借鉴数量化I类理论的定性数据分析方法,利用多元回归分析,解决定性变量相关性和相似性的判别问题。将页面构成设计要素作为自变量x,页面风格评价值作为因变量y,有r个设计要素,第j个设计要素的类别数目由cj表示,当δi(j,k)=1时表示第i个样品中,第j个设计要素的定性数据为第k类。将x定义为:x={δi(j,k)},,i=1,2,…,n;j=1,2,…,r;k=1,2,…,cj
假设风格评价值与设计要素各类别的选取有线性关系,则可得到线性模型:
为了更方便的解释页面风格与页面设计要素间的对应关系,可进一步假设模型为:
为了确保模型的精度,使用复相关系数R,可按下式求解:
页面设计要素对风格评价影响的贡献值,可通过求解需求的相关偏相关系数来解决。记风格评价值y与页面设计要素的相关矩阵B及其逆矩阵B-1为:
(三)实验设计
为避免页面风格以外其他因素的影响,对聚类得出的8个代表性样本页面进行了重新的编辑,将页面保留原有的版式、组织结构和表达方式,但内容全部替换成一致的产品信息,以保证测试者不受价格、图片等具体内容的影响。
选取206名学生采用问卷调查的方式获得受测者对设计要素的主观评价,每个班观看两个页面,去除无效问卷后,每单个样本页面平均获得47份问卷结果。
1.风格意象影响因子与设计要素的回归关系
页面风格评价的数据预处理后的平均值如表5所示。将要素设计要素评分作为自变量,将某一维度的风格评价均值作为因变量,依据数量化I类的基本原理在SPSS中进行全回归模型分析,最终得到多元线性回归分析结果。结果进行标准化处理后,可得到各风格评价维度对应的项目得分、回归常数项等数据,见表6、表7。
表5 8个样本页面在4个风格影响因子下的平均值
表6 代表页面各风格唯独的要素评价得分
表7 各回归方程的常数项和系数列表
(1)决定系数
决定系数R2表示统计结果可信度。由表4可知,本研究中R2的设计要素项目得分均高于0.7,表明实验的预测精度较高。
(2)项目得分
项目得分的大小代表了各设计要素与风格意象语意的相关程度。例如,在操作感风格维度中,复杂因子这一风格维度中,偏向简单风格的得分为负,偏向复杂风格的得分为正值,数值大小表示设计元素与这一风格维度的相关程度。从表6结果可看出,版式、展示方式、交互功能、广告选项和内容选项与复杂风格维度影响程度由强到弱。
2.建立模型
将相关程度较高的设计元素作为该页面风格维度的影响因子,可建立多元回归方程。本文将相关度高于0.4的设计元素全部保留,以可操作性风格维度为例,保留的设计因素包括δi(1,1)、δi(1,4)、δi(1,5)、δi(2,3)、δi(2,4)、δi(3,1)和δi(5,4),则可建立多元线性回归回归方程为:
从上述相关因子数据,可验证假设,规范风格与单栏标准版式、文字展示方式和交互功能单一正相关;丰富风格与混合多栏版式、选项卡的展示方式和多样化的人际互动功能正相关。
厚重风格与单栏版式、文字展示方式和推广功能单一正相关;轻松风格与混合多栏版式、隐藏展示方式、内容模块多样化、第三方共享等多重互动方式因素正相关。
封闭风格与扁平单栏版式、内容模块仅包含主要信息、无交互功能和广告内容少四个因素正相关;活跃风格与混合多栏版式、隐藏或选项卡展示方式、含第三方评价和商品推荐、多种互动方式和广告板块正相关。
五、预测结果一致性验证与分析
为验证商品展示页面项目要素与风格维度相关性检验与实际页面风格评测维度具有一致性,本文将要素构成的页面风格预测结果与实验样本用户风格评价值进行了对比T实验。
(一)一致性检验结果实验设计
首先从剩余17个初始样本页面中挑出6个作为新实验样本,让受试者观察后,采用语义差异的李克特量表进行风格维度的评测;并将这6个样本的设计要素编码(如表8)代入构建好的风格影响因素模型中计算出风格评价的分值。
表8 验证实验样本设计要素编码表
邀请30位被测进行语意评价,统计结果的平均值见表9左。并将设计要素编码代入构建好的风格影响因素模型中计算出风格评价的分值,计算结果如表9右所示。
表9 验证样本的各意象语意评价平均值及风格影响因子计算结果
(二)预测结果一致性检验
将语意评价的实测值与模型计算出的风格预测值成对进行T检验(见表10)。
表10 T检验结果
从结果可看出,四个页面风格维度的实测值与预测值之间不存在显著差异,可以用该风格量化模型预测某个商品展示页面的主观评价风格,也证明了页面风格与设计要素之间存在相关性。