法律咨询网站用户行为分析与服务优化
2016-12-28胥晓莎潘理杨勃
胥晓莎,潘理,杨勃
(湖南理工学院信息与通信工程学院,岳阳 414006)
法律咨询网站用户行为分析与服务优化
胥晓莎,潘理,杨勃
(湖南理工学院信息与通信工程学院,岳阳 414006)
针对某法律咨询网站交互能力不足、查询效率不高等问题,通过用户行为分析,提出网站服务优化方案。首先对网站访问数据进行数值化预处理,然后进行用户行为特征分析,找到影响服务效率的因素;然后,提出网站服务性能评价模型,从访问成功率和访问效率两方面评估网站服务性能;最后,通过优化常用关键字列表、组合条件查询、内容页面链接等方案,使网站访问成功率和访问效率得到较大提高。所提网站服务性能评估模型具有较强的普适性,可为其他专业网站性能评估和优化设计提供参考。
法律咨询网站;用户行为分析;访问成功率;访问效率
随着我国社会经济发展,法律服务需求不断增长,但法律资源总体稀缺,且地区分布不均衡。法律咨询网站应运而生。但由于法律事务的复杂性、多样性、专业性,与当面咨询相比,现有法律网站交互存在功能不足,无法与用户形成有效互动。并且绝大多数用户缺乏专业法律知识,难以通过网站导航、关键词搜索等传统方式准确搜索,影响用户体验,限制网站发挥作用。因此,为了提高服务效率,高效、快捷地找到针对性的法律知识、相关案例或专业律师至关重要。
随着移动互联网的快速发展,网络搜索的用户规模不断增多,理解用户行为模式和对网络用户行为分析对系统优化至关重要。万飞、赵溪等通过对查询词分析,会话分析和用户点击分析并与互联网搜索引擎指标进行对比,分析得出移动搜索引擎算法改进与系统优化具有一定的参考意义[1]。岑荣伟,刘奕群等基于7.56亿条真实网络用户行为日志,对用户行为进行分析和研究。主要考察了用户搜索行为中的查询长度,修改率,相关搜索点击率,并考察了用户在不同查询需求下的行为差异[2]。荣国婷、王建冬等基于日志挖掘对图书馆主页网站用户行为[3]和用户期刊数据库检索行为进行分析[4]。上述研究对网站服务性能评估具有一定参考意义,但未对访问成功率和访问效率等服务性能指标进行深入探讨,而这两个指标对于法律咨询网站服务效率评估非常重要。
本文某法律网站提供的用户访问日志数据的基础上,通过分析用户行为特征,找到影响网站访问效率的主要因素,然后从访问成功率和访问效率两个方面,提出网站服务性能模型,评估网站目前的服务性能。最后,从关键词、组合查询、页面链接等方面提出服务优化改进方案,通过实验数据对比发现,新提出的改进方案在访问成功率和访问效率方面均有明显提高。
1 用户行为分析
由于原始数据存在多源性、多样性特点,不利于数据的统一运算和处理,需要通过对网站访问数据进行规整和预处理,找出反映网站服务效率和用户体验的特征和规律,形成一种计算网站服务效率的评估方法,从而分析得到影响访问成功率等性能指标的主要因素。
1.1 数据预处理
本文分析的数据对象来源于某法律快车网站的用户访问数据记录,时间范围从2015年3月1日~2015年3月25日。提供的主要数据文件包括:经过整理的网站访问记录文件:包含所有类别的网站访问记录文件4个,共189938条访问记录,每条记录包含13项属性。另外,还提供离婚类别的记录文件5个,共293999条访问记录,列属性项与所有类别的记录文件相同。原始访问日志文件:包含65535条原始访问日志记录,每条记录包含20项属性。常见关键词列表文件:包含4850项常见法律专业关键词。页面分类信息文件:包含30条页面分类信息,每条信息包括3项内容:页面分类编号、网址、页面标题。此外,还提供了部分律师信息文件和部分网站页面文件。
数据预处理过程包含对网站提供的数据进行合并、转换等预处理操作。综合主体数据文件中的各项数据采用数值类型。通过对各个不同来源的原始数据进行转换和重塑,统一规整为数值类型,以方便数据的统计和分析。
1.2 用户行为特征分析
主要从用户关注领域,访问时段分布,用户会话次数,前导链接使用,用户地域分布,用户访问来源等几个方面对用户行为特征进行分析。
通过数据,可得用户行为特征如下:(1)访问量靠前的18类关注领域(占领域总数的23%)的访问记录数达到143994次,占用户总访问量的76%,而访问量排名靠后的61类关注领域占总访问量的24%。(2)工作日上升,休息日回落,周期性分布明显。(3)对用户会话次数统计分析发现:该网站用户更偏向于使用1次会话,说明网站并没有引导好用户进行多次会话,反映该网站的交互功能不足。(4)对用户前导链接使用统计分析发现:绝大多数用户没有在日志中留下无前导链接,说明并没有在网站中进行多次路径跳转,反映网站页面导航或交互功能还有待进一步改进。(5)对用户地域分布统计分析发现:用户地区分布明显不均衡。(6)通过对用户访问来源可知:搜索引擎是用户访问该法律网站最常用的方式。
2 网站服务评价模型
法律咨询网站是为用户提供法律信息服务的,用户能否成功访问到感兴趣的页面,用户经过多少次跳转才访问到感兴趣的页面是衡量网站服务质量的两个重要指标。所以我们采取访问成功率和访问效率对网站服务进行评价。
图1 网站用户行为特征分析
2.1访问成功率
(1)内容页面访问率
我们定义以下三类方式为成功访问条件:①通过直接访问到内容页面。②通过有关键词记录的搜索引擎访问到内容页面并且内容页面与用户的提问匹配。③通过无关键词记录的搜索引擎访问到内容页面,我们假设匹配性符合随机分布。
根据网页分类信息文件,可以将该法律网站的页面分为以下三种类型:法律咨询相关页面Nq,律师查询相关页面;其他法律知识页面。类似地,该法律网站的内容页面也分为以下三种类型:咨询内容页面;律师内容页面;其他知识内容页面。
特定页面访问率:
N为网站页面访问总量,NX为特定页面访问量,x∈{q,l,k},Nq为咨询页面访问量,Nl为律师页面访问量,Nk为其他知识页面访问量。Rx为特定页面访问率。
内容页面访问率:
特定内容页面访问率:
Nc为内容页面访问总量,Ncx为特定内容页面访问量,Rcx为特定内容页面访问率。
(2)搜索提问与内容页面的匹配率
该法律网站提供了常见法律专业关键词。根据关键词列表,定义问题和页面的专业关联性。我们将页面与问题的匹配率定义为页面与问题有匹配的访问数与该页面的访问量的比值。
搜索提问与内容页面的关键词匹配数:
Mq表示搜索提问包含的关键词的集合,Kq=|Mq|表示提问包含关键词的数目,Mp和Kp表示页面包含的关键词的集合和关键词的个数。Kq(或Kp)越大,表示该提问(或页面)与法律专业的关联程度越高。Kq(或Kp)大于0,表示提问(或页面)与法律专业的关联。Mqp表示提问与页面共同包含的关键词集合,用Kqp表示提问与页面共同包含的关键词个数。Kqp大于0,表示提问与页面的有匹配。Kqp越大,表示提问与页面的专业匹配度越高。
访问特定内容页面条件下的匹配率:
Ncx为特定内容页面访问数,NX|cx是访问特定内容页面条件下包含搜索提问的访问记录数,则RN|cx是访问特定内容页面条件下搜索提问与页面内容的匹配率。
(3)内容页面访问成功率
特定内容页面的访问成功率:
用SX|cx特定内容页面的成功率。特定内容页面访问成功率SX|cx等于特定内容页面的访问率Rcx和访问特定内容页面条件下的匹配率RX|qx的乘积。
内容页面的平均访问成功率:由式(7)计算可得:该网站内容页面平均访问成功率Sc=36.97%。
表1 内容页面的访问成功率
由此我们可推断出:由于用户缺乏专业法律知识,不能准确使用恰当的关键词进行搜索,导致搜索效率降低,无法有针对性地高效找到相关页面,影响用户体验。
2.2访问效率
用户进入一个网站浏览网页时,也会有一个“参观顺序”,这个顺序就是用户浏览网页的路径。访客先浏览哪个页面,后浏览哪个页面,这些都包括在访问路径里。定义访问路径长度Lu为用户u在网站中跳转的页面数。用户u访问路径长度越大,说明用户需要经过更多次跳转才能到达最终页面,用户访问效率就越低。因此我们使用路径长度的倒数定义为用户这次访问的效率。即访问效率=1/路径长度。
用Eave表示网站的平均访问效率,则:
网站的平均访问效率:
拓扑结构,我们进一步改善了网站访问效率。根据式(8)计算可得:改进后用户成功时的平均路径长度为1.5035,改进后失败访问时的平均路径长度为2.0894,改进前平均访问效率55.17%,改进后平均访问效率65.06%,优化了约10个百分点。
表2 网站访问效率
表3 访问成功率改进对比
根据(式8)计算可得:网站的平均访问效率为55.17%。由于网站内容页面缺乏相关性链接,导致一些访问需要经过多次跳转才能找到目标页面,增大了平均路径长度,减低了访问效率。
3 服务优化方案
表4 改进前后访问效率对比
通过分析用户在关注领域、用户体验等方面的特征和规律,发现该网站在查找相关页面或专业律师的成功率和效率等方面还存在问题。
访问成功率的改进方案包括:(1)增加常用非法律关键词列表,提升问题与页面的匹配率。(2)增加关键词的领域关联,提高关键词之间的关联性。
访问效率的优化方案为:(1)增设组合条件查询功能,减少用户查找的页面跳转数,提高查询效率,改善用户体验。(2)优化网页链接结构,减少用户回退次数。
通过增加非专业关键词和增加关键词的领域关联,明显提高了对通过关键词搜索进入页面的匹配度,从而改进内容页面的访问成功率。根据式(7)计算可得改进前的内容页面平均访问成功率Sc=36.97%,改进后内容页面平均访问成功率Sc=49.15%,提高了约12个百分点。通过增加组合条件查询功能和优化网页链接
4 结语
本文针对法律咨询网站服务效率偏低的问题,提出网站服务性能评估模型,通过用户行为分析和性能评估,给出相应优化改进方案,使网站服务效率得到明显提高。论文从访问成功率和访问效率两个方面定义网站服务性能。访问成功率反映用户成功访问到感兴趣的内容页面的概率;访问效率反映用户需要经过多少次跳转才访问到感兴趣的页面。通过对访问数据进行评估计算,找到现有网站服务效率偏低的主要原因,并通过增加常用关键词列表、增设组合条件查询等方式提高网站服务质量。实验对比发现,改进后网站服务性能得到较大提升。
[1]万飞,赵溪,梁循,等.基于移动互联网日志的搜索引擎用户行为研究[J].中文信息学报,2014,28(2):144-150.
[2]岑荣伟,刘奕群,张敏,等.基于日志挖掘的搜索引擎用户行为分析[J].中文信息学报,2010,24(3):49-54.
[3]荣国婷,罗勇,孙建军.基于日志分析的图书馆主页网站用户行为研究[J].图书馆杂志,2015(7):59-63.
[4]王建冬,王继民.基于日志挖掘的高校用户期刊数据库检索行为研究[J].北京大学学报:自然科学版,2012,48(1):29-36.
User Behavior Analysis and Service Optimization for Legal Advice Website
XU Xiao-sha,PAN Li,YANG Bo
(Department of Information and Communication Engineering,Hunan Institute of Science and Technology,Yueyang 414006)
Puts forward a service optimization solution for legal advice websites to make up the lack of interaction capacity and low query efficiency by the analysis of user behaviors.At first,makes the preprocessing of numerical normalization for the raw website data.Then,analyzes the user behaviors to find the factors influencing the efficiency of services,and defines the performance model of the website.Service performances include the success rate of accessing content page and the access efficiency.Finally,proposes an optimization solution to improve the two performance indexes by adding the common non-professional keywords and providing combination query.The proposed performance model has good suitability,and is applied to performance evaluation for other professional websites.
Legal Advice Website;User Behavior Analysis;Success Rate of Access;Access Efficiency
0 引言
1007-1423(2016)33-0018-05
10.3969/j.issn.1007-1423.2016.33.004
胥晓莎(1991-),女,湖南汨罗人,硕士研究生,研究方向为复杂系统建模与分析
潘理(1975-),男,湖南平江人,博士,副教授,研究方向为系统建模与优化、Petri网
杨勃(1974-),男,湖南岳阳人,博士,副教授,研究方向为模式识别
2016-10-14
2016-11-20