APP下载

基于多核兼容浏览器的用户行为分析

2020-01-02李方军王亚婷

数字通信世界 2020年3期
关键词:日志浏览器客户端

李 策,李方军,王 华,王亚婷

(1.国网甘肃省电力公司信息通信公司,兰州 730050;2.国网甘肃省电力公司,兰州 730010)

1 基于服务器日志收集和分析用户行为数据的方法

当前,基于网络服务器日志的使用方法主要是在网页浏览器中可以自动地获得用户的行为采集数据常使用的日志采集方法,主要是分析和采集基于网络和Web的服务器对用户的日志采集信息的自动研究和采集数据。所谓基于服务器的自动日志采集文件顾名思义即实时地统计、实时地记录一连串的日志活动,包含主要服务器对顾客的日志请求和服务器自动给予的次要顾客响应。在实际的自动日志分析和采集的过程中具体的自动日志采集形式,取决于使用web服务器的日志类型根据使用网络以及自动生成的数据日志格式不同。

基于Web服务器自动日志的实现方法的着重获得日志文件经过分析后存在巨大价值的结果数据。①一方面使用web网络服务器的自动生成的日志采集文件,所产生的成本较低;②与人为自动建造的日志数据可用性环境研究所得的数据相比,在一个能更好地反映服务器的日志采集文件中所得到的日志数据的可用性环境中真实地反映了访问者的真实使用状况 ;③与抽取有限用户在有限时段内在内分析获得统计数据相比较,采用Web服务器日志文件分析方法获取的大量数据信息,可以对任意时间内的指定或海量用户的行为分析数据,这样的数据分析结果对进行用户行为分析有着不可比拟的优势,也就是我们可以用数据采集和发掘等其他的技术手段来分析这些用户。

基于服务器日志的一些缺点服务器日志的数据分析方法,还有很多不足之处,因此日志数据分析文件被合理的设计成主要用于分析网站根据级别和性能的统计分析数据,坦白的说就是能够提供大量日志文件的记录分析 的网站和研究数据生产性必要的统计数据用网站相比,稍稍有一些不足,研究的潜在的数据生产性只有少量的统计数据是尽可能提供的,而可能性也只有尽可能提供一部分具有误导性的统计数据。这可能是因为只要现在的web代理服务器发送了出去的请求用户就能看到请求的页面,一旦现在的用户不需要发出请求,那么现在的web代理服务器并不记录过去的访问网页与当前访问者之间究竟发生了什么。

几个典型的有关日志文件所获数据不足,存在误导性数据的例子:

(1)Who正在访问某一网站。若应用想让所有者知晓究竟是某些人正在访问某一网站,就必须要求日志文件中包含当前网站访问者的动态Id和地址代理服务器的客户端登录标识,日志的文件提供着关于顾客的动态Ip和地址的代理客户端的登录信息。这些顾客动态Ip和地址在一般情况下都提供有关Internet服务提供商的用户动态Ip。且很多时候是可以通过代理服务器去访问某个地址的,这种情景下,就无法支持让用户知晓怎样的情况下可以访问怎样的网站。

(2)用户在每页的停留时间。日志文件所能够记录的访问停留时间只是用户开始日志文件传输的时间,而不是传输任务完成的时间。在下载页面的过程中,不能有效记录用户开始浏览页面的时间。若记录页面显示的时间,倘若用户因事离开,只能是当前的日志文件请求和下一个会话中能够接收到请求的网站用户之间的对话时间来大概计算停留在此页面的时间。

(3)怎么确定在网站成功完成操作任务。这个问题涉及到日志文件的适应性设计问题,单单通过日志管理的文户是基本不可能被回答的,倘若判断"用户是否完成审批?是否成功提交?"此类操作结果不难被推断出来。然而,倘若想要十分确认的回答"访问者有没有找到预查询信息?"如此需求,若只是通过单一日志方式进行分析,结果是差强人意的。

Click Traces Analyzerr是一套网站辅助工具,该工具基于用户通过服务器的日志以及下载文件方法获取数据,是专门进行分析、统计网站访问轨迹以及用户操作行为的典型有效的数据分析工具。Click Traces Analyzer工具的致力于深入地探知大量网站用户的访问需求以及浏览网站行为、习惯分析设计等强大的数据分析功能,而后将大量复杂数据采用相对简单的数据分析方法展示出来,大大地增强了数据分析辅助工具的功能和可用性,管理分析数据技术人员在按需进行数据分析时,网站的访问行为状态可全盘掌握。

2 采用客户端模式获取用户的行为分析数据的好处和优点

现实的工作环境下进行的访问操作,这样就可以避免一般性的人为干扰以及嘈杂环境条件等干扰因素,这样客户端获取和收集到的用户行为数据就会更加真实。

相较于其他常用的基于日志文件类的数据收集分析方法,从访问者PC端获取和收集得到的行为分析结果要更加准确,更加地能够有效克服上述的众多复杂问题。

因为采用客户端方式记录操作行为数据,故而客户端的程序会自动执行追溯用户访问记录的路径,浏览的网页等。这种跟踪情况是不会因为用户行为改变的,与用户是不是通过本机缓存或通过代理服务器进行网页访问无关。

3 行为分析成果

通过比较客户端收集、分析用户行为数据方法优劣对比,使用的用户会通过浏览器来访问内部业务系统,多核智能浏览器会纪录访问痕迹,浏览器后台分析中心会对用户访问数据做用户行为分析,例如:智能运维运行监控。

智能运行监控模块通过客户端收集和分析用户行为数据的方法,可自动采集用户终端基础信息:自动采集个人终端的计算机配置(内存、CPU、带宽、品牌等基础信息),用于实时掌握全省终端情况,建立台账信息,为后续终端精益化管理提供良好基础。

智能运行监控可自动采集用户访问页面数量及效率:自动采集每个用户访问的每个页面时长,为公司定位各业务系统以及业务模块的响应性能提供真实有效数据,为后续优化系统性能及系统升级改造提供数据支撑。

全程记录用户的所有访问行为,真实反映各业务系统的应用情况,为公司辨别“僵尸”系统提供有力手段。对用户操作行为数据进行分析,在大数据时代创造新价值。

4 结束语

多核浏览器作为电力企业各系统访问的客户端,强大的后台管理功能可以对终端用户访问网址进行监控,发现异常可通过后台直接禁止该浏览的使用,同时该浏览器可以和企业中台进行对接,浏览器以微服务、微应用的形式调用中台各类应用。提升电力企业内部业务系统访问便捷性,同时可以对业务系统访问进行集中访问控制。根据电力企业目前业务系统的访问情况,通过多核浏览器可以有效解决各部门科室业务系统访问繁琐问题,同时也可以通过浏览器与企业中台进行对接,对电力企业内微服务微应用通过浏览器进行数据共享等。

猜你喜欢

日志浏览器客户端
一名老党员的工作日志
扶贫日志
反浏览器指纹追踪
县级台在突发事件报道中如何应用手机客户端
孵化垂直频道:新闻客户端新策略
基于Vanconnect的智能家居瘦客户端的设计与实现
游学日志
环球浏览器
再见,那些年我们嘲笑过的IE浏览器
一种基于粗集和SVM的Web日志挖掘模型