基于用户画像的气象服务系统设计与开发
2021-01-13陈冲陶慧青张锋王伟李俊徽
陈冲 陶慧青 张锋 王伟 李俊徽
摘要:针对互联网气象服务手段与产品千篇一律现状,提出了基于CRAP架构的系统设计,将信息采集、云库集成、分析系统与主动推送融合为一体提升气象服务能力,系统依托天气罗盘及智慧气象等浙江省气象局的服务平台和出口积累的用户行为数据,挖掘用户访问量、访问偏好和访问时长等信息,结合用户画像分析方案得出规律性特征,指导气象服务信息技术开发策略和气象服务产品研发,最终实现气象服务产品个性化无感推送。经实验和应用表明,利用基于用户画像的气象服务系统较好地提升了用户体验,为互联网式的气象服务向智能化、智慧化气象服务发展提供了参考。
关键词:用户画像;气象服务;CR AP;个性化;无感推送;智能
中图分类号:P409;TP399文献标志码:A文章编号:1008-1739(2021)23-61-5
0引言
随着互联网气象服务发展,气象产品趋同态势严重[1-3],用户体验感下滑,气象服务与用户需求不一致导致矛盾进一步加剧,如何掌握用户对气象信息的个性化需求成为公众气象服务的一大痛点[4-8]。
本文提出了基于CRAP架构(Collection信息采集+RDS云库集成+Analysis分析系统+Push-Service主动推送服务),对浙江气象服务出口采集气象用户行为信息进行分析,完成靶向气象服务产品自动化加工,最终再次通过服务出口实现个性化主动智能推送服务的方案。解决了分众场景不同用户对气象服务产品的具体需求,实现气象服务由用户主动获取气象信息变为感知用户需求,智能推送个性化气象信息,有效提升了用戶的体验感。
1系统设计
1.1用户行为采集系统
用户行为采集系统即CRAP架构中的Collection,本文针对天气罗盘、智慧气象[9]等浙江省气象局服务平台和出口的大量用户日常使用偏好等基础数据[10-13],对其进行了分布式标准化分析、处理并存放于数据存储中心统一管理,形成用户画像基础数据库。
数据采集方式主要是页面标签法[14-16],将定制化的JavaScript等代码植入服务平台,当用户对平台页面中的标签进行操作时,触发采集机制,该办法尽可能满足了当前平台的服务模式,能够在不影响用户体验的前提下较全面地采集用户体验的行为数据。对上述平台的各大功能子模块植入埋点,部分埋点位置如图1~图3所示。
当用户访问平台或者各模块时,触发当前监测事件,采集数据的脚本代码才会被触发,从而采集用户行为数据。埋点技术有2个比较明显的优势:每一个用户的操作行为都是被单独监测采集的,在一个页面文件中可能会存在多个函数被植入多段代码,这样可以保证监测的每一个用户的交互行为事件是独立并且完整的;其次是每一个页面都是独立的,因此采集到的数据没有重复性减少冗余,利于后期CRAP架构中RDS云库上的存储。因此,本文在进行埋点之前先整理并设计好需要采集的数据类型,具体植入采集数据的位置等。部分信息采集字段如表1所示。
信息采集表的字段将为RDS建表字段设立奠定基础,而RDS用户行为记录表则作为用户推送服务产品研发的基础依据,主要对用户行为数据记录统计,有助于确定用户使用习惯、当前状态等信息,便于根据实际情况进行智能定制产品,也有助于后续改进或者优化相应的推送服务产品。
采集数据储存于RDS阿里云库与OSS对象存储,由结构化的数据库表以及JSON、txt等数据类型组成,RDS记录表如图4所示。基于阿里云的存储方案,使得系统支持高并发读写,性能优良。同时,接口服务使用的是阿里云企业级分布式应用(EDAS),具备高效、可靠、易拓展等巨大优势[17-23]。
1.2用户行为采集系统
用户行为分析系统即CRAP架构中的Analysis分析系统,该系统主要针对存储于RDS与OSS的用户行为信息进行进一步分析与研究,从数据中了解用户在气象应用时的浏览方式,访问的气象要素与行为习惯等信息自动研制定制化气象服务产品,具体定制产品对应方案如表2所示,并以API形式提供中间件,该分析方案的主服务部署于阿里云上自建的推送服务集群中,以较高性能与可靠性来获取详细的用户行为信息及分析结果,用户的行为分析系统整体架构如图5所示。
该系统的个性化推送产品所使用数据源众多,因此该系统针对浙江省气象局气象实况、预报等数据特征,研发了针对性较高的解析与加工程序,同时将其解析中间件存储于阿里云OSS,Hbase,Redis等供后期调用。对于数据库中的数据,为了保证访问程序性能与服务器性能,采用将数据存储为JSON、XML等格式作为二次交换文件使用,用户行为分析系统可视化流程如图6所示。
用户行为分析系统包含用户访问气象要素分析、用户访问气象频道分析、用户访问时间、位置分析及其他功能使用率分析等。目前用户行为分析系统智能分析的气象服务产品方向达13个,含上下班天气、气象类指数、交通气象安全、短临天气、环境、台风以及观潮等。
1.3个性化气象服务无感推送系统
2应用情况
基于用户画像的气象服务系统于2020年11月正式应用于浙江省气象服务中心开发的《智慧气象》App、《天气罗盘》App等服务出口,自该系统应用起至2021年6月,《智慧气象》App用户累计活跃数达130万,月均活跃数达20万,相较于之前有了明显提升,同时,基于《天气罗盘》App的主动推送服务达到近30万次。系统推送效果如图8所示。
根据浙江气象服务出口用户活跃度数据库查询,集成了用户画像气象服务系统的《智慧气象》App、《天气罗盘》App等服务出口,自2020年11月至今,用户活跃度总体稳步提升,用户活跃度如图9所示,因此,该系统有效提升了用户的体验感,得到了良好的服务回馈。
3结束语
实践证明,基于用户画像的气象服务系统较好地解决了分众场景不同用户对气象服务产品的具体需求,实质上是将气象服务由用户主动获取气象信息变为了感知用户需求,再将用户所需气象服务产品推送给用户。一方面,该系统让用户无需再通过互联网检索其所需常规气象信息;另一方面,系统提供的气象信息正对性更强,用户个性化服务特征更为显著。为进一步加强应用效果,下一步可以扩大收集范围接入第三方的用户行为数据,同时不断完善CRAP技术架构,开展大量的训练,改进应用功能和服务体验。
参考文献
[1] COFINO A S,GUTIéRREZ J M,JAKUBIAK B, et al. Implementation of Data Mining Techniques for Meteorological Applications[M].Realizing Teracomputing,2003.
[2]方学锋.试析互联网与气象服务的融合与发展[J].科学与财富,2017(33):137.
[3]华岩.山东气象局气象服务产业发展战略研究[D].济南:山东大学,2006.
[4] WU X,CA O Y,GAO G,et al. Relationship Among Public Cognition, Perceived Value, and Meteorological Service Satisfaction[J].TropicalConservation Science,2019,12(5): 1-5.
[5] NIE, FengYing. A Value-oriented Model of Big Data-driven Knowledge Management and Collaborative Services: Ameteorological Service Case[C]//International Conference on Information Management. Chengdu:IEEE, 2017:511-516.
[6]廖賢达,姚学民,黄学忠.行业气象服务要点探讨[J].气象研究与应用,2008,29(4):86-89.
[7] BRUNO L,TORDK.Calculating Workplace Wbgt from Meteorological Data: A Tool for Climate Change Assessment[J].Ind Health,2012,50(4):267-278.
[8]徐鹏,张玮,沈文颖.全媒体时代公众气象服务发展浅析[J].科技传播,2017,9(8):87-88.
[9]马琰钢,沈萍月,邓闯.基于ArcGIS Mobile的“智慧气象”数据服务技术研究[J].数字技术与应用, 2015(9):62.
[10]李建,张锋,陈冲,等基于AI智能语音交互气象服务的研究与应用[J].计算机技术与发展,2020,30(12):197-202.
[11]尚燕敏,曹亚男,韩毅,等.基于主题和大众影响的用户动态行为倾向预测[J].计算机学报,2018,41(7):1431-1447.
[12]廖祥文,郑候东,刘盛华,等.基于用户行为的情感影响力和易感性学习[J].计算机学报,2017,40(4):955-969.
[13]孟祥武,李瑞昌,张玉洁,等.基于用户轨迹数据的移动推荐系统研究[J].软件学报,2018,29(10):3111-3133.
[14]宋杰,王大玲,鲍玉斌,等.基于页面Block的Web档案采集和存储[J].软件学报,2008(2):275-290.
[15]王雅坤.电商网站用户行为实时监控系统的设计与实现[D].北京:北京交通大学,2016.
[16]李冰.基于Android日志的APP用户行为分析研究与实现[D].北京:北京邮电大学,2018.
[17]陈金光.基于阿里云的Kubernetes容器云平台的设计与实现[D].杭州:浙江大学,2018.
[18]杨挺,王萌,张亚健,等.云计算数据中心HDFS差异性存储节能优化算法[J].计算机学报,2019,42(4):721-735.
[19]黄华,彭蓉,冯在文.基于行为的大规模云工作流模型库高效检索方法研究[J].计算机学报,2018,41(6):1018-1034.
[20]牛禄青.阿里云:创新云计算[J].新经济导刊,2013(3): 66-68.
[21]骆小龙,虞开森,余金铭,等.基于阿里云的台风路径实时发布系统研究[J].计算机时代,2015(2):15-18.
[22]苏鹏,刘甚灵,张春元.多云存储网关设计和实现[J].计算机研究与发展,2015,52(S2):43-48.
[23]翁湦元,单杏花,阎志远,等.基于Kubernetes的容器云平台设计与实践[J].铁路计算机应用,2019,28(12):49-53.