浅谈运营商大数据战“疫”
2020-10-09孙国斌
孙国斌
(中国联合网络通信股份有限公司甘肃省分公司,甘肃 兰州 730000)
1 运营商大数据的特点
1.1 运营商大数据的类型
O域数据:OSS域指上网行为、信令、位置等等。其中以Gn口数据最重要,包括http/WAP访问日志数据、URL解析数据、APP应用解析数据、网络轨迹、WLAN解析等;B域数据:BSS域指营帐、计费、客服、结算等系统的数据,如实名信息、套餐信息、手机号码、IMEI、IMSI、终端机型、流量消耗、通话时长、积分、是否VIP、投诉情况等等。M域数据:MSS域主要指ERP、门户、项目管理等。V域数据:VALUE域指增值业务,包括传统增值业务(短彩信、炫铃、语音增值)和基地业务(支付、游戏、动漫、视频、阅读、音乐)。
1.2 运营商大数据的优势
运营商拥有多张移动网络,具备遍布全国的丰富的站址资源,在覆盖范围、时间及用户规模上领先于其他行业;运营商以号码为唯一的ID来整合各类数据,数据的完整性是一般企业难以企及的;运营商作为数据载体,信息内容更加全面、准确。
1.3 运营商大数据的价值
运营商大数据可准确实时的反映用户行为状态,数据源自于生产网络,无人为因素干扰,具备全面性、多维性、中立性、完整性,通过这些不同维度数据的交叉关联,可以创造更多新数据和新价值。
2 运营商大数据的分析
2.1 数据的4V分析
Volume(容量):举例甘肃联通每小时有60万次移动电话呼叫,每天有70~100TB的数据访问量,每天有3亿次互联网点击量。甘肃电信每天产生10TB+话单、30TB上网日志和100TB+信令数据。Variety(多样性):从来源可见前述四个域,可根据用途分类为“消费、社交、偏好行为”,反映消费情况的有套餐数据,反映社交的有语音拨号数据,反映行为偏好的有位置数据、上网行为数据。Velocity(速度快):实时产生包括上网记录、位置信息、语音拨打数据等。Value(价值高):数据质量高,指完整性、真实性、实时性。
2.2 5W+E联动数据
利用上述原始数据衍生出用户5W+E联动数据,通过多维度数据分析,获取用户身份信息(WHO)、时间信息(WHEN)、位置信息(WHERE)、终端信息(WHICH)、行为信息(WHAT)和感知体验(EXPERIENCE),形成每个用户的动态标签库,完成对用户的全息画像。如图1所示。
图1 运营商用户5W+E联动数据分析
2.3 用户移动轨迹呈现
现在,手机已经成为我们每个人的另一张“身份证”,手机可以通过基站定位、位置服务定位而提供持有人的位置信息。一般手机在待机的时候,当用户从一个小区移动到另一个小区时,手机需要不断接收基站发出的测量信号。利用移动通信信令数据就可以知道用户所在小区,可以判断处于哪一个街区或乡村,定位精度在城市可达百米级。与此同时,移动通信蜂窝网络的半径比较小,更新速度在秒级,具有实时性优势。
3 运营商大数据战“疫”情
3.1 构建疫情传播模型
国际通用的是SEIR传染模型,其中S为易感人群,E为密切接触者,I为染病人群,R为康复人群;中国学界则提出了一种改进模型,增加了P(疑似人群)和Q(确诊人群)。目前,北大陈宝权教授团队已经发布了此次疫情传播模型,通过热度图和曲线图等数据可视化方式来展示疫情传播特点。“但是,上述模型假定该地区在疫情期间没有与外地的人员流动,如果加入运营商大数据中的人员位置可溯信息,将人员流动性考虑进去,可以使得该模型更精确。
3.2 协助控制传染源
通过运营商通信基站及核心网HLR获取的位置跟踪及漫游信息,获取人口流动数据,配合航空、铁路、公路等交通部门完善从湖北返兰人员的详细信息,助力防疫部门有效掌握重点疫区人群流动轨迹,锁定输入型感染者活动范围和散落各地的隐形传染源,为兰州及我省其他地市防控疫情提供重要参考,以便做到提前防范、精准施策。如图2,图3所示。
图2 湖北漫入用户人数统计
图3 湖北漫入用户地理分布图
3.3 提供疫情便民数据服务
随着全国疫情防控阻击战的推进,各地政府纷纷祭出互联网技术,借助大数据分析对疫情进行防控、分析和预判。
疫情期间,我省借助移动、电信、联通三家通信运营商提供的基础位置跟踪数据,上线了“疫情查询助手”二维码,助力全省街道、社区基层工作人员用于疫情排查工作。
随后甘肃“健康出行码”上线并在全省范围内推行使用,我省健康出行码系统基于通信、交通等部门提供的在甘、来甘、返甘人员数据信息、甘肃省全员人口信息库、全省新冠肺炎确诊病例、疑似病例、密切接触者、居家隔离观察人员和治愈出院人员信息库等数据,通过大数据比对,由系统后台自动生成健康出行码。这些基于大数据的疫情便民服务,为有序恢复企业生产和群众正常生活,确保疫情防控与经济社会发展同步推进做出重要贡献。如图4所示。
图4 疫情查询及健康出行二维码示意图
3.4 开发疫情防控支撑平台
疫情期间,北京联通运用网格化+大数据的思路,基于联通OSS域数据以及DPI技术,结合SEIR传染病模型建立基于运营商大数据的疫情防控支撑平台。该平台基于居民自我隔离度、高频活动等行为特征、人口密度及流动特征,评估城市中各个网格的防疫安全等级,并开发出面向疫情防控主管部门PC端平台和面向公众的手机端平台,为科学防治、精准施策的防疫支撑工作提供了一定的参考依据。如图5所示。
图5 大数据的疫情防控支撑PC及终端平台示意图
4 建议和启发
4.1 止谣和辟谣
当前,一些机构频繁发布各种基于大数据的疫情研究报告,包括自媒体、新媒体在内的各类媒体,也发布转发,甚至利用自身的大数据技术采集、整理一些疫情信息。这些报告和信息为相关部门和公众提供了信息参考,但也泥沙俱下,鱼龙混杂,甚至少数别有用心的人假借大数据技术,以迷惑误导公众。在接下来的疫情防控工作中,我们应该一方面要善用大数据及时搜索、发现虚假信息,分析其错误所在,及时公布,广泛传播;另一方面要加大对大数据技术等先进信息技术的使用,先行一步,及时向公众提供更多更好的真实信息,以免被虚假信息先入为主。
4.2 分析公众舆情指数
从2020年1月20日开始,公众对疫情的关注度开始显著提升,在1月26日到达峰值,然后趋于稳定,另外从不同时期用户浏览及留言的关键字热点所不同,公众情绪正在缓慢由消极向积极转变,但也有不少数据显示部分公众在疫情期间情绪悲观、烦躁。如图6所示。
图6 疫情公众舆情指数示意图
由此笔者建议互联网公司应该合理利用运营商大数据,适度进行逆向推送:根据手机活跃度情况,为用户定向推送室内健身的相关内容,以提高自身免疫力做到运动战“疫”;为部分搜索及浏览相关负面新闻的用户,定向推送幽默短视频及援汉医护、工程建设人员不畏死神战疫情的感人事迹等相关内容。
5 小结
运营商大数据在整个疫情防控工作过程中发挥了全面性、动态性和实时性等多方面作用,为疫情防控提供精细化数据支持。我们应该充分利用运营商大数据,在政府相关部门的指导下,发挥互联网公司的优势,在今后的日常生活或突发事件中,更好地服务于国家和人民群众。