基于中国电信大数据在文旅行业应用分析
2022-09-08江庆伟刘钲江
江庆伟 刘钲江
中电鸿信信息科技有限公司
0 引言
为贯彻落实《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》和国家“十四五”文化发展规划,加快推进文化和旅游发展,建设社会主义文化强国,文化和旅游部于2021年4月印发了《“十四五”文化和旅游发展规划》。规划中明确提出,积极发展智慧旅游,加强旅游信息基础设施建设,深化“互联网+旅游”,加快推进以数字化、网络化、智能化为特征的智慧旅游发展。加强智慧旅游相关标准建设,打造一批智慧旅游目的地,培育一批智慧旅游创新企业和示范项目。推进预约、错峰、限量常态化,建设景区监测设施和大数据平台。以提升便利度和改善服务体验为导向,推动智慧旅游公共服务模式创新。培育云旅游、云直播,发展线上数字化体验产品。鼓励定制、体验、智能、互动等消费新模式发展,打造沉浸式旅游体验新场景。
1 研究背景
2020年6月江苏省文旅厅面向全省文旅系统下发《关于推进江苏智慧文旅平台建设工作的通知》,并召开《江苏智慧文旅平台省市部门联动工作会议》,进一步明确了全省数据共享要求,以期在全省形成“省-市-区县-企业”多级联动的智慧文旅体系,实现资源共享、优势互补、协同并进。
江苏电信作为省内最大的数据服务商,拥有涵盖个人价值、生活习惯、身份特质在内的54个数据种类10PB以上容量数据,全省部署200多个大数据计算节点,计算处理速度达分钟级,可面向各行业输出四大标准化产品及平台架构能力。
本文将依托中电鸿信大数据处理能力,利用中国电信基站数据,从数据获取、分析、展示等方面讨论其在文旅行业中的应用。
2 数据来源
数据来源于用户234G网络开机、关机、位置变化(基站切换)、周期性位置更新、通话、短信、手机上网行为的记录;并在秒级传送到后台,后台数据处理最短可在5分钟内呈现数据。
数据源基于电信基站定位的位置更新数据,且24小时不间断信令数据采集。基站定位只要用户开机,即可进行数据采集,并且是实时不间断的,对轨迹、行为的分析更加可靠,且不受终端本身制约。
数据源种类及传输方式、数据源字段如表1所示。
表1 数据来源信息
从底层获取的数据较为详细,为其上层的数据清洗、分析提供了基础保障,以下仅对其中部分数据字段展开讨论,A口位置更新数据如表2所示。
表2 A口位置更新数据
3 方法论
(1)样本数与精确度分析
由于中国电信手机市场占有率在30%左右,其样本的可用性,样本的估计值的精确度是作为分析成果的基础。一般认为,样本量越大,其样本的估算值精确度越高,但两者的关系并不是一种线性关系,而是一条曲线关系,也就是说,样本值与精确度并不是简单的正比关系,当样本量达到一定程度时,误差虽然还会随着样本量的增加而减少,但其减少的幅度会越来越缓慢,当靠近尾部时,基本上就是一条水平线。因此,在实际抽样过程中,抽样的样本量是总体的30%(电信的市场占有量),抽样准确度达到99.9%。样本量和精确度的关系:30%(电信市场占有量)与55%的样本量(友商市场占有量),抽样误差无显著差别。如图1所示。
图1 样本量和精确度关系
(2)电信市场占比
电信用户占比即为电信在各市级粒度的网间系统全网用户占比。目前可整合的小粒度电信用户占比包括全国各个省份及江苏省的各地市。通过数学模型反推,可获取全量用户,并且精确值控制高于98%。
反推公式:
其中,N0为指定区域全量用户;Mi为当前地市用户量;θ为常驻及工作人员数量、停留时间过短、过路的用户数量;pi为所在地市电信用户占比,按月调整;Mj为本省除当前地市外的其他各地市用户量;pj为其他各地市电信用户量占比;Mk为其他省各地市用户量;pk为其他省各地市电信用户占比;φ为其他用户(如未能匹配到地市的用户);ω为调节因子。
4 建设成果
(1)接待访客分析
针对全域范围内的访客,进行访客总量、访客属性、停留时长及过夜情况等进行分析,具体分析维度包括以下方面:
访客总量与构成分析:展示访客总量、省外访客量、省内跨城市访客量;
访客量变化趋势:展示近七天访客总量数据;
访客来源分析:展示访客的省内城市、省外省份来源地分析;
访客属性分析:访客年龄、性别占比分析;
省外访客平均停留时长:展示省外各省份访客平均停留时长;
省内跨城市访客平均停留时长:展示省内跨城市访客平均停留时长;
访客过夜构成分析:展示过夜和非过夜访客占比;
省外访客过夜量排行:展示省外各省份访客过夜量占比;
省内跨城市访客过夜量排行:展示省内跨城市访客过夜量占比;
过夜分布分析:展示过一夜、过两夜、过三夜、过四夜及以上的访客占比。
图2 接待访客分析
(2)居民出游分析
针对居民出游客流量、出游客流变化趋势、出游客流属性等进行分析,具体分析维度包括以下方面:
出游客流量分析:展示本市居民出游外省省份客流量,并进行排行;
停留时长排行:展示居民出游外省省份停留时长排行;
出游客流变化趋势:按天展示居民出游客流变化趋势;
出游客流属性分析:展示居民出游客流属性占比。
(3)专题分析(文旅产业资源分布)
实现景区景点、酒店、文博遗产、文化娱乐、艺术演出、文体休闲、服务支撑、文旅单位等产业资源通过一张图进行综合展示,全面监测文旅产业资源情况,摸清文化和旅游产业家底,具体包括:
产业资源分布:展示产业资源在全市的分布情况及数量统计;
产业资源包括:旅游资源、文博场馆、服务支撑、数字文化、创意设计、文体休闲、文化娱乐;
支持点击产业资源图标,显示相关产业名称、地址等基础信息;
展示景区景点和酒店好评率、差评率排名;
文体旅产业投资及运营分析:文旅产业项目投资金额、投资进展及运营成果分析。
5 结束语
本文从中国电信海量数据中的一个点出发,以基站数据为基础,依托大数据能力,实现了数据在生产生活中的变现。中电鸿信作为中国电信集团的旅游行业信息化应用基地,利用中国电信内部大数据,包括中国电信基站数据、消费数据等,通过对数据的汇集、清洗、脱敏等方式,服务于政府行业,在疫情管控、文旅运营、商户选址等方面提供专业化的服务,尤其文旅方面,结合了中电鸿信的专业开发能力,已经持续为江苏省文旅厅、安徽省文旅厅、苏州市文旅局、徐州市文旅局、南京钟山风景区、张家港双山-香山风景区等多个政府、景区提供专业化、数据化的智慧管理、智慧运营、智慧服务的信息化系统服务。中电鸿信将会在现有成果基础上,继续开展文旅行业精准营销、精准宣传等方面的研究,进一步提升通讯行业数据变现能力。