基于共享模式的出行大数据体系构建与应用研究
2020-03-03李川鹏王秀旭王耀福
李川鹏 王秀旭 王耀福
摘 要:本文基于共享出行模式,首先提出了一套出行数据采集、通信、存储、分析的方法论;其次通过具体实践,构建了较为完善的全景出行大数据体系;最后从智能研发、智能应用、智慧交通三个方面重点阐释了出行大数据的具体应用。
关键词:共享模式 大数据 智慧交通
Research on the Construction and Application of Big Data System for Travel Based on Sharing Mode
Li Chuanpeng Wang Xiuxu Wang Yaofu
Abstract:Based on the shared travel model, this article first proposes a set of methodology for travel data collection, communication, storage, and analysis; secondly, through specific practices, the article builds a relatively complete panoramic travel big data system; finally, from the three aspects of transportation: intelligent R&D, intelligent application, and wisdom, the article focuses on the specific application of travel big data.
Key words:Keywords: Sharing Mode, Big Data, intelligent transportation
1 引言
在未来城市出行供给不能依赖汽车保有量的粗放增长,出租车和公共交通的运力提升亦遭遇瓶颈以及城市道路资源紧缺的情况下,汽车共享出行成为一种短期有效的解决方案[1]。同时伴随着新一轮的科技革命和产业变革,数字经济和共享经济在逐步取代传统的商业模式[2],进一步使得汽车产业、出行服务乃至交通运输系统的形态及价值链发生了颠覆性改变,催化共享出行模式发生着深刻的变化[3]。针对这一现实情境,共享出行作为人、车和服务的链接,有助于推进汽车行业全产业链的生态布局。而整个汽车全产业链汇集着海量数据,基于共享模式如何捕捉汽车产业上下游价值链动态并开发潜力,有效变现数据成为重中之重[4]。鉴于此,本文基于共享出行模式,首先提出了一套出行数据采集、通信、存储、分析的方法论;其次通过具体实践,构建了较为完善的全景出行大数据体系;最后结合汽车专业细分领域的研究,对运营大数据进行即时分析,从智能研发、智能应用、智慧交通三个方面重点阐释出行大数据的具体应用。
2 出行大数据体系的構建
随着共享出行车辆持续运营,采集到实际情况下的运营数据已达TB级,目前已形成一整套较为完备的数据采集方案,但本文旨在数据采集标准化和数据采集、传输、存储和处理的体系化方面实现重点突破。因此,本文构建了出行大数据采集、传输、存储、处理的全生命周期的数据体系。
2.1 数据的采集
在数据采集标准化方面,首先确认数据采集的范围,确认采集人、车、环境三大类构建运营数据体系,采集频率方面将数据分为周期性采集、触发性采集两类,其中为保证数据分析价值,单数据周期性采集最快频率为100Hz,硬件到数采的接口以及数据处理的平台标准。具体如表1所示。
数据采集通过T-BOX、V-BOX、记录仪、传感器和摄像头等多种方式融合的方法来实现。通过T-BOX、车身CAN总线、GPS/BM、加速度传感器等来采集车的数据和人的部分数据(如驾驶行为等数据),通过CAN 解码数据处理与主控MCU融合,实现数据精准读取、支持实时数据获取;通过摄像头、记录仪和V-BOX实现人的部分数据和环境数据的采集。
2.2 数据的传输
在数据传输方面,通过在T-BOX硬件中内置的8G内存卡和高灵敏度蜂窝网络天线,将车的数据和人的部分数据以时间戳的形式打包实现异步传输,最终通过4G网络以FTP文件形式传输到服务器后进行解析;而人的数据和环境的数据基于V-BOX通过4G网络传输到服务器,同时选择高规格的服务器来保证每条迁移同步链路都能拥有良好的传输性。
2.3 数据的存储
在数据存储方面,对不同类型的数据建立相应的数据库进行存储。首先对于人的数据、车的数据和环境的数据中属于结构化类型的数据,通过建立关系型数据库来完成存储;对于如道路状况等属于非结构化类型的数据,通过非结构化WEB数据库进行存储。
2.4 数据的处理
在数据处理方面,不同类型需求采取的处理方式不同。通常,实时性需求用EMC的GreenPlum、Oracle的Exadata,以及基于MySQL的列式存储Infobright进行处理;一些批处理,或者基于半结构化数据的需求使用Hadoop进行处理。在此基础上,可以利用机器学习中的聚类算法建立标签体系,利用SVM、NaiveBayes等算法建立模型体系。
2.5 数据可视化
综上,本文构建了出行大数据采集、传输、存储、处理全生命周期的数据体系。但是该体系本身既庞大又复杂,为了后续标签体系建立和模型体系的建立,我们需要将借助图形化的手段将出行大数据进行可视化处理。
3 出行大数据的应用探索
每一台车不仅仅是出行的工具,而且是互联网、数字化属性的载体,面对海量数据如何提取出重要信息并进行分析,以及如何变现成为关键的问题。因此,本文需要通过TBOX、VBOX、GPS、RFID、传感器和摄像头图像处理器等装置设备采集人的数据、车的数据和环境的数据,构建以驾驶行为、生理特征等多维度的数据集。基于采集的数据,结合汽车产业链细分领域的研究,对运营大数据进行即时分析。通过算法优化,实现对各类数据信息的读取和控制,构建各类数据应用模型,深度挖掘数据价值。本文拟与主机厂一起探索一个全景数据运营的链条。首先,从底层为主机厂做基础的数据咨询规划,并搭建专属的数据平台;其次,基于采集数据建立针对车和用户的标签体系和模型体系,从而为用户提供精准的个性化的服务;最后,基于标签体系和应用需求,进一步把模型和相关应用场景、产品形态相结合,建立反映硬件损耗关联度、甚至反映预测用户价值需求的模型体系,进行产品和服务的专属设计,并形成一种商业化的运营模式。
在具体的数据应用环节,本文拟从智能研发、智能应用、智能交通三个方面构建大数据应用体系。
3.1 智能研发
在智能研发方面,通过对TBOX、GPS、RFID、传感器、摄像头图像处理器等装置设备采集到的车况监测信息和环境信息进行整合处理,首先全面准确地分析出研发阶段的零部件、整车性能评估、试验车的DTC问题预警、管理优化、生产线等问题;其次通过GPS、VBOX、摄像头和传感器等处理装置采集到的人的信息和环境的信息,分析出在不同环境下消费者比较中意的车型、最为关注的产品性能等其他方面的偏好,针对消费者的产品需求偏好来对产品进行改进创新,设计生产出大众消费者心中理想的汽车款型,并根据售后的消费反馈数据,持续地改进调整产品。
3.2 智能应用
圍绕汽车产业链,以数据为基础,用人工智能做出明智的判断与决定,形成汽车的“数智大脑”。同时基于数据,探索四大数据智能应用方向:智+服务、智+营销、智+保险和智+调度。本文具体从智+营销和智+保险谈智能应用方向。
智+营销主要是基于用户行为构建用户画像,提供精准的个性化服务。基于出行大数据体系,用机器学习中的K-means算法建立用户画像,准确把握用户的区域分布、性别分布、年龄分布、兴趣爱好、消费偏好等重要信息,从而进行精准的线上产品信息推送和广告投放;而智+保险主要实现UBI保险创新及共享出行保险机制创新。基于出行大数据体系,到的车的数据、人的数据和环境的数据,建立UBI定价模型对人、车和环境的各个维度数据进行精细化的分析,从而制定出服务不同用户的差异化的车险定价,以满足不同用户不同场景下的需求。
3.3 智慧交通
基于大数据的智慧交通存在多种可能,交通的智能化是根本的趋势,利用大数据技术和智能分析技术,整合城市管理的其他数据,将真正推动智慧交通建设,为交通管理奠定良好的基础。基于共享模式建立的出行大数据体系,在获得人的数据、车的数据和环境的数据的情况下,一方面,交通部门实时掌握了道路上共享汽车流量、客流量信息以及各种道路环境信息,从而科学合理的制定出疏散和管制措施预案,提前预警和疏导交通;另一方面,用户通过其车载终端或数据采集系统提供的实时数据,几乎掌握全部主要道路的交通路况,进而科学合理的制定自己的行车路线。同时基于出行大数据体系,结合天津南站项目的具体实践,将出行大数据与南站数据平台有机衔接,数据进行实时共享,构建畅达、高效、安全、绿色的南站交通服务系统,提供客运交通网络实时状态感知、汽车车辆运行智能监控与调度、多模式运营服务协调、全出行链客运信息服务等。
参考文献:
[1]罗兰贝格.2018年中国汽车共享出行市场分析预测报告[R].德国:罗兰贝格,2018.
[2]谢雅玲.新常态下的共享经济效应[J].现代经济信息,2017(15):32.