新能源汽车充电桩海量数据分析研究
2020-05-22杨桦
杨桦
【摘 要】针对新能源汽车充电桩数据的特点,文章提出了一种新能源汽车充电桩数据分析挖掘框架,并详细介绍了该框架涉及的关键技术。通过分析和挖掘新能源汽车充电桩数据,为运营商提供决策支持,为充电用户提供智能服务。
【关键词】新能源汽车;充电桩;海量数据;数据分析
【中图分类号】F426.61 【文献标识码】A 【文章编号】1674-0688(2020)01-0040-04
0 引言
随着新能源汽车使用人数的增长,电动汽车充电需求迅速提升,截至2019年4月,全国充电基础设施累计数量已达到95.3万台。然而,由于布局不合理、维护不到位、缺乏平台管理等问题,可充电设施的利用率却长期偏低。2015年10月9日,国家发展改革委、国家能源局、工业和信息化部、住房城乡建设部共同印发了《电动汽车充电基础设施发展指南(2015—2020年)》,提出:“充电智能服务平台建设要与充电基础设施建设同步考虑,融合互联网、物联网、智能交通、大数据等技术,通过‘互联网+充电基础设施,积极推进电动汽车与智能电网间的能量和信息互动,提升充电服务的智能化水平。鼓励围绕用户需求,为用户提供充电导航、状态查询、充电预约、费用结算等服务,拓展增值业务,提升用户体验和运营效率。”[1]实现上述目标的重点就是对充电桩数据进行分析挖掘。
1 新能源汽车充电桩数据描述
我们需要收集的新能源汽车充电桩数据主要有两类:第一类是运营管理系统与充电设备之间的通信数据,这类数据可以在上级监控管理系统中获取。由于信息通信对新能源汽车充电运营的重要性,因此国家能源局、国家电网公司、中国南方电网有限责任公司发布了系统与离散充电桩通信规约,在这些规约的要求下,现行建设的充电桩大多具备与上级监控管理系统进行通信的功能,运营管理系统与充电设备之间通信的接口支持TCP/IP协议,数据可通过有线网络或无线网络进行传输。第二类是用户评价和建议数据,这类数据主要来源于社交网络,是充电用户对新能源汽车充电服务的各种评论及建议,需要到网页中抓取。
1.1 数据内容及类型介绍
(1)运营管理系统与充电设备之间的通信数据。这类数据主要用于判断充电桩的运行情况及分析其利用率。根据中国南方电网有限责任公司发布的《电动汽车充换电服务网络运营监控系统通信规约第2部分:系统与充电设施》(试行),运营管理系统与充电设备之间的通信数据主要包括充电过程实时监测数据、鉴权数据、远程控制数据、交易数据等。规约中对这些数据的参数名称、字段类型、字段长度都做了定义,不同厂家的充电桩遵从不同的通信规约,内容会有所差异(见表1)。
(2)用户评价和建议数据。这类数据是一种补充数据,用于分析用户的满意度,主要包括各网页中用户对新能源汽车充电服务的评价和建议,例如对现有充电桩安装地点、数量密度是否满意,充电时长能否接受等。
1.2 数据特点分析
(1)数据海量增长。以北京为例,根据中商产业研究院的数据,截至2019年3月北京市公共类充电桩数量已达50 694个,这些电桩采集的实时数据,日增长量早已超过TB级。
(2)结构化数据占比大。在我们收集的新能源汽车充电桩数据中,运营管理系统与充电设备之间的通信数据多为结构化数据,用户评价和建议数据多为半结构化数据及非结构化数据。但从数据收集量来看,主要是以第一类数据为主,它是分析挖掘的最有价值的数据,并且随着标准体系的逐步完善,这类数据的结构会越来越规范。
(3)价值密度低。新能源汽车充电桩数据虽然海量,但是多半都是记录数据,价值密度并不高。例如,充电过程实时监测数据一般是正常的,异常数据非常少,但是后者才是状态检修的最重要依据。
(4)处理速度快。对新能源汽车充电桩数据的分析挖掘需要在极短的时间内对大量数据进行分析,用于决策制定。在线状态数据的处理性能要求远高于离线数据,若未得到及时到位的处理,数据信息价值就会递减。因此,在线的流数据分析挖掘相比传统数据挖掘技术有本质的不同。
2 新能源汽车充电桩数据分析挖掘方案
2.1 需求分析
新能源汽车充电桩数据分析主要对海量数据进行智能采集、分析、管理和高效利用,需要支持PB级的数据存储和处理。通过统计和挖掘分析充电桩运行数据,进行故障预警及判断,提高设备的运检水平和运作效率;通过分析用户充电时间、分布状况等数据,合理规划安装充电桩,提前进行电力资源配置;通过持续跟踪观察电动汽车用户充电特征状况,探索电动汽车用户充电行为习惯,研究电动汽车用户充电消费模式,为用户的充电行为提供智能推荐,提高服务的效率和质量。
2.2 新能源汽车充电桩数据分析挖掘框架
针对新能源汽车充电桩数据的特点,最大限度地为新能源汽车充电桩运营商及充电用户提供更有用的知识、更精确的信息及更及时的响应,本文提出了一种能源汽车充电桩数据分析挖掘框架,该框架包括5层(如图1所示)。
(1)数据源。数据来源主要有运营监控系统和互联网两个。从运营监控系统中获取充电桩传回的通信数据,包括充电过程实时监测数据、鉴权数据、远程控制数据、交易数據等。在互联网中抓取带有用户评价和建议的网页。
(2)数据采集及预处理层。两种不同的数据源分别采用不同的数据采集方法。运营监控系统数据库中数据是结构化的,采集方法可以使用数据库导入工具或特定系统接口。互联网页面中的数据是非结构化和半结构化的,可以先用网站公开的API或网络爬虫进行原始网页抓取,再利用网页解析工具解析并提取数据。然后将简单、独立的数据通过解析、清洗、重构,转换成适合数据挖掘的形式,再对数据进行过滤、抽取和融合。经过上述预处理后,所获取的源数据保存在由数据存储计算层提供的分布式存储中,可供数据分析层直接使用。
(3)数据存储计算层。数据存储计算层的主要功能是将数据采集及预处理层的数据进行高效存储,并提高系统的容错性。传统的数据存储方法和数据库技术无法有效处理海量数据,所以本层中采用分布式的存储架构解决该问题,通过分布式架构提升数据的存储能力及数据吞吐量,通过在不同分布节点上的备份提高系统的容错能力。
(4)数据分析层。数据分析分为两类,分别是统计分析和数据挖掘。统计分析部分主要是对充电集中时间、充电电量增量情况和故障出现情况等信息的统计。数据挖掘部分包括基于用户画像的行为分析、趋势分析、客户分析等。针对用户画像的行为分析包括用户充电统计、用户偏好计算、用户偏好调整。用户充电统计算包括充电时长统计、充电时间段统计、充电地点统计;用户偏好计算包括充电时长偏好计算、充电时间段偏好计算、充电地点偏好计算。数据挖掘分析可以根据需要进行扩展。
(5)数据应用层。数据应用层的主要功能是将数据分析层的分析结果为充电桩运营商及充电用户服务。运营商服务方面包括数据分析结果的图表展现,基于业故障分析的解决方案和预防措施,基于用户行为分析的精准营销和后续充电设施建设等。充电用户服务方面包括基于充电桩位置及状态信息的充电导航及充状态查询和充电预约,基于用户行为分析的智能推荐。
3 新能源汽车充电桩数据分析挖掘关键技术
3.1 新能源汽车充电桩数据存储计算技术
新能源汽车充电桩数据存储计算技术主要包括由Hadoop的MapReduce分布式并行计算框架和HDFS分布式文件系统,以及存储结构化数据和基础结果数据的分布式数据库。利用HDFS超大的存储空间解决海量数据的存储问题(如图2所示),利用MapReduce分布式并行计算框架进行高速、可靠的数据分析处理(如图3所示)。
3.2 新能源汽车充电桩数据挖掘技术
海量数据的挖掘常用的方法有分类、聚类、回归分析、关联规则、偏差分析等,它们分别从不同的角度对数据进行挖掘[4]。
(1)分类与聚类。分类与聚类都是按照相似性和差异性,把一组对象划分成若干类。在新能源汽车充电桩海量数据分析中我们可以运用这两种分析方法进行充电用户的分类、属性和特征分析、满意度分析、充电行为趋势预测等工作。分类方法有许多种,其中较为成熟的有决策树、贝叶斯、支持向量机、人工神经网络等。传统的分区聚类、层次聚类、基于密度的聚类、基于模型的聚类和基于网格的聚类算法应用到大数据的聚类中需要进行抽样或降维,而损失了聚类的精确性;并行聚类虽然对于大数据的聚类具有效率高、可扩展性好的优点,但是算法实现非常难;基于MapReduce能够实现高可扩展的面向大数据的聚类算法,但对软硬件资源要求高[5]。
(2)回归分析。回归分析是大数据分析中的一种预测性的建模技术,它研究的是自变量和因变量之间的数量变化关系,该技术一般用于预测分析,常用的有线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归和ElasticNet回归。其中,逻辑回归在数据化运营中有更主流、更频繁的应用,该分析技术可以很好地回答诸如预测、分类等数据化运营常见的分析项目主题。在新能源汽车充电樁数据挖掘中,可应用该技术预测用户接受新服务的可能性。例如,通过降价等手段能否让用户在指定地点或时间进行充电。
(3)关联规则分析。关联规则分析在数据挖掘领域主要用于发现隐藏在大型数据集中有意义的联系。关联规则最初用于购物篮分析,通过分析顾客购物篮中商品之间的关联,掌握顾客的购物习惯,帮助零售商开发更好的营销策略。现在,该技术因为能够成功预测银行客户需求,而在西方金融业中得到广泛应用。在新能源汽车充电桩数据挖掘中,可以运用该技术进行用户需求预测,利用预测信息,帮助充电桩运营商改善自身营销。Apriori算法是著名的关联规则数据挖掘算法,其最大的缺陷是多次扫描事务数据。因此,在新能源汽车充电桩海量数据挖掘中,我们可以使用FP-树频集算法,该算法比Apriori算法效率高且能较好地适应不同长度的规则。
(4)偏差分析。偏差分析的目的是发现与大部分其他对象不同的对象。例如,分类中的反常实例、模式的例外、观察结果对期望的偏差等。偏差分析可采用的方法有横道图法、表格法及曲线法。在新能源汽车充电桩数据挖掘中,它可以应用到充电桩设备异常信息的发现、分析、识别及预警等方面。
4 结语
文章提出了一种能源汽车充电桩数据分析挖掘框架,详细描述了该框架各层的作用及数据挖掘技术。通过对新能源汽车充电桩海量数据进行分析挖掘,找出充电用户的行为特征和充电喜好,为运营商及用户双方提供更大价值的信息。随着信息壁垒的打破,该数据分析挖掘框架也可用于车、桩、网数据融合后充电、用电、驾驶等大数据分析,结合用户交通指数为充电站建设提供数据支持,进一步提高充电桩利用率,帮助运营商调整运营策略。
参 考 文 献
[1]国家发展改革委.电动汽车充电基础设施发展指南(2015—2020年)[Z].2015.
[2]中国南方电网有限责任公司.电动汽车充换电服务网络运营监控系统通信规约第2部分:系统与充电设施(试行)[Z].2016
[3]管天云,侯春华.大数据技术在智能管道海量数据分析与挖掘中的应用[J].现代电信科技,2014(2).
[4]李蓉蓉.基于Hadoop的电商平台大数据挖掘研究[J].南方农机,2017(22).
[5]海沫.大数据聚类算法综述[J].计算机科学,2016(S1).
[6]张文,王东,郑静楠,等.电动汽车领域的大数据研究与应用[J].大众用电,2016(12).
[7]潘鸣宇,张禄,孙舟,等.电动汽车领域的大数据处理与分析[J].电气应用,2016(5).
[8]邢伟寅,钟乐海,罗金生.基于互联网+新能源汽车充电导航系统设计[J].价值工程,2017(12).