基于贝叶斯网络的老年人公交出行行为研究
2022-07-11刘建荣刘志伟
刘建荣 刘志伟
(华南理工大学土木与交通学院1) 广州 510640) (武汉轻工大学土木工程与建筑学院2) 武汉 430023)
0 引 言
由于不需要工作、身体条件、收入水平,以及文化水平等差异,老年人在出行行为等方面与年轻人存在较大差异[1-4],对于老年人的出行行为及其影响因素,国内外学者进行了一定研究,如老年人性别[5-6]、收入[7]、态度[8]、交通信息[9]、公交服务质量[10-11]、出行环境[12].
随着年龄的增加,老年人的行动能力将逐渐下降,出行次数、距离等可能减少,且更加依赖机动化出行.由于我国城市大多实行65岁以上老年人免费乘坐公交车的政策,而且由于不需要工作,相比年轻人,老年人更乐意选择公交出行.因此老年人在公交出行行为选择方面与年轻人和中年人存在一定的差异[13-14].
分析现有关于老年人使用公交出行的影响因素,发现有几类问题有待深入研究:①公交服务中各种客观指标如何影响到老年人对公交服务的主观评价及总体满意度;②老年人对于公交服务的主观评价如何影响到老年人对于公交服务的总体满意度、以及使用公交出行意愿;③老年人对于公交的满意度如何影响到使用公交出行意愿;④老年人的个人属性如何影响到公交服务的主观评价、总体满意度及使用公交出行意愿.
基于以上背景,文中利用贝叶斯网路研究老年人公交出行,建立老年人个体特征、老年人使用公交的客观指标、老年人对公交的主观评价以及老年人使用公交意愿之间的贝叶斯网络关系模型,分析各类影响因素对于公交满意度、使用公交意愿之间的影响.
1 贝叶斯网络
贝叶斯概率可表示为:先验分布π(θ)+样本信息x=后验分布π(θ|x).贝叶斯网络是贝叶斯概率的扩展,是目前不确定知识表达和推理领域最有效的理论模型之一.贝叶斯网络借助有向无环图(directed acyclic graph, DAG)来刻画属性之间的依赖关系,并使用条件概率表描述属性之间的联合概率分布.具体而言,贝叶斯网络由网络结构和参数两部分组成.网络结构是一个有向无环图,图中的每一个节点对应一个属性,若两个属性之间有直接依赖关系,则由一条从因指向果的有向边连接.参数则定量描述这种依赖关系.贝叶斯网络常表示为B=[G(X,A),Θ],G为有向无环图;X={x1,x2,…,xn}为变量集合;A为有向边集合;Θ={θx1|U1,θx2|U2,…,θxn|Un}为网络参数,其中θxi|Ui为在已经在已知xi的父节点信息Ui的情况下,xi的概率分布.
贝叶斯网络包括学习和推理.学习包括网络结构学习和参数学习两部分内容,常用的构建方法有专家经验法、机器学习法、基于部分经验的机器学习法.其中专家经验法是依据专家经验或逻辑推理设定网络结构,在此基础上进行网络参数学习.机器学习法是纯粹利用数据对网络结构和参数进行学习.基于部分经验的机器学习法是利用专家知识设置初步的网络结构,在此基础上对网络结构和参数进行学习.常用的网络结构学习方法包括Bayesian Search、Essential Graph Search、Greedy Thick Thinning等方法.参数学习是指在已建的贝叶斯网络结构G和数据的基础上,对贝叶斯网络的参数进行学习,获取节点变量的条件概率分布θxi|Ui.常用的参数学习方法为极大似然估计.
利用建立的贝叶斯网络进行推理分析,是贝叶斯网络要解决的主要任务之一.贝叶斯网络的DAG图形模式给出了所有变量的一个完整的联合概率分布,其推理过程意味着在给定一组证据变量(原因)确切值的情况下,计算一组查询变量(结果)的概率分布.贝叶斯网络精确的概率推导是NP-hard问题,即当网络节点较多时,难以精确推断概率.因此在实际情况下,常选择有效的算法进行近似推理 .常用的推理算法有联合树算法、消元法、全局推断法等,其中联合树算法应用最为广泛.
2 问卷设计及基础分析
文中分析对于老年人使用公交出行中,各类公交服务客观指标、主观评价、出行者特征等因素对于公交总体满意度以及公交使用意愿的影响,各类因素及分类见表1.
表1 研究标量描述
数据来自肇庆市公交调查,调查时间为2018年4月.由于肇庆市实施65岁以上老年人免费政策,60~64岁老年人实施票价优惠政策,因此在样本选取中,本论文只分析年龄大于等于65岁的公交使用者.共获得有效样本334份.
3 建模及结果分析
表 1中主观评价、总体评价中,被调查者选择“很不满意”“很满意”的比例极少,每一项均超过90%的人选择“不满意”或者“满意”.如果在贝叶斯网络建模中,依旧将主观评价、总体评价分为四种情况,将导致模型精确度不高,因此为提高模型精确度,将主观评价、总体评价中的“很不满意”、“不满意”合并为“不满意”一项,将“满意”、“很满意”合并为“满意”一项.对于“步行时间”,调查发现表 1中“步行时间”没有人选择“≥16 min”;“月收入”中选择“≥5 001元”所占比重不足5%,因此将“3 001~5 000”和“≥5 001”合并为“≥300”;“每周乘坐公交次数”中无人选择“≥11次”,因此将“6~10次”、“≥11次”合并为“≥6次”.
根据表1的数据以及老年人使用公交出行的评价,以及关于公交满意度、公交忠诚度等方面的研究,本文对于贝叶斯网络做以下假设.
1) 公交服务中各种客观指标会影响到老年人对公交服务的主观评价及总体满意度.
2) 老年人对于公交服务的主观评价会影响到老年人对于公交服务的总体满意度、以及使用公交出行意愿.
3) 老年人对于公交的满意度会影响到使用公交出行意愿.
4) 老年人的个人属性会影响到公交服务的主观评价、总体满意度及使用公交出行意愿.
基于以上基本假设,对贝叶斯网络的网络结构进行初步设定,在此基础上,利用数据进行贝叶斯网络结构和参数学习.贝叶斯网络学习采用Bayesian search方法.
3.1 模型标定及检验
通过贝叶斯网络学习,得到贝叶斯网络见图1.
图1 老年人公交出行贝叶斯网络
为检验模型的适用性,采用AUC和Accuracy对模型进行检验.AUC值域为[0,1],当值越接近1,表明性能越高.Accuracy为某一变量预测取值与现实一致的概率.以satisf(总体满意度)为评价对象,AUC均为0.754;模型的Accuracy为73.2%.因此总体而言,模型的精度可以接受.
3.2 模型推理分析
为测量图 1和表 1各变量对于总体评价、使用意愿的影响,文中在已经建立的贝叶斯网络的基础上,利用置信传播算法进行推理分析,推理过程如下.
1) 选定某变量节点,在不改变其他节点分布的情况下,输入证据,将其状态设置为某一状态.调用置信传播算法进行推理分析,分析总体评价、使用意愿中各类因素的概率分布.
2) 改变这一变量节点的状态.调用置信传播算法进行推理分析,分析总体评价、使用意愿中各类因素的概率分布.
3) 对比分析以上两类情况下,总体评价、使用意愿中各类因素的概率分布的变化情况,分析这一变量对于总体评价、使用意愿的影响.
如先将waittime置为“≤5 min”,分析satisf处于“不满意”“满意”的概率分布;再将waittime置为“≥16 min”,分析satisf概率分布;对比两种情况下,satisf概率分布的概率差异,从而得到变量waittime对satisf的影响.
3.2.1满意度对使用意愿的影响研究
这一部分分析satisf(总体满意度)对于使用意愿中recommend(推荐别人使用公交)、priority(优先选择公交)、freq(每周乘坐公交次数)的影响.具体数据见表2.
表2 总体满意度的对使用公交意愿的影响 单位:%
根据表 2数据,总体满意度对recommend、priority、freq均产生一定影响.当satisf从“不满意”变为“满意”时,recommend(推荐别人使用公交)为“是”的概率增幅为19.0%;priority(优先选择公交)为“是”的概率增幅为6.5%;freq(每周乘坐公交次数)为“≥6次”的概率增幅为5.9%.结果表明对于老年人而言,当总体满意度提高时,会提高推荐别人使用公交的可能性,提高优先使用公交出行的可能性,并增加使用公交的频率.且对推荐他人使用公交的影响最大.
3.2.2主观评价影响研究
分析主观评价对总体满意度、使用公交意愿的影响.具体数据见表 3.
对表3数据进行整理,分析当speed_s(速度评价)、relia_s(准点性评价)、cong_s(车内拥挤度评价)、wais_s(等车时间评价)、walk_s(步行距离评价)从“不满意”转变为“满意”时,satisf、recommend、priority为“是”的概率的增幅,以及freq为“≥6”的增幅,可得对比图见图2.
表3 主观评价的影响 单位:%
图2 主观评价影响
由图2可知:纵向对比satisf、recommend、priority、freq受到的影响,satisf受到的影响最大,recommend次之,priority和freq受到的影响基本相同且很小.因此可以得出结论:主观评价对老年人使用公交频率、是否会优先选择公交出行几乎没有影响,但另一方面,主观评价对老年人的总体满意度有很大影响,且会在一定程度上影响老年人推荐他人使用公交的可能性.
横向比较speed_s、relia_s、cong_s、wais_s、walk_s的影响,可以发现影响从大到小依次为relia_s、wait_s、speed_s、walk_s、cong_s,因此准点性评价对公交满意度、使用意愿影响最大,车内拥挤度评价影响最小.
3.2.3客观指标影响研究
分析客观指标对总体满意度、使用公交意愿的影响.具体数据见表4.
表4 客观指标影响
对表4数据进行整理,分析当waittime(等车时间)分别处于“≤5”和“≥16”、transfer(换乘与否)分别处于“否”和“是”、vehicletime(坐车时间)分别处于“≤15”和“≥31”、walktime(步行时间)分别处于“≤5”和“≥11”时,satisf、recommend、priority为“是”的概率的增幅,以及freq为“≥6”的增幅,可得对比图见图3.
图3 客观指标影响
纵向对比satisf、recommend、priority、freq受到的影响,satisf受到的影响最大,recommend次之,priority和freq受到的影响基本相同且很小.因此可以得出结论:客观指标对老年人使用公交频率、是否会优先选择公交出行几乎没有影响,但另一方面,客观指标对老年人的总体满意度有很大影响,且会在一定程度上影响老年人推荐他人使用公交的可能性.
横向比较waittime、transfer、vehicletime、walktime的影响,可以发现影响从大到小依次为transfer、waittime、walktime、vehicletime.因此,换乘与否对老年人使用公交总体满意度、使用公交意愿影响最大,而相反,车内时间对老年人总体满意度、使用公交意愿几乎没有影响.同时,等车时间和步行时间也在一定程度上影响老年人总体满意度和使用公交意愿.
3.2.4个体特征对影响研究
由图1可知:在老年人的bike(自行车)、car(私人小汽车)、motorcar(电动或摩托车)、gender(性别)、education(教育程度)、income(月收入)中,仅education与income存在连线,而且这6个个体特征都不存在迹(trail)与客观指标、主观评价指标、总体评价、使用意愿等指标相连.因此可以得出结论,老年人的这些个体特征不会影响到其对公交的总体满意度以及使用公交出行的意愿.
4 结 束 语
老年人对公交的总体满意度以及使用公交意愿受一系列因素影响,且各类影响因素之间具有一定的影响和被影响的层次关系.由于贝叶斯网络具有有向无环的形象表达形式,与人的逻辑思维及推理过程类似.因此利用贝叶斯网络研究老年人使用公交出行影响因素,建立老年人公交出行的贝叶斯网络,能够直观反应各类影响因素对公交出行的影响,而且能够对各类因素对于公交出行的影响进行直观明了的预测.
文中结合实际调查数据和各类影响因素之间的层次关系,建立了贝叶斯网络.贝叶斯网络的网络结构参数学习结果表明,贝叶斯网络具有较高的精确度.根据贝叶斯网络的推理分析,在出行者主观评价中,准点性评价、等车时间评价对总体满意度及使用公交意愿影响最大;客观指标中,换乘与否影响最大.另一方面,老年人个体特征对总体满意度及使用公交意愿没有显著影响.为增加老年人公交服务满意度,提高老年人使用公交的意愿,应降低换乘比例,提高车辆准点性、降低等车时间.