APP下载

社交与出行的相互作用研究综述

2021-09-26朱康丽吴建军李大庆

北京交通大学学报 2021年4期
关键词:移动性结伴距离

朱康丽,吴建军,李大庆

(1.北京交通大学 轨道交通控制与安全国家重点实验室,北京 100044; 2.北京航空航天大学 可靠性与系统工程学院,北京 100191)

城市交通规划在提高运输效率,降低交通拥堵、减少能源消耗和空气污染方面起着至关重要的作用.众所周知,城市交通规划的基础是出行需求预测,只有在对出行行为充分理解和把握的基础上,才能更好地进行需求预测.而个体的出行行为会受到多种因素的影响,正确识别这些因素是组织更科学合理、可持续的交通规划的必要条件.在一个交通系统中,出行者并非是孤立地进行出行决策,从出行需求的产生、出行路径和出发时刻乃至交通方式的选择,除受到交通环境的影响外,出行者还受到其所处的社交环境等因素的影响.如出行方式的选择受到家庭机动车、非机动车保有量等资源的制约,故出行受到家庭这一社交环境的影响.又如,对新出现的交通方式,如共享汽车、共享单车等的选择也可能会受到现实中的熟人、甚至在线社交网络等信息的影响.传统的出行行为建模工作较多考虑的是交通环境和个体特征,缺乏对出行社交维度的重视[1-2].

关于社交对出行需求、出行选择决策的影响有大量的成果,而这些研究主要集中在交通领域,大多基于调查数据或设计实验.近些年,很多带地理位置标签的数据如CDR,LBSN等大规模数据集的出现给社交和出行关系的研究提供了新的机会,基于这类数据进行社交关系和出行行为的研究多集中在物理学、计算机等交叉学科,研究者对社交关系和出行相互影响进行验证,其应用可以分为使用社交关系对出行进行预测和使用出行轨迹对社交关系进行预测两方面.

社交与出行的相互作用除了体现在社交关系和出行的相互影响外,还体现在出行中的社交关系,也就是我们常说的结伴出行.基于此,本文作者从交通领域的社交关系对出行选择行为的影响相关研究、物理和计算机领域的社交关系和移动性的关系及其应用、社交作为出行目的的结伴出行以及社交关系的推断等四个方面综述最新研究动态,总结既有研究的目标、方法和创新结果.

1 社交关系对出行选择行为的影响

1.1 基于家庭的出行建模

家庭内部的社交关系无疑是最重要、最直接、频率最高的一种社交关系,家庭成员需要对稀缺资源如拥有的机动车进行合理分配,以更好地满足所有成员的需求[3].而购买日用品、接送孩子、陪同就医等活动产生的出行需求对于家庭成员来说是具有互补性的.因此,家庭社交对出行行为的影响毋庸置疑.此外家庭是居民出行调查的基本单位,也给基于家庭的出行建模提供了数据基础.由于家庭社交影响出行的实证数据易于获取,关于家庭成员之间的出行需求互相影响的研究非常多,Ho等[4]对此方面的研究做了详细的综述:居住地选择、购买和交易机动车、出行方式的选择等都被证明会受到集体决策、家庭成员之间交互作用的影响.此外,家庭任务和资源的分配、活动产生和时间安排以及多人一起进行的家庭活动也需要考虑家庭内部的交互.基于家庭的出行多用基于活动的建模方式建模,大多模型基于离散选择模型,建模的重点在于对家庭总效用进行结构化的表示[5-8].

除此之外,研究家庭成员间出行的相互制约关系,还有一种基于车辆路径问题的建模方式.这类研究考察具体的活动序列.如Recker等[9]将家庭的活动模式问题在带时间窗约束的车辆路径问题的框架下建模,以最小化家庭总的负效用为目标函数,给定家庭成员需要在一定的时间约束内完成的活动列表,逐步考虑了某些活动只能由固定的几人进行、无需每个人都出行等情况,在机动车保有量的约束下,考虑车辆可以由多人同时使用,建立了符合现实情况的整合模型.类似地,Cokyasar等[3]研究家庭单元共享自动驾驶汽车的分配问题,以最小化车辆的购买、租用、维护及驾驶成本为目标,在基本场景的基础上,逐步允许车辆空车行驶、允许部分出行采取出租车方式、考虑家庭成员的早到与迟到惩罚、考虑停车成本、考虑多人共用车辆等,建立了车辆使用的最优路线模型.这类研究以家庭成员的活动需求作为输入,输出出行需求及各个家庭成员参与对应出行活动的时间,显式地对出行需求的相关关系进行了建模.

1.2 非家庭的社交关系对出行的影响研究

由于居民出行调查中仅仅包含家庭构成结构和家庭成员之间的关系,基于家庭的建模自然忽略了其他社会关系,如朋友、同事等对出行行为的影响.而非家庭的社交关系对出行选择的影响也不可忽视.交通领域关于非家人社交关系对出行影响的研究也涉及到出行行为的方方面面[10],包括路径选择、出行方式选择等.而且,除了实际的社交关系之外,也涉及到在线社交信息对出行行为的影响.

1.2.1 社交关系对路径选择的影响

出行者总是希望选择广义费用最小的出行路径,但交通系统是动态变化的,出行者如何在这一动态系统中选择路径对认识交通系统、预测交通状态非常重要.出行者关于路径的信息不仅来自于自身的经验和出行者信息系统,也来自于自身的社交关系.如社交对比对通勤的感受有影响[11],当自己的出行时间比别人更短时,出行者会感到更快乐.研究者验证了社交互动影响路径选择行为,确认显著影响路径选择行为的社交关系不仅包括现实生活中的熟人[12-13],也包括线上社交网络的信息[14].

1.2.2 社交关系对方式选择和新兴交通接受度的影响

1)社交关系对出行方式选择的影响.

Wang等[15]使用空间计量经济学的方法,用基于距离的空间权重矩阵衡量社交关系,验证了邻居对自行车的选择有正向的显著影响.但是这一显著正相关关系也可能是由其他原因造成的,例如出行者和邻居在通勤距离上大致相同,使用类似的交通方式相对都比较方便.这种情况下,他们做出类似的出行方式选择也不足为奇.“共享环境”可能导致出行行为和社交网络之间的正相关关系,这是社会影响模型的内生性来源[16].Pike等[16]使用两阶段残差包含模型控制这一影响,同样发现了随距离增加,选择相同交通方式的正相关性降低的结论,结果进一步验证了社交对出行方式的影响.

2)社交关系对电动汽车和共享交通接受度的影响.

Rasouli等[17]使用混合Logit 模型,考察用户选择电动汽车意愿的影响因素,其中评估的因素包括外界的整体评价以及有社交关系的人的选择率.有社交关系的人的选择率对电动汽车选择的影响能够直接体现社交的影响.作者将社交关系分成朋友、亲戚、同事和同龄人等四种类型,考虑两种随机性的混合Logit模型,一种是汽车特征对用户的选择影响具有随机性,一种是社交关系对选择的影响具有随机性.对比两种模型发现,外界评价对两种模型的影响结果是一致的:外界总体评价越差,对电动汽车的选择影响越负面.但市场占有率对电动汽车的选择影响不一致且并不总是显著.除此之外,不同社交关系对比表明,社交关系中市场占有率从低到高对电动汽车的选择也并非单调变化的,这代表了社交关系对用户选择的影响并不具有一贯性.Kim等[18-19]使用同样的调查数据用混合选择模型得到了类似的结论:正面评价对选择购买电动车有正面影响,负面评价对选择购买电动车有负面影响,而电动车在用户社交关系中的市场占有率的影响大多不显著.

类似的思路也被用来研究用户对共享交通的接受度,Kim等[20]设计了两阶段的调查问卷,以对比得出社交关系的影响.第一阶段只给出费用、等待时间等特征,直接让被试者选择是否使用共享交通,第二阶段再给出朋友、家人等选择共享交通的情况,被试者在同样的情境下再次做出选择.作者使用后悔最小化的混合选择模型考察社交关系对共享交通选择的影响.结果表明:共享汽车在家人和朋友中的市场占有率越大时,人们越愿意使用共享汽车.同时,社交关系的强度和社交类型也都影响选择行为,联系越强的群体社交关系影响程度越大.表1对社交关系对出行方式相关研究的研究目标、样本量、采用的方法和主要结论进行了总结.

表1 社交关系对出行方式的影响研究对比Tab.1 Research comparison on the impact of social relationship on travel mode choices

关于非家庭社交关系对出行行为影响的实证研究难点在于,居民出行调查中并没有显式收集除家庭关系以外的社交关系数据.非家庭社交关系的定量刻画方式主要有两种,一种是以受访者为中心(ego-centric)的接触调查[23],要求受访者指出和自己有密切关系的人[24],可能还要具体调查他们的接触方式以及接触频率,接触方式包括面对面接触、打电话、发短信和发邮件等.为了着重体现社交关系的作用,一般会设计两阶段实验或在调查问卷中设计两种场景,对比不考虑社交和给出有社交关系的出行者选择两种情形下,受试者的选择行为.另外一种是基于距离的方法,但是需要有家庭住址或邮编,一般通过家庭之间的距离表示社交关系的远近.

交通领域对社交关系和出行行为相关关系的影响研究对数据质量要求较高,需要仔细设计调查问卷或实验,以使得问卷结果在包含社交关系信息的同时,还能够体现社交关系对出行的影响.受限于对 RP (Revealed Preference) 数据采集的能力,大多数只能基于 SP (Stated Preference)调查.但是,由于涉及到人工调查,且研究对数据质量的要求高,存在数据采集成本高、样本量小、验证难度大等缺点.

2 社交关系和移动性的关系及其应用

交通领域的研究基于出行调查数据,研究目标侧重出行选择行为背后的影响因素识别.大规模带地理标签的数据,如电话记录数据(Call Detail Record,CDR)、基于位置服务(Location Based Service,LBS)的社交网站数据等,引发了物理学和计算机等领域关于人类移动性研究的热潮.CDR和基于位置服务的数据同时包括定位数据构成的轨迹和打电话或互相关注构成的社交关系,给研究移动性和社交关系的相互作用提供了可能.

2.1 社交关系和移动性的关系

距离是反映移动性的一个重要特征,这里首先回顾社交关系和距离相关性的研究.Goldenberg等[25]考察了发邮件距离的分布,发现尽管理论上发邮件并不受距离的约束,但邮件距离服从快速下降的幂律分布,表明人的大多数社交关系仍然局限在近距离范围内.他们还考察了从1970年到2004年美国各州的新生儿名字的空间相关性.发现随着信息技术发展,新生儿名字的空间相关性反而更大,表明了空间距离的影响并没有消失.Cho等[26]同样得到了朋友关系的概率随家庭距离下降这一重要结论.另外,随着出行目的地与家之间的距离增加,人们访问朋友的概率会下降,这也体现了距离对社交会产生一定的影响.但结合朋友关系的空间分布和访问距离分布发现,访问较远距离朋友的概率反而会更大,这一结论又体现了社交对出行会产生影响.Scellato等[27]使用LBS数据,对比朋友的距离分布和随机距离分布,发现用户构成朋友关系的概率随距离下降.为了研究社交的空间距离分布背后的地理和社交机制,作者构建了只考虑社交关系的地理空模型和只考虑地理关系的社交空模型,地理空模型保持用户的位置不变,他们之间的社交关系随机分配,而社交空模型保持用户社交联系不变,随机切换用户的位置.发现单独使用两类模型都不能刻画实际的距离分布,表明刻画朋友距离分布需要同时考虑社交和地理特征.

Calabrese等[28]通过拨打电话的数据集发现,互相通话的用户几乎都面对面接触过,用户之间的物理接触频率与他们的通话频率以及间隔距离高度相关.Parady等[29]分析了影响不同通信方式的互动频率因素,表明社交网络规模越大,交往频率越低;而朋友之间的距离越小,情感亲近程度及接触频率越高.这些研究都体现了社交和移动性的相互影响.

除了用距离表示移动性相关性之外,有些研究还建立了轨迹之间的相关性指标,以考察轨迹相关性和社交相似性的相关性.Cho等[26]使用两个用户轨迹向量的余弦相似性作为轨迹相似性指标,和相应用户是朋友的概率对比,发现这两个变量之间具有很强的正相关性.Toole等[30]定义了两个用户的总体轨迹访问地点向量的余弦相似性和各时段访问地点向量的余弦相似性时间序列,研究了总体相似性、相似性时间序列与社交关系的相关性.对总体相似性的研究表明:①有社交关系的用户移动性相似性是随机用户相似性的10倍,朋友的朋友移动性相似性是随机用户相似性的2倍;②接触多的用户移动性相似性强于接触少的用户;③共同朋友越多的用户移动相似性越强;④朋友数越多的用户访问地点数越多;⑤和朋友交流分布越均匀,移动性的可预测性越强.此外,Phithakkitnukoon等[31]定义了3个移动性指标:移动性多样性指访问的地点数、分散度指经纬度的标准差、范围指家与最远的地方之间的距离,分析了社交联系强度与流动性指标之间的关系,发现联系强度与移动性相似性之间是正相关的.

确定了社交关系和移动性二者之间的关系后,主要应用在两个方向:①用社交关系预测移动性,即将社交网络信息作为输入特征,预测或推荐下一个时刻的位置;②用移动性推测已经存在的社交关系.预测社交网络中可能新形成的社交关系,又叫链路预测(Link Prediction).

2.2 社交关系和移动性的关系应用

2.2.1 使用社交关系数据预测移动性

社交网站数据存在有地理位置标签缺失的现象,而地理距离和社交关系有很强的相关性,一些研究致力于使用社交关系预测用户位置[32-37].同时,使用社交关系作为额外输入,能够更好预测移动性.如王涛[38]设计了好友循环记忆模型,引入动态好友影响因子,将好友的轨迹作为特征输入到神经网络的全连接层,取得了很好的预测效果.Cho等[26]考虑朋友访问的时间和距离变量,构建了考虑周期性的日常出行和受社交网络影响的社交出行模型,能够可靠地刻画和预测人类的移动模式.

2.2.2 使用移动性预测社交关系

Eagle等[39]使用电话记录数据和朋友关系调查数据,证明了非工作时间的轨迹相关性能够正确预测96%的双向朋友关系和95%的非朋友关系.Cranshaw等[40]提出了一组基于轨迹及用户轨迹相关性的特征,使用用户之间的位置相关性特征预测是否是社交网站上的好友关系,同时使用用户的移动性特征,预测他们的好友数.模型预测结果的精度和召回率表明,在地点相关性特征的基础上,加上共同地点本身的特征能够更好地预测线上社交关系.通过对用户个人的出行模式有关的特征和朋友数的相关性研究结果表明,与多样性特征和规律性特征相关的变量都较与出行强度和出行时长相关变量的相关性更为显著[41].类似地,Wang等[42]定义了用户的地理位置相似性特征,与只使用用户在社交网络里的共同邻居数等社交网络相似性特征的模型相比,结合地理位置相似性特征的链路预测模型取得了更大的预测精度.

研究者验证了社交关系和移动性的关系,并在此基础上,将轨迹应用于社交关系预测、将社交关系应用到轨迹的推断上,取得了相对于基准模型较高的精度.但受数据中只包括关注信息的限制,这里的社交关系是弱连接,而非全部是社交驱动的关系.例如社交网站互相关注的用户不一定是现实生活中的家人、朋友、同事,以推销、咨询等目的驱动的电话沟通也不能反映社交关系,而且近年来随着其他即时通信工具的发展,电话沟通在人际交流中的占比也逐年下降,可能不再具有代表性.

3 社交作为出行目的及结伴出行

无论是城市内短距离出行还是城市间的长距离出行,社交都是出行目的的重要组成部分[2].在Ma等[43]进行的北京公共交通通勤行为调查中,他们将出行目的划分为通勤、个人业务、购物、娱乐、社交活动和其他.春运作为最大规模的长距离迁徙活动,主要就是由除夕团聚产生的需求[44].Van den Berg等[45]使用调查问卷详细记录各种形式的社交联系,包括社交出行.在此基础上分别建立针对社交出行需求、社交出行距离、社交出行方式选择的模型.主要结果包括:教育水平更高和参与俱乐部的出行者的社交出行次数更多,全职工作者的社交出行更少;老年人的社交出行需求量占比和其社交出行距离并不微小.

多人一起进行的出行,即结伴出行是社交和出行相互作用的另一种表现形式.陈小鸿等[46]使用参观上海世博会的游客出行数据,通过使用多元Logit模型研究了不同结伴规模条件下(3人同行和单独出行)的出行方式选择行为.结果表明,3人同行乘客对服务水平和费用的敏感性低于单独出行的乘客,体现了结伴出行使用出租车、小汽车总费用不增加等特点.曹炜威等[47]通过同样订单号的乘客列表获取结伴信息,表明结伴出行者更愿意选择高等级列车和座位.

在微观的尺度上,结伴出行的行人和单独行走的行人在走行行为上也存在差异.无障碍走行时结伴的行人速度接近,同时会保持一定的距离和相对稳定的队形,在对向流、遇到障碍物或其他行人等场景下,结伴的行人仍然会尽量保持联系,可能会产生跟随、聚合、等待等行为.这些行为都会影响结伴行人自身的走行速度进而影响总体速度和疏散效率.对单独行走行人与结伴行人的走行速度进行对比发现[48],结伴走行速度的极大值、极小值和平均值都低于单独行走的速度,而三人结伴的速度低于两人结伴、高于四人结伴[49],且均在统计上显著.然而,单独行走比结伴的路径长度要长[49].总体上,结伴出行的效率低于单独出行的效率[49].Costa等[50]分析了性别组成对走行速度的影响,表明纯男性组合的步行速度最高(1.53 m/s),其次是混合性别(1.3 m/s),纯女性构成的结伴组合走行速度最慢(1.27 m/s).张蕊等[48]在不同结伴比例下,针对相同场景,对行人流分别进行仿真,结果表明结伴比例越高,平均速度越低.这是由于结伴行人之间相互制约,加上结伴群体存在横向走行结构,和其他行人的交互、避让也会更加困难.尤其是在紧急情况疏散场景下,强连接的社会关系(家人、朋友等)关系牢固,会合作进行选择[51],保持一致决策,这也会对疏散效率产生影响.

本节回顾了社交作为出行目的及结伴出行的研究.涉及结伴出行本身的研究缺乏,主要是因为研究结伴出行需要在居民出行调查中详细记录每次出行的同行者,大大增加了调查成本,且没有能提高数据质量的调查框架.由于微观行人流研究本身就依赖于实验和视频数据,因此关于结伴对走行速度和疏散的研究较为充分.此外,结伴关系对走行速度和疏散效率会产生重要影响,这些也是结伴研究的未来重要应用.但是,行人结伴关系的获取依赖于人工标注,使得成本高昂,未来高效、大规模的自动结伴识别也许会给开展此类研究提供更好的数据基础.

4 社交关系的推断

在社交关系的研究中,社交关系的获取面临着诸多困难.交通领域的社交关系大多可以通过出行调查获取,行人流研究中的社交关系一般可以通过视频得到,但这类社交数据获取成本相对较高.对比上述数据,CDR中包含非常丰富的拨打电话、收发短信的相关信息,LBSN数据中有关注、私信等关系,但这类行为并不能体现面对面的社交关系,甚至这些行为都不一定是通过社交进行驱动的.表2给出了各类数据的特点,本节重点从自各类数据中提取社交关系的相关研究进行总结.

表2 数据集特征及其在社交关系和出行研究方面的局限性Tab.2 Dataset characteristics and their limitations in social relationship and travel research

首先研究者进行了从小规模实验的位置数据中提取社交关系的尝试.Kjærgaard等[51-52]设计了室内环境的实验,获取了16名受试者的WIFI 数据及其组团的真实值,通过计算受试者的距离矩阵,对矩阵进行密度和时间聚类,估计乘客的组团特征.Chen等[53]通过在教学楼走廊部署6个信号扫描设备,使用其中1到6个设备分别计算5个受试者之间轨迹的相关性,展现了WiTrack技术追踪用户相关关系的可行性.

Hsu等[54]使用多个大学校园内的WIFI数据,定义两个WIFI用户的相遇事件为两个用户接入同一个无线网络接收点,用接触的相对时间长度、相对次数和相对地点多样性来表征关系的密切程度,分析了朋友关系的分布,由于WIFI数据是匿名数据,这一研究无法获取是否存在朋友关系及关系密切程度的真实值.

在以往和社交网络相关的研究中,两个节点之间是否存在边的条件多是依据两个节点之间有没有互动进行判断.例如是否打过电话、社交网站上是否相互或单向进行关注.当然,这也可能会包含并不存在的社交关系.如微博新闻、名人账号能够吸引大量没有关系的人关注,电话营销会打电话给没有社交关系的电话用户.因此需要对这类数据中的社交关系进行进一步的过滤和区分.Vaz de Melo等[55]提出了使用相遇强度和共同朋友数区分随机关系和朋友、纽带、熟人等社交驱动的社会关系的RECAST策略.Nunes 等[56]在使用RECAST策略获取到的朋友关系基础上,通过派系过滤方法 (Clique Percolation Method,CPM)对群体构成的检测、跟踪不同时间片的群体构成进行了研究.

除此之外,公交地铁智能卡数据包含乘客上下车或进出站的信息,为提取结伴出行提供了大规模数据支撑.Sun等[57]使用公交智能卡数据研究了熟悉的陌生人,用于揭示城市规模的人类互动,并通过构建相遇网络刻画了公共交通中的乘客之间物理相遇.类似地,Zhang等[58]提出了一种基于地理接近度来识别结伴出行的方法,即乘客距离小意味着结伴出行,并对所采用的时间距离进行了敏感性分析.本质上,他们都研究了包含大量偶遇的出行行为,其中涉及到很大一部分熟悉的陌生人或者陌生人.Tian等[59]认为多次相遇才能被认为是有意识的结伴出行,并使用提取出的结伴乘客量趋于稳定作为相遇次数的阈值.Zhu等[60]同样考察了结伴的多次相遇阈值,基于地铁刷卡数据的特点,使用结伴时间差分布接近获得了多次相遇的阈值,最后提出了一套能够提取大规模社交关系网络的方法.

调查数据获取成本高,而且在线社交数据不能体现面对面的关系,甚至部分边都不是社交驱动的,故而本节总结了研究中提取面对面社交关系以及结伴出行的尝试.这些研究存在的问题是没有真实值对结果的准确性进行验证.如何结合小规模调查和大规模数据提取出社交网络是未来需要解决的关键问题.

5 结论与展望

1)本文分析了社交关系对出行选择行为的影响,以及移动性和社交关系的相互作用关系,总结了在出行预测中加入社交关系和在社交关系预测中加入出行轨迹的相关研究进展.实际上,除了社交关系和出行相互影响之外,社交本身也可以作为一种重要的出行目的,甚至很多出行本身就是与社交相关的一种结伴出行.而目前对结伴出行的研究甚少,未来将是精细化研究人们出行行为的重要方面.

2)当前研究中对面对面社交的研究较少,这主要是由于没有比较完善的既有地理位置能提取物理接触、又有实际社交关系的大规模数据集,因此,缺少城市尺度甚至更大尺度、全样本或大规模样本的和面对面社交网络的相关研究成果.此外,当前的大规模研究大多基于线上数据,但互联网社交存在基于陌生人社交的特征,包含了大量的弱链接.因此,虽然互联网在很大程度上拓宽了我们社交的边界,但这种网络在关系的紧密程度、集中程度和稳定程度上和面对面的实际社交是不同的.如虚拟世界可能会导致孤独感,而面对面社交、一起吃饭、购物在给人提供情感支撑、休闲放松方面是在线社交不能替代的.不仅如此,研究疾病的传播也需要考察物理接触.只有考察物理接触网络,才能更好地揭示传播过程和传播机理.必须承认,面对面接触的参与者之间的联系较通过拨打电话或在线社交网络互相关注的参与者要更加紧密.因此,通过出行数据去挖掘现实生活中存在物理接触的社交关系是未来值得研究的重点方向之一.

猜你喜欢

移动性结伴距离
与5G融合的卫星通信移动性管理技术研究
跳房子
距离美
面向5G的移动性管理关键技术探讨
用户移动性对D2D缓存网络的定性研究
基于泊松分布的无线物联网延迟接入路由研究
爱的距离
外面雷雨天
距离有多远
商人求宿