APP下载

人类通讯行为中的标度性实证分析

2012-07-05郝进欣刘红玲蔡绍洪

科技传播 2012年12期
关键词:幂律短消息泊松

郝进欣,刘红玲,蔡绍洪

1.贵州大学理学院,贵州 贵阳 550025

2.贵州师范学院物理与电子科学学院,贵州 贵阳 550018

3.贵州财经学院经济系统仿真重点实验室,贵州 贵阳 550004

0 引言

人类行为遍布我们生存空间的方方面面,研究和理解人类行为有重要的社会和经济意义。人类对于自身行为的研究近百年来一直未曾停止过,随着计算机技术、网络通信和数据库技术的快速发展,大量人类行为发生的准确时间被记录下来,这就为建立人类动力学行为理论奠定了基础。特别是近几年,人类动力学的研究有了飞速的发展,亦是得益于此。

最初的研究普遍把人类行为的时间性简化为用泊松过程描述的随机稳态过程,这种假设的直接推论是两次相继行为之间的时间间隔较为均匀,呈指数分布,大量事件的集中爆发与长期静默都很难出现。故而泊松过程可以直接应用在粗略地刻画人类活动时,如模拟交通流量的模式或事故发生频率、商业话务中心的配置、库存管理、以及估计移动通信中占线的电话数量等。这是以泊松过程假设为基础进行的经典的人类动力学研究。但Barabási等人的研究中却显示,大量由人类活动驱动的系统,具有明显偏离泊松过程的性质,即人类常在短时间内密集从事某事,而后又在很长的时间里将其束之高阁,这些现象对基于泊松过程的假设提出了反思。

人类在通讯方面的行为,是人类沟通交流的重要行为方式之一。研究人类在各种通讯行为中的统计特征,能够较好地反映人类自身的行为特点,为进一步的应用提供帮助。

1 电子邮件通讯行为实证分析

图1 用户发送电子邮件时间间隔分布

本文研究了某大型社区150人之间商业、社区活动、友谊圈等的电子邮件通讯行为收发记录,统计分析了社区中个体收发邮件的数目、发送电子邮件的时间间隔、接收电子邮件的时间间隔以及个体回复邮件的时间间隔,验证了人类行为在社区范围内,个体层面所对应的时间间隔统计特征都具有偏离指数分布的胖尾现象,可以用幂律函数很好的拟合。图1是两位用户发送电子邮件时间间隔分布,图2是典型两位用户接收电子邮件时间间隔分布。采用双对数坐标作图,横坐标为时间间隔τ,纵坐标为相应的频率次数p(τ),方点为实证数据,直线为拟合的幂函数,各幂指数标度α如图所示。

图2 用户接收电子邮件时间间隔分布

2 其他形式的通讯行为实证

2.1 普通书信通讯行为

国外的Oliveira等人和Vázquez等人研究了达尔文、爱因斯坦和弗洛伊德的个人书信记录,记录包含以天为单位的书信收发时间。发送时间、回复时间分布是指连续两封书信发出或回复的时间间隔。采用了双对数坐标,横坐标为时间间隔τ,纵坐标为相应的概率p(τ),图3给出了达尔文、爱因斯坦信件的回复时间分布,通过切除胖重弥散的尾部,发现它们几乎都满足指数为1.5 的幂律分布。

图3 个人信件的回复时间分布

国内的李楠楠等人统计了钱学森、鲁迅等人的个人信件记录[1],同样以天为单位分析了两位所写的连续两封信件之间的时间间隔。通过分析发现两位写信的间隔时间和回复时间分布都具有幂律的特性(图4)。随后,曹盼盼等人统计了茅盾、傅雷、陶行知和胡适等人的信件[2],采用漂移幂律分布模型,最优拟合得到写信时间间隔,也都发现了类似的统计特征。

图4 钱学森个人信件的回复时间(左图)和写信间隔时间分布(右图)

2.2 手机通话通讯行为

Julián Candia等人研究了六百万手机用户手机通话一个月的通话记录。这里面有的用户一个月只有几次通话记录,而有的产生了成百上千次记录。根据通话个体通话总数的多少,分组研究各用户连续两次通话的时间间隔。其分布都服从带指数截断的幂律,整体上幂指数为0.9,截断值约为48天。

图5 手机通话时间间隔的分布

2.3 短消息通讯行为

中国科技大学的洪伟等对手机用户志愿者短消息通讯行为进行了研究。研究统计了多名志愿者手机短消息通讯记录,时间从3个月到6个月不等。结果显示各志愿者发送短消息时间间隔分布都接近幂律分布,只是指数略有不同。赵志丹等分析了真实生活中2006年中国农历新年期间6326713位用户的37577781条记录的短消息交流的大量数据。结果显示,发送短消息的数目,两次发送、回复短信息交流的时间间隔都服从幂律胖尾分布。图6给出了某一用户发送短消息的时间间隔分布。

图6 双对数坐标下的发送短消息时间间隔分布

3 人类通讯行为实证研究概括

综合以上几种情况我们可以看出,在人类通讯行为中相继两次行为的时间间隔分布普遍存在着p(τ) ~τ−α的幂律分布,在双对数坐标下体现为标度α的直线。不同通讯方式、不同用户的分布指数α各不相同,基本上都介于1至3之间;另外就是在没有截断尾部的情况下,都出现了胖尾特征,这也与经典的人类动力学泊松假设的指数尾部不同。由此可见,这确实和Albert Barabási分析的结果有相似性,满足阵发性的幂律分布,而非经典的时间间隔几乎均匀的泊松分布。

目前,人类通讯行为的实证研究范围已远远超出了传统的通讯形式网络,像QICQ即时通讯、网络论坛BBS、个人博客[3]、在线电影点播[4]以及在线游戏、在线社区、在线交友等等也成为研究的对象。以上这些对于人类通讯行为的研究都是针对行为时间性的统计,另外,系统科学工作者把人类行为空间性的研究也纳入了系统科学的研究范畴,利用出租车网络、公交车网络、飞机出行等来研究人类行为的统计特征。

4 结论

近几年来,关于人类行为的研究吸引了物理学、数学、系统科学、生物学、社会科学等各方面的人才。大家从不同的角度研究人类行为,共同促进经济发展和社会进步,物理学者则侧重探求其统计特性和动力学机制。一些经验结果显示出大量人类行为时间序列服从非泊松分布。本文首先分析了某大型社区的电子邮件网络,利用电子邮件的收发记录研究其统计特性,然后结合普通书面信件通讯、手机通话通讯和短信息通讯等通讯行为,概括出人类通讯行为的统计特性,即幂律与胖尾。

[1]李楠楠,张宁,周涛.人类通信模式中基于时间统计的实证研究[J].复杂系统与复杂性科学,2008,5(3):43-46

[2]曹盼盼,阎春宁等,人类通信模式的幂律分布和Zipf定律[J],复杂系统与复杂性科学,2009,6(4):1-6.

[3]郭进利.博客评论的人类行为动力学实证研究和建模.计算机应用研究, 2011,28(4):1422-1424.

[4]周涛.在线电影点播中的人类动力学模式[J].复杂系统与复杂性科学,2008,5(1):1-5.

猜你喜欢

幂律短消息泊松
基于泊松对相关的伪随机数发生器的统计测试方法
带有双临界项的薛定谔-泊松系统非平凡解的存在性
试论电视新闻短消息的采写策略
浅谈广播短消息的采写
Android手机系统中的短消息加密研究与实现
四川地区降水幂律指数研究
幂律流底泥的质量输移和流场
泊松着色代数
1<γ<6/5时欧拉-泊松方程组平衡解的存在性
幂律谱模型原子钟钟差仿真与噪声类型辨识