APP下载

移动医疗大数据平台下节点和社区属性的社交网络转发机制

2017-04-15任丽丽欧阳君

阜阳职业技术学院学报 2017年1期
关键词:关联度可靠性社交

任丽丽,欧阳君,张 旭

(1.蚌埠医学院 公共课程部,安徽 蚌埠 233030;2.安庆师范大学 数学与计算科学学院,安徽 安庆 246133)

移动医疗大数据平台下节点和社区属性的社交网络转发机制

任丽丽1,欧阳君1,张 旭2

(1.蚌埠医学院 公共课程部,安徽 蚌埠 233030;2.安庆师范大学 数学与计算科学学院,安徽 安庆 246133)

在移动互联网技术(3G、4G)的迅猛发展和移动设备大量普及的背景下,移动医疗的相关研究已在医疗卫生领域中得到广泛的应用和认可。然而,在医疗诊断过程中产生的大量数据信息,在进行消息的传输时会与有限的网络资源存在矛盾。因此,通过对移动医疗大数据平台进行研究,分析容迟网络中节点社区属性的特点,进而研究了当节点属于多个社交网络进行信息传递时,通过对社区关联度和节点社会可靠性的分析,选择合适的中继节点进行数据的转发,即提出了基于社区关联度和节点社会可靠性的数据转发机制。最后利用计算机模拟实验,结果显示本算法与传统的Epidemic算法和Label算法相比,传递率高于Label算法并且能明显的降低网络资源成本。

容迟网络;大数据;移动医疗;社区;社会可靠性;关联度

容迟网络(Delay Tolerant Networks,DTNs)中的节点因数量的稀疏性,链路的间断性和较长的传输时延等特点,使得传统的ad hoc无线自组织网络难以发挥作用,但是在一些富有挑战性的环境中却得到很大的关注,比如太空通信,军事探索和移动社交网络[1]等,其中移动医疗平台下的社交网络也是DTNs的典型应用。目前,无论在发达国家还是在发展中国家,快速增长的人口与紧缺的医疗资源存在严重的矛盾,特别是在发展中国家现象尤为突出。挂号难,看病贵和看病不及时等问题,不仅对人类的生命产生极大的困扰,同时严重阻碍了国家的发展,降低了人民的生活质量,甚至有可能会出现影响广泛的传染病。因此,对于发展中国家必须投入大量的人力和物力解决医疗资源不均衡的状况,提高医疗服务,特别是医疗服务的结构性问题。

移动设备在无线通信技术的快速发展和激烈的市场竞争背景下得到了较快的增长。在中国,移动电话的拥有量高达12.86亿户,普及率94.5部/百人,甚至在一些沿海城市的普及率高达100部/百人[2]。在此环境下,信息通信技术与医疗卫生服务相结合诞生了移动医疗。移动医疗(Mobile Health)是电子医疗(E-health)的一个组成部分。对于移动医疗[3-4],美国医疗信息管理委员会提供的行业界定:医疗实践中使用智能手机或平板电脑等设备下载与医疗有关的应用软件(应用程序),通过移动网络在医患之间传递信息,改善其沟通和交流。移动医疗在国内外的各个领域都得到广泛的应用和认可,涉及到疾病检测、监控、诊疗以及健康管理等。比如可以通过对智能手机软件的开发[5],利用手机摄像头实现对脉搏信号的采集、传输和分析。在全世界,美国移动医疗应用约占50%以上,欧洲约占20%,非洲、拉美占12%,亚太地区占4%[6]。而据互联网数据中心(Internet Data Center,IDC)调查结果显示,目前我国三级医院也已有17.5%提供相关的医疗服务[7-8]。

近年来,移动通信技术的高速发展确实对降低医疗机构成本提供了帮助,而且也方便了患者就医的途径(挂号、咨询和远程就诊)。然而在现实中,便利的背后也存在一定的问题。在医院,对于每位就诊的患者,从挂号到最后病情的确诊需要做大量的检查,牵扯到病人的个人信息,病情记录和相关影像资料的录入和输出,这其中会产生大量的数据。对一位患者而言,可能比较容易接受,但是对于每年几百万人次的门诊接待量,这些庞大的数据无疑成为一种巨型资料——大数据。它的出现需要人类利用一种新的处理模式来处理这些海量的、高增长率和多样化的信息资产。

1 相关工作

基于大数据和移动医疗在卫生领域的应用背景下,移动互联网技术和移动设备的快速发展也促进社交网络的应用,从而也使得社交网络成为一个具有大量数据的资源库。因此需要我们不断提出高效的数据转发机制,提高网络的性能。近几年来国内外学者为提高社交网络的性能提出了许多种方法。目前应用较为广泛的方法主要有基于节点的消息复制[9-10],基于节点相似性[11-13]和基于节点社会属性[14-19]等。基于消息复制较为经典的是Epidemic算法,由Vahdat A等[9]人提出。该算法中携带数据包的节点在容迟网络中随机移动,将包传递给与它接触的所有节点,优点是传递率较高,缺点是增加网络开销。在文献[10]中,Pan H等人提出了Label算法,该算法中的携带数据包的网络节点为提高传递率,只将数据包复制传递给那些与目的节点在同一社区中的节点。Nisgav A等人[11]针对节点相似性的研究提出了基于协同过滤的方法,发现社交网络中的相似性用户,提高网络性能。Agarwal V等人[12]根据进化算法获得用户喜好的参数集合,并以此为基础得到参数相似性,并且集合用户联系强度大小给出了一种隐式评分模型去计算用户关系的相似性。基于节点的社会属性,刘静等人在[14]中,针对移动社交网络提出了一种新的信息检索算法QFD,其应用半马尔科夫模型获得用户移动性的稳态分布和瞬态行为,进而提高数据转发效率。

以上方法的研究及结果表明,大部分文献只考虑社交网络中节点的状况,而没有把社区和节点的属性综合考虑。通过调研,在移动医疗大数据和网络资源有限的背景下[20],关于社交网络中数据转发性能的研究很少。因此,本文针对社交网络的特点,提出了一种基于社区关联度和节点社会可靠性的数据转发算法。该算法充分利用节点所属社区的关联程度和节点的社会可靠性的大小来选择中继节点。通过与传统的Epidemic算法和Label算法对比发现,该算法的传递率略低于Epidemic算法,高于Label算法并且能明显的降低网络资源成本。

2 网络模型与算法

在医院,有相同或者类似疾病的患者,由于就诊的途径、治疗方案和医生等相似特点,大家经常同属于若干个相同的区域,从而整个医院无形地被分隔成许多个小区域,医生成为患者交流的中心。针对医院中医患间的关系网络,我们将该网络抽象成不同区域网络,即社交网络。

在相同区域的节点间交流次数频繁,信息能够直接或者间接到达。假设医院被分成n个移动社区,每个社区中的医生被看成是固定的AP(Access Point)并且配有无线访问设备。含有m个携带无线访问设备(如手机,iPad等)的患者在移动网络范围内移动。由此,我们可以把该网络模型简化为一个图G=(V,E),V表示n个AP和m个人所构成的集合(N=n+m),E表示顶点间所构成的边集合。社交网路用C={c1,c2,…,cn}表示,其中ci(1≤i≤n)代表第i个社区。图1表示的就是在某时刻的社会网络分布状态,由图可知,节点a,b,c, d,e分别属于c1,c2,c3这3个社区,而节点a,b,c同属于c1,c2这3个社区,节点d,c同属于c1,c3这2个社区,节点c,e同属c2,c3这2个社区,节点c同属于c1,c2,c3这3个社区,而c4社区与c1,c2,c3这3个社区的节点没有交集。

2.1 基本定义

由于节点的活动范围和活动能力都是有限的,因此我们在传递消息时,总喜欢传递给活动范围较大,所遇的节点比较多的中继节点进行消息的转发。因此我们给出节点的社会可靠性定义,是指节点所属社区共含有节点个数的总和。节点的社会可靠性越大说明所遇节点越多,消息传递到目的节点的概率就比较大。用公式表示如下:

定义1(节点社会可靠性) 节点i的社会可靠性(Social Reliability,S(i))是指节点所属社区共含有节点个数的总和。其公式表达如下:

其中式(1)表示节点所属社区共含有节点个数的总和;式(2)中的变量xi,j表示当节点i属于社区cj时,则xi,j=1,否则xi,j=0;式(3)中的变量δi,j表示当节点i在社区cj停留的时间ti,j大于等于一个阈值δ时,则节点i属于社区cj,记δi,j=1,否则δi,j=0;式(4)中的Nci表示社区ci中所含节点的个数。

2015年下半年,煤炭行业形势更加严峻,煤炭企业经济运行面临的压力进一步增大。在这种条件下,对风选项目的推进工作更加迫切,进一步优化项目方案并缩减项目总投资成为风选项目实施关键所在。

如图1可知社区c1含有5个节点,c2社区含有8个节点,社区c3含有6个节点,而节点a同属于社区c1和c2,节点c同属于社区c1,c2和c3,则节点a的社会可靠性为13,节点c的社会可靠性为19。由此可知节点c比节点a所遇节点多,因此具有更好的数据转发能力。

将时间T分割成若干个很小的等长时间段t,为表示在此时段内各社区节点的状态,用ci,t(1≤i≤n)表示i社区在时间t内所含有节点的集合。

如图2在t时刻内社区c1,c2,c3,c4中节点的集合分别为c1,t={b,c,e},c2,t={a,d,g,h},c3,t={f,i}, c4,t={i,j,g,h}。

在某时间段内,如果不同社区存在相同节点的情况,说明这些节点具有多种喜好,交友范围广,能够在不同社区移动,有利于数据的转发。因此,接下来本文通过分析不同社区相同节点的个数与不同社区间所含有的不重复节点的总数来给出社区关联度的定义。

定义2(节点社区关联度) 在一段时间内,两个不同节点所属社区所具有相同节点的个数与不同社区间所含有的不重复节点的总数之比,我们定义为节点所在社区ci和cj的社区关联度(Community Correlation)。

其中card(ci∩cj)表示节点i和节点j所在ci和cj社区所具有相同节点的个数,card(ci∪cj)表示ci和cj社区所含有不重复节点的总数,rt(ci,cj)表示社区ci和cj在某时刻内社区在网络中的关联度。

如图2所示,c3∩c4={i},c2∩c4={g,h},c2∪c4={a,d, g,h,j,i},c3∪c4={f,i,j,g,h},card(c3∩c4)=1,card(c2∩c4)= 2,card(c2∪c4)=6,card(c3∪c4)=5,则在t时刻,若节点i遇到节点j,则社区c3和c4的关联度为

若在t时刻,节点g遇到节点j,则社区c2和c4的关联度为

节点所属社区的关联程度越大,说明不同社区所具有相同节点个数占不同社区所含有的不重复节点总数的比值越大。可知节点所属社区c2,c4在网络中关联度大于社区c3,c4的社区关联度。

2.2 基于社区关联度和节点社会可靠性的数据转发算法

在移动医疗大数据平台下,源节点向目的节点转发数据时,需要面对如何选择合适的中继节点问题。我们的算法与传统算法不同,本文综合考虑了社区和节点的社会属性并且定义了一种基于社区关联度和节点影响力的数据转发算法,CCNS。算法如下:

假设节点i携带源数据包pk,节点i遇到节点j时;

步骤1如果节点j是数据包pk的目的节点,则节点i将数据包pk转发给节点j,否则转到步骤2;

步骤2

步骤(2.1)计算节点i和节点j所在社区的关联度rt(ci,cj);

步骤(2.2)计算节点i和节点j的社会可靠性S(i)和S(j);

步骤(2.3)如果rt(ci,cj)<=β且S(i)<S(j),则节点i传递数据包pk给节点j,其中β∈[0,1];

步骤3结束。

3 实验与仿真

在本节中,对本文所提出的CCNS算法与传统的Epidemic算法和Label算法在移动社交网络性能上进行比较。实验所采用的数据是Infocom 06[21],该数据共含有98个节点,78个移动节点分布在整个区域,剩余20个节点作为固定的AP存在于不同区域内。我们主要从传递率、平均延迟和拷贝数目(包副本数)三个方面来研究三种算法的性能的不同。模拟实验结果都是在C++上运行200次结果的平均值。

首先,将CCNS算法中的发包数目从150个增加到600个,来比较三种算法的性能。实验结果如图3显示,在图3(a)中可以看出三种路由算法的传递率随着发包数目的增加,都缓慢地减小。但是我们可以明显地发现,CCNS算法的传递率略低于Epidemic算法,高于Label算法。在图3(b)中,可以看出CCNS算法的平均延迟略高于Epidemic算法和Label。这是因为在选择中继节点的时候,我们不仅要考虑社区的关联度还要考虑节点的可靠性,必然会导致传递时间的延长。在图3(c)中观察到,CCNS算法在降低网络资源消耗方面具有很大的优势,相比于Epidemic算法的拷贝数目平均低了48.1%,相对于Label算法平均低了42.1%。综上说明了,CCNS算法在减少大量网络开销的同时获得了良好的转发性能。

其次,通过改变数据包的存在时间(Time-to-Live,TTL)来研究三种算法对网络性能的改变。我们将TTL从12小时变化到36个小时,如图4(a)所示,其中当TTL从12小时变化到15小时时,三种算法的传递率增长明显,这是因为刚开始数据包在网络中存在的时间较短,没有足够的时间传递到目的节点,随着时间的延长,三种算法传递率逐渐增大并且趋势基本相同。其中,CCNS算法的传递率略低于Epidemic算法,但高于Label算法,说明CCNS算法具有很好的转发性能。在图4(b)中,随着TTL时间的增加,三种算法的平均延迟的增加趋势和幅度基本相同。在图4(c)中,随着TTL时间的变化,三种算法的拷贝数目变化不明显,但是我们还是可以明显地看出,CCNS算法的拷贝数目比其他两种算法的拷贝数目要少很多,相比于 Epidemic算法最多减少49.2%,相比于Label算法最多减少43.1%。

最后,对CCNS算法中社区关联度的阀值进行改变,令初始值从0.1变化到1.0,通过实验仿真来观察阀值的变化对网络性能的影响。从图5(a)可以看出,随着社区关联度阀值的增大,传递率也逐渐增加。由算法可知,社区的关联度越大,说明社区中的节点参与程度越高,从而会导致传递率的显著升高。随着更多节点的参与,如图5(b)所示平均延迟在逐渐减少。而在如图5(c)中,关联度阀值的增加虽然可以有更多的节点供选择,但同时也导致了网络中拷贝数目的增加。

4 结束语

本文针对移动医疗大数据背景社交网络的特点,提出了一种基于社区关联度和节点社会可靠性的数据转发算法,即CCNS算法。与以往研究的不同,该算法充分考虑节点所属社区关联程度和节点的社会可靠性的大小来选择中继节点。首先,根据医院中医患移动的规律,把基于移动医疗大数据平台下的移动网络抽象成社交网络,建立网络模型;其次,给出了节点社会可靠性和节点社区关联度的定义,并且给出了CCNS算法;通过仿真实验对比发现本文的CCNS算法,在传递率上高于Label算法,略低于Epidemic算法,并且能明显的降低网络资源成本。由此可知,该算法性能对于提高移动医疗社交网路中大数据的传播作用十分明显。在未来的工作中,对移动医疗大数据平台下的社交网络进行进一步的分析和挖掘,从节点和所属社区间的共同社会属性出发去研究新算法,提高消息的转发率,降低网络资源消耗。

[1]Fan J,Du Y,Gao W,et al.Geography-aware active data dissemination in mobile social networks[J].2010: 109-118.

[2]雒续源,陈志刚,王云华,等.基于移动医疗大数据平台下深度最优匹配算法的机会网络转发机制[J].计算机工程与科学,2015,37(10):1799-1805.

[3]党 伟.医疗耗材库存与采购控制管理[J].中国医院管理,2011,31(9):93-94.

[4]AHIMA.Mobile apps 101:A primer for Consumers. http://myphr .com/Stories/NewsStory.aspx?Id=596. Accessed 10 June 2013.

[5]孟 濬,朱天宇.一种基于智能手机的新移动医疗系统模式[J].计算机应用研究,2013,30(7):2055-2060.

[6]徐 倩,赵文龙.国内外移动医疗应用现状及启示[J].检验医学与临床,2014(9):1295-1297.

[7]徐开敏.浅析医院物资材料的采购管理[J].医学信息(上旬刊),2011,24(6):3269-3270.

[8]黄永刚,王 蕾.移动医疗在医院医疗服务中的应用[J].医疗卫生装备,2015,36(4):133-134,140.

[9]Vahdat A,Becker D.Epidemic routing for partially connected ad hoc networks,San Diego:University of California[R],2000.

[10]Hui P,Crowcroft J.How Small Labels Create Big Improvements[J].Proceedings of IEEE Percom Workshop on Intermittently Connected Mobile Ad Hoc Networks,2007:65-70.

[11]Nisgav A,Patt-Shamir B.Finding similar users in social networks[J].Theory of Computing Systems,2011, 49(4):720-737.

[12]Agarwal V,Bharadwaj K K.A collaborative filtering framework for friends recommendation in social networks based on interaction intensity and adaptive user similarity[J].Social Network Analysis and Mining, 2013,3(3):359-379.

[13]汪晶明.移动社交网络中一种基于节点相似度和活跃度的数据转发算法[D].合肥:合肥工业大学,2015.

[14]Liu J,Wang Q S,Wang Q,et al.An information search algorithm based on query delegation and feedback delegation in Delay-Tolerant networks[J].Wireless Personal Communications,2015,82(4):2623-2635.

[15]Yin L,Lu H,Cao Y.Probabilistic Delay Routing for Delay Tolerant Networks[J].10th International Conference on Advanced Communication Technology.Gangwon-Do:IEEE Press,2008,1:191-195.

[16]Spyropoulos T,Psounis K,Raghavendra C.Efficient routing in intermittently connected Mobile networks: The single-copy case[J].IEEE-ACM Transactions on Networking,2008,16(1):63-76.

[17]Liu Y,Li L,Li Z,et al.Trust-based optimized routing scheme in Mobile Social Networks[C].2013 International Conference on Communications,Circuits and Systems(ICCCAS).Chengdu:IEEE Press,2013,1:87-90.

[18]Li X K,Zhang Q.Influence maximization across Multi-Channels in social network[J].Journal of Computer Research and Development,2016,53(8):1709-1718.

[19]Shen J D.A new data forwarding algorithm based on cumulative performance and transient performance in DTNs[J].Journal of Information&Computational Science,2015,12(2):563-572.

[20]关培源,陈志刚,王云华,等.基于移动医疗大数据平台下降低能量消耗机会网络的研究与应用[J].计算机应用研究,2015,32(12):3790-3793.

[21]Scott J,Gass R,Crowcroft J,et al.CRAWDAD data set cambridge/haggle(v.2009-05-29).Downloaded from http://crawdad,cs,dartmouth.edu/haggle,5,2014.

A forwarding algorithm under the attribute of node and community in social networks based on mobile medical large data platform

REN Li-li1,OUYANG Jun1,ZHANG Xu2
(1.Department of Fundamental Course,Bengbu Medical College,Bengbu Anhui 233030,China;2.School of Mathematics and Computation Science,Anqing Normal University,Anqing Anhui 246133,China)

With the rapid development of 3G(4G)mobile internet technology and the popularity of mobile devices,mobile medical research has been widely used in medical fields.However,the process of medical diagnosis will produce large amounts of data information.The transmission of the message was contradicted with the limited network resources.Therefore,the paper analyzes how to transfer the information when the nodes belong to several social networks in delay tolerant networks based on mobile medical large data platform.Then the paper chooses the appropriate relay node for data forwarding by analyzing the community correlation and node social reliability and puts forward a new algorithm based on community correlation and node social reliability.Finally,the experimental results show that compared with the existing well-known Epidemic and Label algorithm,the new algorithm can obviously reduce the cost of network resources and the delivery rate is better than that of the Label.

DTNs;big data;mobile medical;community;social reliability;correlation

TP393

A

1004-4329(2017)01-073-07

10.14096/j.cnki.cn34-1069/n/1004-4329(2017)01-073-07

2016-11-24

国家自然科学基金(61603003);蚌埠医学院自然科学基金(BYKY1661)资助。

任丽丽(1988- ),女,硕士,助教,研究方向:移动医疗、容迟网络。

猜你喜欢

关联度可靠性社交
社交牛人症该怎么治
聪明人 往往很少社交
社交距离
可靠性管理体系创建与实践
合理使用及正确测试以提升DC/DC变换器可靠性
你回避社交,真不是因为内向
5G通信中数据传输的可靠性分析
基于灰色关联度的水质评价分析
基于灰关联度的锂电池组SOH评价方法研究
基于可靠性跟踪的薄弱环节辨识方法在省级电网可靠性改善中的应用研究