一种扩展的Post类函数及其对基因调控机制的影响
2016-08-09欧阳宏嘉沈良忠刘文斌
许 鹏,欧阳宏嘉,沈良忠,刘文斌
(1.温州大学物理与电子信息工程学院,浙江温州 325035; 2.温州大学城市学院,浙江温州 325035)
一种扩展的Post类函数及其对基因调控机制的影响
许鹏1,欧阳宏嘉1,沈良忠2,刘文斌1
(1.温州大学物理与电子信息工程学院,浙江温州 325035; 2.温州大学城市学院,浙江温州 325035)
已有的理论分析表明,有序函数对网络的运行及其动态行为具有重要的影响.Post类函数是目前发现的数量最大的一种有序函数,其缺点是它仅反映了基因之间的正调控机制.本文在Post类函数的基础上,将其扩展为一种同时具有正负调控机制的函数类.仿真结果表明:扩展的Post类函数在维持网络的有序性及长程相关性方面,和原有的Post类函数以及渠化函数类似.同时与已有的Post类和渠化函数相比,新扩展的Post类函数量最多.从进化的角度,新扩展的函数更有可能成为自然进化选择的调控方式.通过对八种真实生物系统布尔网络模型函数分布的研究,也部分的支持这一结论.
布尔网络;动态行为;Post类函数;基因调控网络
1 引言
基因调控网络的研究已经成为系统生物学的一个热点问题,基因调控网络的模型主要有布尔网络、贝叶斯网络,及微分方程模型等[1].布尔网络模型是一种最简单的模型[2],基因的表达状态为“0”和“1”二种状态,“0”表示抑制或不表达,“1”表示激活或表达.这种模型虽然简单,但是仍然能够反映网络运行过程中复杂的动态行为.已有的研究表明:真实基因调控网络处于有序和无序的边界.具有这种动态行为的网络在各种噪声下既能保持一定的稳定性,同时又能对环境变化做出适当的调整,具有适应性[3].探知产生这种临界性的原因就成为一个重要的问题.一方面,人们认为包括基因调控网络在内的生物网络具有无尺度或小世界特征,如Jeong等发现酵母的代谢网络服从γin≈γout≈2.2[4,5].另一方面,基因之间的作用方式对于系统的稳定性同样具有重要的影响.渠化函数在阻止无序行为方面具有重要的作用,增加网络中渠化函数的比例,可以促使网络穿越临界界限并进入有序状态.大量事实表明在高等脊椎动物的基因调控系统中,渠化函数非常普遍[6].近年来大量文献表明,真核生物的转录调控规则具有很高的渠化性倾向[7].2003年,Shmulevich在渠化函数的基础上提出了一种Post类的有序函数.这种函数的封闭性能够保证它的各种复合函数仍然属于Post类.并且当连通度k≥5的时候,其数量远大于渠化函数[3].因此,他认为Post类函数更有可能成为基因之间相互作用的方式.Post类函数实际上反映的是基因之间的一种正调控关系,然而,细胞网络中不仅有正调控,同时也存在着负调控关系.从生物学角度来看,正调控是完成细胞分化的必要部分,而负调控则有助于维持生物体内平衡[8].本文将Post类函数扩展为同时具有正负调控机制的一类函数.然后,从数量上、有序性和长程相关性三个方面研究了渠化函数,Post类函数和扩展Post类函数的关系及其对基因调控机制的影响.最后,我们以八种真实生物为例,讨论了它们的布尔网络模型中三种函数类的分布情况.
2 概念
2.1布尔网络及其灵敏度
一个布尔网络G(V,F)由节点集V={x1,…,xn}和函数集F={f1,…,fn}组成,其中fi:{0,1}ki→{0,1}为基因xi的布尔函数,ki指调控xi的基因的个数,通常也指xi的入度.xi在t+1时刻的状态完全由其调控基因xj1,xj2,…,xjki在t时刻状态确定,可以写为xi(t+1)=fi(xj1(t),xj2(t),…,xjki(t)).网络的演化通常采取同步演化的方式.Shmulevich提出了网络灵敏度的概念刻画网络的有序性,灵敏度S反映了1比特的扰动对于网络演化的影响:S<1对应于有序状态;S>1对应于于混沌状态;S=1对应介于二种之间的临界状态.
2.2长程相关性
长程相关性是一种衡量复杂系统运行平滑性的动态行为.具有长程相关性的系统通常具有一种“记忆”特性或“自相似性”.前者指系统的演化过程通常受其前面很长时间范围行为的影响;后者指系统的行为或特征在不同的时间尺度上具有相似性.通常采用标度指数α表征时间序列信号的长程相关性.α=1.5对应布朗噪声,表示信号在小时间范围内具有很强的相关性.α=0.5时对应白噪声,表示信号完全无规律性.α=1对应于1/f过程,表示信号局部呈无序,而宏观上具有一定相关性.通常都认为0.9≤α≤1.1为1/f过程,其他两侧区域分别对应布朗噪声和高斯白噪声.DFA已经被广泛的应用于DNA序列、神经颠覆信号、人的步态、心脏跳动信号等[9].很多医学信号的研究表明:偏离1/f波动往往与系统功能的失调相关[10,11].
2.3渠化函数
当某个变量取特定值时可以唯一确定函数的输出值,这种函数就是渠化函数.渠化函数的定义为:如果存在y和z,使得对于所有输入(x1,x2,…,xn)∈{0,1}n,当xi=y时,f(x1,x2,…,xn)=z,则称布尔函数f:{0,1}n→{0,1}是渠化函数, xi为渠化变量.渠化函数可以有一个或多个渠化变量.例如在函数f(x1,x2,x3)=01110011中,x2就是一个渠化变量.
2.4Post类函数[12,13]
对于μ≥2,如果任意μ个使函数f取值为1的向量的某一个分量均为1,则称该函数属于Aμ类.类似地,如果任意μ个使函数f取值为0的向量的某一个分量均为0,相应的函数类为aμ.由Aμ∪aμ(2≤μ≤k)构成的函数类称为Post类函数.Post类函数要求函数的输出值与其输入变量的值要满足一致性,即都同时为0或1.这其实是一种正调控机制.Post类函数具有一个重要的性质就是封闭性,即任意多个Post类函数的合成仍然属于Post类函数.
2.5扩展Post类函数
3 结果和讨论
下面我们从函数数量、有序性和长程相关性三个方面,探讨渠化函数、Post类函数以及扩展Post类函数对系统动态行为的影响.对每种函数类,我们分别产生100个灵敏度S为0.7到1.3的布尔网络,其中最大连通度k=4.由于μ=2时的Post类或者扩展的Post类函数的数量最大,本文μ值均为2.
3.1函数数量分布
图1给出了连通度k=2,3,4时,Post类函数、渠化函数以及扩展Post类函数的数量分布情况.可以看出,在任所有情况下扩展Post类函数都是最多,而Post类函数只有当k≥5时才会超过渠化函数的数量.此外,由于对称性,扩展的Post类函数数量大约总是Post类函数的两倍.
这三种函数都具有有序性,因而它们之间存在一些交集.表1列出了k=2,3,4,5时,三种函数及其交集的数量.可以看出,新扩展的Post类函数与渠化函数的交集正好等于渠化函数的数量,它与Post类函数的交集正好等于Post类函数.因此,扩展的Post类函数正好包含了这二类函数.结合以上分析,从数量上自然界更有可能选择这种扩展的Post类函数来维持系统的有序性.
表1三种函数在连通度k=2,3,4,5时的数量及其交集数量(A、B和C分别表示渠化函数、Post类函数以及扩展Post类函数)
连通度k2345函数总数16256163844294967296渠化函数数量1412035141292276Post类函数数量107627402629551扩展Post类函数数量1412652025241500A∩B∩C10731896654819A∩B10731896654819A∩C1412035141292276B∩C107627402629551
图2给出了连通度k=2,3,4,5时,每个函数类占总的布尔函数的比例.可以看出,当k>4时有序函数占全部函数的比例将急剧减少.如果生物网络中有序函数占大多数的假设成立,则基因之间的连通度不应该太大,否则将会增加自然选择的压力.因此,有序性假设与生物网络的幂律分布以及小世界特征假设恰好一致.在基因调控网络的模型推理中,大部分的研究通常都将连通度取值为k=3,4,从这一点上来说也是较为合理的.
3.2有序性
其中⊕是模为2加法.设x(1)(t+1)和x(2)(t+1)分别表示状态x(1)(t)和x(2)(t)的后继状态.类似的,ρ(t+1)是这二个后继状态的归一化汉明距离.Derrida曲线是一种表示ρ(t+1)随ρ(t)变化的曲线[14].在无序网络中,即使很小的扰动也会迅速扩大.对应的Derrida曲线通常位于主对角线之,且在原点附近的斜率大于1.反之,在有序网络中,很小的扰动会迅速消失.对应的Derrida曲线通常位于主对角线以下,且在原点附近的斜率小于1.从图3可以看出,由三种有序函数构造的网络的Derrida非常接近,而且在原点附近的曲线斜率均接近1.这说明新扩展的Post函数与Post函数和渠化函数类似,具有抑制噪声传播并维持系统稳定的能力.
3.3长程相关性
图4给出了分别由三种函数类构造的网络的长程动态相关性在噪声和灵敏度空间(η,S)中的相变图.图4中的中部区域对应1/f波动的噪声范围,可以看出,三种函数的相变区间大致相似.其中Post类函数构成的网络的1/f波动的噪声区间最长,这可能与其封闭性有关.扩展Post类函数与渠化函数构成的网络的1/f波动的噪声区间非常接近.因此,由扩展Post类函数构造的网络,同样能够产生类似的1/f波动.
4 真实生物网络的研究
布尔网络模型已经广泛应用于酵母细胞周期表达、哺乳动物细胞周期表达、果蝇体节极性网络、花发育形态表达等不同生物的基因调控网络建模和动态行为分析.下面我们讨论八种典型细胞网络中布尔函数类型的分布情况:裂殖酵母细胞周期(Fy)、芽殖酵母细胞周期(By)、果蝇细胞周期(Dc)、哺乳动物细胞周期(Mac)、及哺乳动物体节极性网络(Ds)、拟南芥的形态网络(Ar)、人类神经胶质瘤细胞(Nlc)和转移性黑素瘤细胞网络(Mec).它们分别代表了细胞周期、细胞分化和肿瘤细胞三种细胞过程.表2列出了八个网络中基因的个数、各种函数类的数量及不同连通度情况下函数的个数[8,15~19].
可以看出,在所有模型中扩展的Post类函数的数量几乎都超过一半.而渠化函数在By、Dc网络中的数量小于一半,Post类函数的数量则在By、Dc、Mac和Ds网络中小于一半.进一步观察By、Dc、Mac和Ds等四个网络,我们发现其中约三分之一节点的连通度k≥5,这是导致其中扩展的Post类函数和渠化函数的数量相对较少的主要原因.由于网络推理技术的限制,上述模型与真实网络的规模相比还很小,但是它们还是可以部分反映实际系统中基因之间的作用关系.这些模型中各种函数的分布部分的验证了扩展Post类函数更有可能成为自然进化选择的作用方式.同时,也说明了网络中具有高连通度的Hub类节点不应该太多,否则,有序函数的数量将会急剧减少.
表2 八种真实生物网络中的基因个数及各种函数类的个数,以及在各个连通度k的函数的个数
5 总结
布尔网络的拓扑结构和函数作用方式直接影响网络的动态行为,本文在Post类函数的基础上,提出了一种具有正负调控机制的扩展的Post类函数,并进而研究了这种扩展的Post类函数对网络动态行为及网络拓扑结构的影响.首先,新函数构成的网络与Post类函数和渠化函数具有相似的动态行为,由它们构造的网络都具有维持网络有序行为的能力,并且其长程相关性的相变过程也很类似.由于在任意连通度k下,扩展的Post类函数的数量最多.这种函数类更有可能在自然进化过程被选择为基因之间调控的作用方式.其次,随着连通度k的增加,三种有序函数占总函数的比例将急剧减少.因此,有序性假设正好与生物网络中节点入度的幂律分布的观察一致,即只有少数关键节点的度很大.这些度大的节点即使不是有序函数,对于系统整体的有序性的影响也很小.在八种真实生物网络中各种函数类型的分布,也部分支持上述观点.
最后必须指出,新扩展的Post类函数类与原Post类函数相比,虽然具有不仅包含了正、负调控机制,而且在数量上几乎是后者的二倍的优点.但是,负调控机制的引入,也破坏了原Post类函数的封闭性.由于在布尔网络模型中,吸引域的半径通常都不大,因此系统在一个微小的扰动下很快就会回到吸引子状态.失去封闭性对系统稳定性的影响不会太大,渠化函数和众数函数也均不满足封闭性.
[1]I什穆列维奇,等.基因组信号处理[M].刘文斌,高琳,译.北京:科学出版社,2010.
Shmulevich I,et al.Genomic Signal Processing[M].Liu Wenbin,Gao Lin.Beijing:Science Press,2010.(in Chinese)
[2]WANG X,LIU Q,CHENG Y,LI L.Qualitative analysis of gene regulatory networks based on angular discretization[J].Chinese Journal of Electronics,2011,20:646-650.
[3]Shmulevich I,Lähdesmäki H,Dougherty E R,Astola J,et al.The role of certain post classes in Boolean network models of genetic networks[J].Proceedings of the National Academy of Sciences,2003,100:10734-10739.
[4]Guan B,Zan X,Xiao B,Ma R,et al.Detecting dense subgraphs in complex networks based on edge density coefficient[J].Chinese Journal of Electronics,2013,22:517-520.
[5]Jeong H,Tombor B,Albert R,Oltvai Z N,et al.The large-scale organization of metabolic networks[J].Nature,2000,407:651-654.
[6]Kauffman S.The Origins of Order:Self Organization and Selection in Evolution[M].Oxford University Press,1993.
[7]Harris S E,Sawhill B K,Wuensche A,Kauffman S.A model of transcriptional regulatory networks based on biases in the observed regulation rules[J].Complexity,2002,7:23-40.
[8]Mendoza L,Thieffry D,Alvarez-Buylla E R.Genetic control of flower morphogenesis in Arabidopsis thaliana:a logical analysis[J].Bioinformatics,1999,15:593-606.
[9]Penzel T,Kantelhardt J W,Grote L,Peter J-H,et al.Comparison of detrended fluctuation analysis and spectral analysis for heart rate variability in sleep and sleep apnea[J].IEEE Transactions on Biomedical Engineering,2003,50:1143-1151.
[10]Amaral L A,Díaz-Guilera A,Moreira A A,Goldberger A L,et al.Emergence of complex dynamics in a simple model of signaling networks[J].Proceedings of the National Academy of Sciences of the United States of America,2004,101:15551-15555.
[11]Goldberger A L,Amaral L A,Hausdorff J M,Ivanov P C,et al.Fractal dynamics in physiology:alterations with disease and aging[J].Proceedings of the National Academy of Sciences of the United States of America,2002,99:2466-2472.
[12]Post E L.The Two-Valued Iterative Systems of Mathematical Logic(AM-5)[M].Princeton University Press,1941.
[13]Post E L.Introduction to a general theory of elementary propositions[J].American Journal of Mathematics,1921,43:163-185.
[14]Derrida B,Pomeau Y.Random networks of automata:a simple annealed approximation[J].EPL (Europhysics Letters),1986,1:45.
[15]Fauré A,Thieffry D.Logical modelling of cell cycle control in eukaryotes:a comparative study[J].Molecular BioSystems,2009,5:1569-1581.
[16]Sánchez Rodríguez L,Chaouiya C,Thieffry D.Segmenting the fly embryo:logical analysis of the role of the segment polarity cross-regulatory module[J].International Journal of Developmental Biology,2008,52:1059-1075.
[17]Davidich M I,Bornholdt S.Boolean network model predicts cell cycle sequence of fission yeast[J].PLoS One,2008,3:e1672.
[18]Davidich M,Bornholdt S.The transition from differential equations to Boolean networks:a case study in simplifying a regulatory network model[J].Journal of Theoretical Biology,2008,255:269-277.
[19]Zhang S-Q,Ching W-K,Ng M K,Akutsu T.Simulation study in probabilistic Boolean network models for genetic regulatory networks[J].International Journal of Data Mining and Bioinformatics,2007,1:217-240.
许鹏男,博士研究生,1986年出生于江苏泗洪,2013年6月获温州大学硕士学位,2013年9月进入东南大学攻读博士学位,主要研究方向为生物信息学、数据挖掘.
E-mail:dpzc765@163.com
刘文斌男,博士,教授,1969年出生于陕西韩城.2004年获华中科技大学博士学位,目前感兴趣的研究领域为生物信息学、数据挖掘、DNA计算等.获得省部级奖励4项,主持国家省部级项目6项,发表学术论文40余篇.
E-mail :wbliu6910@126.com
The Study of an Extended Post Class Functions and its Influence on the Gene Regulatory Mechanism
XU Peng1,OUYANG Hong-jia1,SHEN Liang-zhong2,LIU Wen-bin1
(1.Department of Physics and Electronic Information Engineering,Wenzhou University,Wenzhou,Zhejiang 325035,China; 2.City College,Wenzhou University,Wenzhou,Zhejiang 325035,China)
Theoretical analysis reveals that ordered functions play an important role in the running and dynamical behavior of networks.Post function class has been known as the maximal ordered function.However,it only describes the positive regulatory mechanism appeared in genetic regulatory networks.In this paper,we extend the Post function class so that it contains both the positive and negative regulatory mechanism.Simulation results show that the extended Post function class can present similar dynamical characters as the original Post class and Canalizing function class.It has the ability to keep ordered behaviors and can emerge the long-range correlated dynamics.From the point of view of natural evolution,we conclude that such abundant ordered functions are more possible to be selected as the interactions among genes.Finally,the distribution of function classes on eight real systems also partially supports our conclusion.
Boolean network;dynamic behavior;post class function;gene regulatory network
2013-08-08;
2014-03-04;责任编辑:郭游
国家自然科学基金(No.61272018,No.61572367,No.61174162);浙江省自然科学基金(No.R1110261,LY13F010007)
TP391
A
0372-2112 (2016)07-1689-05
��学报URL:http://www.ejournal.org.cn
10.3969/j.issn.0372-2112.2016.07.024