APP下载

微生物时间序列分析方法综述

2016-05-14梁晓一

中国科技纵横 2016年5期
关键词:时间序列

梁晓一

【摘 要】关于微生物时间序列的研究提供了对从海洋到人类微生物群落稳定性和动态的新见解。专用于时间序列的分析工具使这些数据受到充分利用。这些工具可以揭示周期模式,有助于建立预测模型,或者量化异常行为。此外,微生物间随时间变化的相互作用可以用来构造随时间变化的关联网络。本文通过分析介绍这些技术来说明它们在微生物研究上的潜在价值。

【关键词】微生物群落 宏基因组 时间序列

高通量测序方法的改进使得关于各种环境下微生物群落随时间变化情况的纵向研究大大增加。这些时间序列研究可以提供对于微生物群落稳定性的独特生态见解,同时也能了解无法以其他方式获得的微生物群落应对扰动的响应。

1通过时间序列数据了解微生物

在近期的纵向研究中,大约一半的微生物群落有负斜率时间衰减曲线,也就是说,这些微生物群落间的不同随时间增加为增加。此外,微生物群落多样性随时间变化的情况与环境有关,在相同的环境下,其多样性差异不大,在不同的环境中,微生物群落多样性差异很大。例如,土壤和酿酒厂废水中微生物多样性最低,然而人类手掌和婴儿肠道的微生物多样性最高。对海洋微生物进行的长期研究表明,相对与其他因素,微生物群落中的个别成员会受到季节变化的强烈影响。同时,另一些微生物群落在定殖后会经过一系列的可预测状态,例如在牙斑的形成过程中,耐氧菌的生存为厌氧菌提供环境。在某些情况下,例如婴儿肠道菌群的定植,虽然微生物群落在初始阶段变化连续变化,但最终会稳定在类似的状态。

微生物群落往往演变成一个稳定的组合状态,这一状态会受到外界因素的变化而变化,例如抗生素或益生菌治疗会影响肠道微生物群落的组合状态。微生物彼此之间及微生物与环境之间的复杂相互作用是影响微生物生态的主要贡献者,目前探索上述关系的方法主要是网络推断技术。

2微生物时间序列网络

近期的研究提供了许多可以从时间序列数据构建共生网络的方法,从结合置换检验的相关性分析[1]到基于超几何分布的相似性评估[2],以及分析影响类群丰度多因素的多元回归分析[3]。这些静态网络推断技术可应用于构造动态模型。例如,微生物群落的动态变化在数学上往往符合广义的Lotka-Volterra方程,其将微生物丰度的变化作为分类群生长率和微生物间相互作用强度的函数。方程中的参数可以利用对时间序列数据进行多元回归确定。

然而,上述方法忽略了时间序列提供的时间点排序和依赖性的附加信息。这些特性只能通过动态的方式加以利用。

局部相似性分析(LSA)采用动态规划算法,在最大限度上确定两个序列的相似性得分,以判断两个序列的相似关系,同时LSA还可以检测两个时间序列之间关系的滞后。例如,LSA被用于预测噬菌体和他们的宿主之间的关系。动态贝叶斯网络在模型中将每个变量的当前值作为其父变量之前时间点的函数。因此,动态贝叶斯网络可检测包括循环在内的动态相关性, 相比标准贝叶斯网络,动态贝叶斯提供了更强大的建模框架,尽管它增加了计算成本,可扩展性有限,然而在识别正确模型时其对数据的解释良好。另一组的动态网络推断技术基于交叉预测,它对如何通过同一系统内的其它时间序列预测某一的时间序列的将来这一问题进行量化,这类方法包括Granger因果关系[4]和新型聚合杂交映射。

上面提到的所有方法在推断物种相互作用时都从整个时间序列出发构造单一网络。然而,物种之间的相互作用可能随时间改变, 因此其网络结构也会随之变化。时变网络推断技术的目的就是研究变化发展的网络结构,非平稳和随时间变化的动态贝叶斯网络,可用于推断在网络结构随时间发生的变化。

3结语

在微生物时间序列分析中,时间间隔的长短会影响微生物关联关系,纵向分析中的许多方法需要短期和定期采样间隔长的时间序列,目前可用的宏基因组时间序列往往很短(几个时间点),跳空(失踪的时间点),稀疏(零富)和嘈杂,因此需要进行预处理,包括:规范,插值和去趋势,使时间点等距等方法。因此如何更好的选取取样间隔是一个需要解决的问题。网络结构对状态转换的影响的研究尚处于起步阶段。未来的研究方向是探索随时间变化的网络是否有“预警”的属性,即网络结构可以预测某种转变是否发生。

尽管面临挑战,微生物时间序列的研究已经提供了一套丰富的分析工具,有助于了解系统动力学和应对扰动,构建预测模型。应用这些强大的技术于微生物学和宏基因组学,在解决遇到的纵向时间序列和相关建模难题上时有很大的帮助。

参考文献:

[1]吴松锋,朱云平,贺福初.转录组与蛋白质组比较研究进展[J].生物化学与生物物理进展, 2005, 32(2): 99-105.

[2]李朝飞,于航,潘丽晶等.棉铃虫泛素基因的克隆及序列分析[J].中山大学学报: 自然科学版,2005,44(1):61-64.

[3]李绍珠.多元回归分析[J].上海教育科研,1991,3: 014.

[4]李卫娜,郑小林,侯文生 等.脑功能信号的 Granger 因果性分析方法[J].国际生物医学工程杂志,2011,34(6):375-379.

猜你喜欢

时间序列
基于分布式架构的时间序列局部相似检测算法
基于嵌入式向量和循环神经网络的用户行为预测方法
医学时间序列中混沌现象的初步研究
基于时间序列分析南京市二手房的定价模型
基于Eviews上证综合指数预测
上证综指收益率的影响因素分析
基于指数平滑的电站设备故障时间序列预测研究
基于时间序列的我国人均GDP分析与预测