一个能闻出分子气味的“超级鼻子”机器从大量气味数据中做出的预测
2017-05-19杨思敏张薇
杨思敏 张薇
我们熟悉酒精味的清冽刺鼻,但构成它的分子(C2H5OH)闻起来又是什么味道—或者它究竟有没有气味?如果不把鼻子凑到苯甲醛(C7H6O)上,你不会知道它闻起来像杏仁。仅仅在书本上看到二甲基硫醚的分子式(C2H6S),你也无法了解到它带有大海的气息。
但是现在,在一群志愿者和科学家的研究下,分子式的“味道”不再那么神秘莫测。
理论上,人类可以分辨出一万亿种气味,然而从物质分子结构辨别气味却不是一件容易的事。一种分子的气味可能取决于它包含的碳原子数目、它的稳定程度,以及它伸出的支链等。但是,这些结构究竟是如何影响或者决定它们的气味的?大量的实验表明,某些分子看似具有相同的化学组成,但带给人的嗅觉体验却相差甚远,往往一个原子数的改变就能带来完全不同的气味。
分子结构和它们产生的气味之间的关联吸引了无数科学家。2015年,美国IBM研究中心的研究员帕布洛·迈耶(Pablo Meyer)以及洛克菲勒大学的教授莱斯利·伏肖尔(Leslie Vosshall)和研究员安德里亚斯·凯勒(Andreas Keller)共同发起了一个众包项目—梦想嗅觉预测挑战(DREAM Olfaction Prediction Challenge),来自全世界的22支队伍提出了各自的计算机学习算法,使机器能从大量气味数据中做出有用的预测。最终,两个来自亚利桑那州立大学和密歇根大学的算法取得优胜。
接下来,在构建数据库的过程中,迈耶等人邀请了49名志愿者对 476个玻璃样品瓶中的化合物的气味进行逐一分类,如鱼腥味、大蒜味或水果味等,共计19种描述项。此外,志愿者们还需要针对每种化合物气味的浓淡以及给人的愉悦程度进行分级。同时,研究者们还收集了每种样品分子的结构特征数据,包括原子类型、官能团种类等,每个样品分子的结构特征都超过了4800 种。
综合了参赛者给出的算法,最终的AI模型可以较为精准地预测一个分子的气味强度和愉悦度,还能对之前提及的19种气味描述项中的8种(“大蒜味”、“鱼腥味”、“甜味”、“水果味”、“焦糊味”、“辣味”、“花香味”和“酸味”)进行准确的打分(由弱到强分别是0-1分)。他们把这个AI系统称作—超级鼻子。
邁耶表示,“超级鼻子”能够根据不同分子结构对其气味进行一系列分析,其预测结果与实际的嗅觉感受非常相似。团队成员很有信心:“我们几乎可以预测任何分子的气味指数,并以此推测出一种分子的闻起来的味道。”
人类的嗅觉是有极限的,“超级鼻子”也更接近人类直观的嗅觉体验。“如果我给你一种化学物质,让你在周二闻一次,周三再闻一次,你两次闻到的味道是不同的。‘超级鼻子和人类的固有知觉已经很接近了。”迈耶说,“除此之外,不同的个体之间也有差异。同样一种分子,你和我可能闻出不同的气味,所以这种算法在预测分子的平均气味时表现出色,而预测某种特定的气味时就不那么准确了。”
目前,还没有一个完善的理论能在一种分子的性质和它的气味之间建立一一映射的绝对关系,这种算法只能隐约揭示某些特征和某些性质之间的关联:硫原子使物体较易发出烧焦味或大蒜味,大分子较易发出好闻的气味,香草醛一类的分子闻起来较像烘焙食品等。但是,该项目已经可以帮助某些香料香精公司省去大量精力和投入。无疑,机器学习有助于处理海量数据的多变性和复杂性,更为人们探索分子结构与气味之间的联系提供了一个良好的开端。