基于计算机视觉技术的番茄花青素含量检测
2018-03-28雷静
雷 静
(成都农业科技职业学院,成都 611130)
0 引言
花青素是一种类黄酮类的水溶性色素,广泛存在于植物体中。植物细胞液为酸性时花青素呈现红色,为碱性时则呈现蓝色。花青素是植物的一种次生代谢产物,参与植物自身一些重要的生理功能。研究表明:花青素具有抗氧化、抗增生和抗突变的特性,还能预防心血管疾病,阻止肿瘤细胞扩散。作为一种天然的色素,花青素的营养保健价值极高,还可以用作食品加工的着色剂[1]。花青素是构成花瓣和果实颜色的主要色素之一,许多蔬菜和水果的市场价格都由颜色的深浅决定,反映出花青素巨大的经济价值。花青素的基本单元是花色苷,种类有多种,包括飞燕草素、矮牵牛素和锦葵色素,这3类色素覆盖了花青素90%以上的种类。
番茄可以同时作为蔬菜和水果食用,其果实颜色鲜艳,水分含量大,深受消费者的欢迎。但是,番茄的应用价值主要在其所含的番茄红素,而花青素的含量则相对较少。有研究对番茄的核心种质资源库进行了检测,仅在极少数的种质中发现了很低浓度的花青素。与其野生近缘物种如智利番茄、龙葵和葡萄等相似,番茄的花青素都积累在果实的表皮中[2]。即便如此,积累花青素的合成途径仍存在于番茄中,富含花青素的功能型番茄便成为一个重要的育种目标。除了功能方面的研究外,花青素的生物合成过程和分子机理也在多种植物中得到了阐明,为利用植物基因工程技术提高花青素含量创造了条件。例如,赵岑等通过农杆菌介导法将花青素调节基因VlmybA2转入番茄,使根、茎、叶脉和果实均呈现出紫色,大幅度地提高了番茄花青素的含量[3]。
在花青素的相关研究中,含量的测定是最基础的技术手段。植物不同组织中的花青素含量测定方法有很多种,如正丁醇盐酸法、香草醛盐酸法、盐酸甲醇法和pH示差法等。在实际研究中,一般根据植物组织不同的物质结构和特性,选择相应的测定方法。其中,正丁醇盐酸法和香草醛盐酸法可以用于测定落叶松树皮的花青素含量,盐酸甲醇法则用于测定油菜的种皮[4-5]。这3种方法的原理基本相同,都是将花青素抽提出来成为溶液,然后用分光光度计测量溶液的吸收光谱,计算其中的花青素浓度。pH示差法是根据花色苷在不同的pH值条件下的形态不同,显示的颜色各异来确定花青素的浓度,其测定的稳定性和准确性更好[5-6]。随着实验技术的进步,高效液相色谱法也用于花青素的含量测定。该方法操作简便,可以实现对花青素的精准定量测定,但需要标准浓度的样品和较昂贵的仪器,限制了它的应用范围[7]。
常规的方法都需要用植物组织样品提取溶液,然后通过分析吸光度值或色谱来测定花青素的含量。这些方法对仪器设备有一定的要求,不能满足实时、快速和无损伤的要求,测定消耗的物质和人力成本也较高;部分方法难以达到很高的精确度,只能进行定性检测。计算机视觉是一种新兴的分析技术,其概念在20世纪60年代初被提出来,在80年代取得了长足的发展。计算机视觉的核心内容包括图像的理解和图像的分析,现在已经被广泛地应用到社会发展的各个领域。计算机视觉在农业上可以用于果实的采摘、分级检测、田间杂草定位识别和农业机械路径识别等,代表了现代精准农业的研究和发展方向。
目前,利用计算机视觉测定作物各种色素含量的技术方法已经成熟,其在叶绿素含量测定中的报道最多[8-11]。这一方法的基本过程是采集目标图像后提取颜色特征参数,然后与对应的叶绿素含量做相关性分析,选择拟合程度最高的特征参数建立回归方程并检验其准确度。这一方法在辣椒红色素的含量测定中也有应用,但是用于测定植物花青素含量的报道目前还很少[12]。借鉴这些研究,本文利用计算机视觉和统计分析软件,对番茄成熟果实的各种颜色特征和花青素含量之间的相关性进行分析,选择合适的参数建立计算模型,从而实现对花青素含量的快速无损测定。
1 材料与方法
1.1 番茄果实图像采集
测定的番茄样品为从大棚中采集的中杂101品种的成熟果实,个体质量在200~300g之间,形状近圆形,颜色为粉红色。该品种的果实表皮含有低水平的花青素。
图像采集系统的硬件包括数码相机、暗箱和计算机。计算机软件为WindowsXP操作系统、MatLab图像处理工具及SPSS16.0统计分析软件。数码相机为与计算机连接的Nikon DL24-500型,关闭闪光灯,安装在暗箱的顶部,距离番茄果实20cm。暗箱的内壁黑色,顶部两端分别安装2盏15W的白光灯,底部平台用于放置被拍摄物体,如图1所示。选取50个正常的番茄分别编号后进行拍摄,形成JPEG格式的图片传入计算机。
1.2 花青素含量的常规测定
采集完图像的番茄立即取样测定花青素含量,具体方法为撕下表皮,称取约0.1g后剪碎;将表皮碎片放入离心管中,加入5mL的0.1M的HCl,然后在32℃的恒温箱中静置5h后过滤。滤液用苏州岛津UV-2450/2550型紫外可见分光光度计读取530nm波长和1cm光径下的吸光度值,并用0.1M的HCl作为空白对照;最后,按照文献介绍的方法计算花青素的浓度[13]。
1.3 图像预处理
采集的图像质量受各种因素影响,可能会出现噪音、毛刺和孤立点等问题,不利于对目标区域的分割和特征提取。因此,需要对图像进行预处理,包括灰度化和图像分割。原始图片中的番茄是粉红色,背景主要为黑色,夹杂少量白色的斑点,利用二者之间颜色的差异将番茄从背景中分离出来。彩色图像的分割首先要进行灰度化,然后根据颜色进行阈值分割。选择合适的阈值对于图像处理分割的效果有着决定性影响,它是通过分析直方图获得的。本文中番茄的特征受光照影响不大,因此为了确定阈值,将灰度图做了最大类间方差分析后再进行图像二值化;直方图得到各形状特征的阈值,然后通过最大阈值分割图像。图像的预处理如图2所示。
1.4 颜色空间的应用
彩色图像的颜色空间有多种,如RGB、HIS、CMY和YIQ等,本文根据所采集的图像特点和研究目的,选择RGB颜色空间用于模型建立。RGB模型中的R、G和B分别代表图像中的红、绿和蓝3种颜色的亮度值,通过改变这3者的数量,可以混合成其它的各种颜色。但是,RGB颜色特征值受到光照强度影响较大。针对这一问题,通常采用变换的r、g、b值来消除光照差异的影响。这3个参数是以R、G和B为3基色的数量,对其做归一化了的数值。具体的计算公式为:r=R/(R+G+B),g=G/(R+G+B),b=B/(R+G+B),因此r+g+b=1。它们对光照强度的变化不敏感,能够消除光线差异引起的误差。另外,还采用了一些上述6个参数之间的简单算术组合作为颜色特征参数,来与花青素含量之间进行相关性检验。
1.5 模型的构建和检验
从50个番茄中随机选取30个样品的图片和数据作为建模集,用于构建模型;剩余的20个样品的图片和数据作为检验集,用于检验模型的准确度。在WindowsXP操作环境中,利用MatLab图像处理工具提取建模集样品的图像特征,分析上述颜色特征参数与花青素含量之间的相关性,选取拟合程度最高的特征参数建立花青素含量的回归计算模型。最后,分析检验集样品的图像,计算花青素含量,对照常规方法所测的花青素含量值,依据置信区间对模型进行检验。
2 结果与分析
2.1 颜色特征参数与花青素含量间的相关性分析
利用图像处理工具和统计分析,对R、G、B及其经过形式变换所得的总共18个颜色特征参数进行了与花青素实际含量之间的相关性分析,发现与花青素含量之间存在显著或极显著相关性的参数分别有6个和7个。其中,R及其作为分母的参数与花青素含量之间呈正相关;G及其作为分母的参数与花青素含量之间呈负相关,显著性的程度各异;B及其相关参数与花青素含量之间的相关程度相对较低。R、G、B这3个基本参数的相关系数绝对值在0.304~0.436之间,由其变换得到的部分参数的相关系数绝对值更高,有的接近或超过0.5,表现出更好的拟合性。
颜色特征参数与花青素含量之间的相关性数据,如表1所示。
2.2 花青素含量测定模型
根据表1的结果,选择R、r、r-g、R-G、R/G和R/(G+B)这6个相关系数较大的代表性特征参数用于建立测定模型,利用统计分析软件拟合了这些特征参数与花青素含量之间的回归方程、决定系数和均方根误差,回归方程的拟合程度通过决定系数和均方根误差来评价。结果表明:以r和R/(G+B)为特征参数建立的回归方程的拟合度较好。
表1 颜色特征参数与花青素含量之间的相关性Table 1 The correlation between color characteristic and anthocyanin content
*, **表示检验在P<0.05和P<0.01水平上具有显著性。
颜色特征参数与花青素含量之间的回归模型数据如表2所示。
表2 颜色特征参数与花青素含量之间的回归模型Table 2 The regression models between color characteristic and anthocyanin content
*, **表示检验在P<0.05和P<0.01水平上具有显著性。
2.3 模型的检验
用表2中的6个回归方程分别处理检验集中的20个样品的图像,计算花青素含量,并与实际测定值比较分析,依据置信区间检验各模型的精确性。正态分布检验结果表明:6个模型的残差服从正态分布,由此计算出显著水平下的置信区间。从表3中可以看出:以这6个特征参数建立的回归模型都能较好地反映样品的花青素含量,其中r和R/(G+B)这2个参数的模型的错检个数少,误差也更小,说明拟合程度和精确度最高,可以用来预测样品中的花青素含量。
回归模型的精确性检验数据分析如表3所示。
表3 回归模型的精确性检验Table 3 The accuracy test of regression models
3 结论
利用计算机视觉技术对建模集的番茄图像进行分析,从18个颜色特征参数中发现了6个与花青素的实际含量之间存在极显著的相关性。分别以这6个参数为函数,建立了二者之间的一元二次方程的回归模型。通过决定系数和均方根误差评价,发现以r和R/(G+B)为特征参数建立的回归方程的拟合度最好,对检验集花青素含量的预测表现出很高的精确度,可以作为番茄花青素含量快速无损测定的有效方法。
[1] 方忠祥,倪元颖.花青素生理功能研究进展[J].现代食品科技,2001,17(3):60-62.
[2] 瞿海鸥,王玉婷,舒雅娟,等.番茄传家宝资源核心种质构建及评价[J].上海交通大学学报:农业科学版,2015, 33(6):1-11.
[3] 赵岑,吕立堂,赵德刚.花青素调节基因VlmybA2对番茄遗传转化[J].基因组学与应用生物学,2012, 31(3):270-275.
[4] 杨磊,苏文强,汪振洋,等.落叶松树皮提取物中低聚原花青素含量测定方法的研究[J].林产化学与工业,2004,24(1):111-114.
[5] 林蓓蓓,梁颖.甘蓝型油菜种皮花青素相对含量测定方法研究[J].中国农学通报,2007, 23(4):173-175.
[6] 王少波,杜永峰,姚秉华.pH示差法测定黑豆皮中的花青素[J].化学分析计量,2008, 17(1):46-49.
[7] 毛建菲,周虹,雷绍荣,等.高效液相色谱法测定紫甘薯花青素含量[J].西南农业学报,2012, 25(1):123-127.
[8] 刘静波,赵红霞.基于计算机视觉技术的叶绿素含量测定[J].食品工业科技,2003(s1):62-66.
[9] 柴阿丽,李宝聚,网倩,等.基于计算机视觉技术的番茄叶片叶绿素含量的测定[J].园艺学报,2009, 36(1):45-52.
[10] 费丽君,谭峰.机器视觉技术在大豆叶片叶绿素含量测算上的应用[J].农机化研究,2010, 32(3):199-201.
[11] 易时来,邓烈,何绍兰,等.锦橙叶片叶绿素含量诊断模型—基于数字图像分析技术[J].农机化研究,2011, 33(4):110-115.
[12] 张甫生,庞杰,王雅立.计算机视觉技术在辣椒红色素测定中的应用[J].辣椒杂志,2005(4):41-42.
[13] Fuleki T, Francis FJ. Quantitative methods for anthocyanins 1 extracfion and determination of total anthocyanin in cranberries[J].Joumal of food science, 1968, 33(3): 72-77.