花生种皮颜色智能识别模型的建立与应用
2022-05-13朱树良赵昆昆高古腔屈成鑫马莹莹任锐巩方平李忠峰马兴立张幸果殷冬梅
朱树良,赵昆昆,高古腔,屈成鑫,马莹莹,任锐,巩方平,李忠峰,马兴立,张幸果,殷冬梅
(河南农业大学农学院,河南 郑州, 450002)
花生(Arachis hypogaeaL.)是我国重要的油料作物,为人民提供丰富的植物油和蛋白质。近年来随着人民生活水平的不断提高以及消费的多元化发展,人民对健康的需求日益提升,花生的保健功能也逐渐成为研究的热点。花生衣,即花生种皮,所含的单宁酸、白藜芦醇、原花色素等成分在抗癌症[1]、软化血管、抗氧化减缓衰老[2]、防止血小板减少[3]等方面有广泛的应用,同时也应用在护肤品领域。
花生衣有黑色、紫红色、粉色、白色等多种颜色,通常情况下深颜色的种衣比浅色种衣具有更高的药理和营养价值。研究表明花青素是影响花生种皮颜色深浅的主要因素[4],花青素含量越高,种皮颜色越深,反之则越浅。花青素作为一种具有较高营养价值的物质广泛存在于各种植物中,与花生籽仁的营养价值直接相关。水稻花青素含量与其营养效应呈正相关,颜色较深的紫色米营养价值最高[5~7]。洪美艳等[8]研究表明,黑籽油菜与黄籽油菜相比普遍具有较高含油量和较高蛋白含量等优势。
花生的种皮颜色是花生重要的外观和品质性状。Zhao 等[9]确认MYB 和EBG 通过转录调控黄酮类合成途径,使粉红色色素沉着在花生籽粒表皮层中;Wang 等[10]使用QTL-seq 方法将控制种皮颜色的基因定位在A10 染色体的4.7 Mb 区域内,并最终定位到一个与种皮颜色相关的基因AhTCI;Wan[11]等研究表明,激素合成和信号传导以及MBW 复合物(MYB、bHLH 和WDR)调节的黄酮合酶和二氢黄酮醇4-还原酶之间的竞争是调节白色种皮表型的关键分子控制节点。
随着图像扫描技术水平的不断提高和智能云计算技术的迅速普及,颜色识别被广泛用于各行各业之中,在农业领域也已经有大量的运用。如对作物病斑分割[12]和识别,草莓、花椒和番茄等作物的采摘作业[13,14]、无人机水稻识别[15]。农业颜色识别系统中主要采用RGB 颜色空间(Red,Green,Blue color mode)和HSV 颜色空间,其中HSV 的参数分别为色相(Hue)、饱和度(Saturation)、明度(Value)[16];RGB的参数分别为红色(Red)、绿色(Green)、蓝色(Blue)。不同于RGB 的颜色空间,HSV 颜色空间中各个参数间有较强的独立性,因此对复杂性高和相似性高的颜色识别更为准确。
目前对花生种皮颜色的鉴定通常是肉眼观察主观判定,尤其是对不同种皮颜色群体后代的中间色很难界定。因此需要建立一种简便、快捷的种皮颜色鉴定和分级标准。本实验利用阿里云智能云计算中的颜色识别平台,结合HSV 颜色空间对花生种皮颜色进行量化,从而快速、准确地对花生群体后代种皮颜色进行分级鉴定,为花生种皮颜色分子遗传研究奠定基础。
1 材料与方法
1.1 材料
1.1.1 花生材料 选取不同种皮颜色的花生品种(图1):农大黑7572(黑色种皮)、Hua8106(紫色种皮)、ZP06(紫色种皮)、H7500(粉色种皮)、农大花103(粉色种皮)、白沙1016(粉色种皮)、农大白7626(白色种皮)、开白2号(白色种皮)。
图1 不同花生种皮颜色总览Fig.1 Overview of different peanut coat colors
RIL 群体:以紫色种皮花生品种ZP06 作为父本和粉色种皮花生品种H7500 进行杂交,采用单粒传法经过六代自交后获得的159个RIL家系群体。
1.1.2 花青素提取液 99%甲醇+1%浓盐酸,甲醇与浓盐酸体积比为99:1,即配制1 L的提取液需要向990 mL甲醇加入10 mL的浓盐酸。
1.1.3 主要仪器设备 紫外分光光度计(UV-3200PC)、尼康3100D相机。
1.2 方法
1.2.1 花生种皮拍照和处理 分别随机挑选5 粒花生种子,在相同的光照条件下用尼康3100D 拍摄3 张图片,利用Adobe Photoshop 2020 处理图片,最终保存为PNG 格式。
1.2.2 花生种皮花青素提取 依据其它植物材料花青素的提取方法[17~21]并结合花生种皮特性进行改良如下:随机选取待测花生,将花生种皮取下并称量100 mg 备用,用液氮将花生种皮研磨成粉末,将10 mL提取液与100 mg种皮粉末混合充分后30℃静置90 min,12 000 r/min 离心2 min,吸取上清,用紫外分光光度计分别测定溶液在530 nm 和657 nm 下的吸光度值。利用吸光度值计算花青素相对含量(i),计算公式:
公式中FW为种皮称取的重量(g);A530为花青素的特异吸收峰值;V为提取液总体积(mL);n为待测液稀释倍数;ε为花青素的摩尔消光系数(26.9 mL/(mol·cm));M为花青素的 相 对分子质量,449.2;b为比色皿厚度(cm)。
1.2.3 AI 智能种皮颜色识别系统构建 将拍摄处理后的图片上传至阿里视觉智能开放平台中的颜色识别目录下(aliyun. com),色板输出数量选取8个,发起调用后记录识别结果(包括Percentage、Color等参数),计算花生种皮颜色指数(p),计算公式:
公式中H、S、V均为HSV 颜色模型中的参数;p为不同颜色所占百分数;MAX(H-15,0)为Excel中的函数,表示H经过修正后最小值大于0。
1.2.4 数据分析 采用Microsoft Excel 2019 进行数据统计分析,利用R_4.0.2绘制部分图表,文中所有数据均有三次重复,采用SPSS 22.0 软件进行统计分析以及显著性检验,Adobe illustrator 和Graph-Pad Prism 8绘图。
2 结果与分析
2.1 不同种皮颜色花生花青素含量分析
由表1 可得不同颜色的种皮花青素含量为:黑色种皮>紫色种皮>粉色种皮>白色种皮。农大黑7572 花青素含量最高,为5.4545 mg/g,且与其他的花生均存在显著性差异。白色种皮的花生(开白2号和农大白7626)花青素含量最低,分别为0.0145和0.0148 mg/g。紫色种皮花生(Hua8106 和ZP06)的花青素含量比粉色种皮花生高,并且达到显著性差异。
表1 不同种皮颜色花生花青素含量Table 1 Anthocyanin content of peanut with different seed coat colors/(mg/g)
根据种皮花青素提取液的颜色(图2A),可以将花生分为四个组别,即黑(农大黑7572)、紫(Hua8106、ZP06)、粉(白 沙1016、农 大 花103、H7500)、白(开白2 号和农大白7626)。另外,对相邻界限的材料进行比较(图2B),发现农大黑7527和Hua8106、ZP06与H7500、白沙1016与开白2号的花青素含量都存在显著性差异;较为有趣的是粉色的H7500 的花青素含量显著高于白沙1016 和农大花103,白沙1016与农大花103没有显著性差异。
图2 不同种皮颜色花生花青素含量分析Fig.2 Analysis of anthocyanin content in peanut with different seed coat
2.2 不同品种花生种皮颜色智能识别结果分析
根据阿里视觉智能开放平台的识别结果绘制的色彩结构图与肉眼观察到的对应样品拍照的种皮颜色相同。由图3 可知,农大黑7572 种皮颜色指数最高为0.703,其颜色主要为十六进制颜色中的“#462F29(black)”、“#3C2A26(deep brown)”、“#4F362F(maroon)”。农大白7626 种皮颜色指数最低为0.147,颜色主要为“#CEC8B5(lovry)”、“#D8D3C1(pale godenrod)”、“#C6BEA9(tan)”。根据种皮颜色结构和直方图(图3),将8个花生品种分为四个组别,即黑(农大黑7572)、紫(Hua 8106、ZP06)、粉(白沙1016、农大花103、H7500)、白(农大白7626、开白2号)。根据四个阶梯分布情况,将种皮颜色指数分为四个组别范围,即黑色(≧0.6000±0.0238)、紫色(0.6000±0.0238~0.4000±0.0238)、粉 色(0.4000±0.0238~0.2000±0.0238) 、白 色( ≦ 0.2000±0.0238)。
图3 花生种皮颜色指数分析Fig.3 Analysis of peanut seed coat color index
2.3 花青素相对含量与种皮颜色指数的相关性分析
为明确花生种皮颜色指数(p)和花青素相对含量(i)的关系,对两组数据进行了对比。将花生种皮颜色指数设为横坐标,花生种皮花青素相对含量设为纵坐标绘制散点图并计算拟合曲线。结果显示,p 与i 呈现出正相关趋势,同时观察到开白2 号与农大白7626 的散点位置几乎重合,白沙1016 与农大花103 的散点位置几乎重合,表明花青素含量和种皮颜色指数两组种皮颜色高度重合。H7500散点位置位于ZP06 与农大花103 之间,再次印证了H7500的种皮颜色是粉色种皮中颜色较深的(图4A)。
利用R 语言中的ComplexHeatmap 包对不同花生种皮颜色进行聚类分析。无论是花青素相对含量还是种皮颜色指数的聚类分析结果均分为四个组别(图4B)。在花生种皮颜色指数聚类分析中农大黑7572 为深灰(>grey 75%),Hua8106 和ZP06 为中灰(grey 75%~grey 50%),H7500、农大花103 和白沙1016 为灰(grey 50%~grey 25%),开白2 号和农大白为浅灰(<grey 25%),这与花青素含量聚类分析结果相同。
图4 花生种皮花青素相对含量与种皮颜色指数的相关性分析Fig.4 Correlation analysis between anthocyanin content and seed coat color index of peanut
2.4 AI智能种皮颜色识别系统鉴定RIL群体
利用AI 智能种皮颜色识别系统对RIL 群体的种皮颜色进行鉴定(图5)。为模拟种皮鉴定应用场景,将159个家系(编号:RIL600-759)图片分为四个组别,即深紫(组1)、紫(组2)、深粉(组3)、粉(组4)。RIL 群体的父本为紫色种皮花生ZP06,母本为粉色种皮花生H7500,因此159 个家系种皮颜色范围均在紫色和粉色区间内,即0.6±0.0238~0.2±0.0238。从四个组别中选取了14 个家系,即组1:638、698、712,组2:624、635、749、752,组3:611、631、722、646,组4:629、670、623。对这14个家系的种皮颜色指数进行聚类分析,结果分为五组,第1组638、698、712,第2 组635、749、752,第3 组631、646、722,第4 组611、624、629,第5 组623、670。根据分组结果可知,种皮颜色指数鉴定结果中极端的种皮颜色与肉眼分类结果重合,而位于种皮颜色过渡区域的样品鉴定差别很大,种皮颜色指数在种皮颜色过渡区域的鉴定更加准确客观。
图5 AI智能种皮颜色识别模型鉴定花生RIL群体Fig.5 AI intelligent seed coat color recognition system identifies peanut RIL population
3 讨论与结论
3.1 种皮颜色指数科学性验证
将p与i数据进行对比和相关性分析,结果表明两组数据呈线性正相关,相关系数为0.9325,同时折线图走势以及聚类分析结果高度相似,这说明根据花生种皮颜色指数可以准确地反映花生种皮中花青素含量。改良minmax-trim 方法[22]对种皮颜色指数数值标准化,结果相较于花青素含量的数值标准来说,种皮颜色指数有准确的上界和下届(0~1),范围界限间的差值均匀且显著。对花生种皮HSV颜色空间进行了标准化运算,经过大量计算最终确定了S值和V 值比例为1:200,发现V 值是影响花生种皮颜色深浅的主要因素。同时参照前人对HSV颜色空间中的误差处理[23],认定S 值为次要因素,因此需要考虑S 值对种皮颜色指数产生的误差影响,通过计算得出修正值为0.0238。
传统分类时的颜色边界十分模糊,中间颜色鉴别困难。为建立颜色识别系统下的种皮颜色分类机制,种皮颜色分类时,选取具有代表性的黑色、紫色、粉色和白色的花生作为实验材料,结合花青素含量数据和种皮颜色指数直方图,将样品分为黑色(≧0.6000±0.0238)、紫色(0.6000±0.0238~0.4000±0.0238)、粉色(0.4000±0.0238~0.2000±0.0238)和白色(≦0.2000±0.0238)四类。这一分组结论与p和i 的相关性分析中散点坐标位置的分布重合。在实践过程中种皮颜色指数的上界很难达到1,因此将上界调整为0.8。
3.2 AI智能种皮颜色识别系统特点及应用
花生种皮颜色的鉴定标准并不统一,运用不同鉴定标准得出的结论也不尽相同,开发一种兼容性强、数值准确的鉴定模型十分重要[24]。目前主流的种皮颜色鉴定方法有两种,一种是对种皮花青素含量标准化,如HPLC 法检测花青素、直提花青素法等,这类方法得到的数据精密度高[25],但操作复杂、价格昂贵,且测量时间过长。Wan 等[26]研究发现黑色素含量上升能够造成花生种皮色素沉着,因此除花青素外的其他色素物质也能够影响种皮颜色深浅,该方法对种皮颜色的鉴定可能存在误判。另一种方法是对花生扫描或拍摄图片进行色彩分析,这类方法快速、操作简单、经济[27]。差异主要存在于对颜色空间的运用,如RGB 三原色模型、HSV 颜色空间、CMYK颜色空间等,其中不同的颜色空间的适用范围不同。根据不同需求选取不同特点的颜色空间,如在种皮颜色鉴定过程中,对深浅这一纵深的准确描述十分重要,HSV 颜色空间中各个参数间相对独立,V 对花生种皮颜色深浅描述准确,但RGB颜色空间中对深浅的范围边界模糊,无法对像素点直接量化[28]。因此HSV 颜色空间更适合作为种皮颜色鉴定的量化指标。
本实验中,采用不同种皮颜色的花生制定种皮颜色判断标准,其中包含了典型黑色种皮花生农大黑7527,白色种皮花生农大白7626 等,对比了经典花青素含量测定和AI智能种皮颜色识别两种方法,验证了AI智能识别花生种皮颜色方法的可行性,以及划分了四个种皮颜色范围,并利用该方法鉴定了RIL 群体种皮颜色,建立了花生种皮颜色指数标准模型,为今后花生种皮颜色的遗传研究提供参考。