基于图像处理技术的枸杞子商品规格等级评价方法研究*
2020-11-25张久旭翟小林裴纹萱王晶娟
王 丹,张久旭,范 晶,翟小林,董 玲,裴纹萱,王晶娟**
(1. 北京中医药大学中药学院 北京 102488;2. 北京中医药大学生命科学学院 北京102488)
枸杞子为茄科植物宁夏枸杞(Lycium barbarumL.)的干燥成熟果实[1]。枸杞子作为国家卫生部公布的药食同源的品种之一,在《神农本草经》中便已被列为上品,可“久服坚筋骨,轻身不老”[2]。目前,枸杞子主产于宁夏、内蒙古、甘肃、新疆等地[3],但以宁夏产者质量最佳,故称之为“道地药材”。枸杞子中含有多种活性物质,如黄酮类、多酚类、枸杞多糖、不饱和脂肪酸和萜类等[4],具良好的滋补功效。目前枸杞子产区主要分布于内蒙古、宁夏、甘肃、新疆等地,且现存使用量最多的为宁夏枸杞[5],已被成功列入药典。
在《七十六种药材商品规格标准》中,以每50 g 含有的枸杞子粒数及含杂率作为枸杞子商品的分级依据,但在商品流通过程中发现,枸杞子并未严格按照该标准进行分级,且在一等品中仍存在大小、色泽分布不均等情况,使得枸杞子商品流通混乱,因此改进枸杞子等级的划分标准势在必行。此外,枸杞子在贮藏过程中易发生虫蛀、霉变、变色[6]、走油[7]等现象,也将进一步影响其商品质量,故应在贮存过程中改进相关条件,如空气、湿度、温度等,以保证枸杞子的质量。除了对枸杞子的等级进行划分之外,枸杞子的规格也应进行一定的划分处理,随着现代图像处理技术以及软件工程的迅速发展,通过图像处理技术对果品进行外形检测和几何特征分析的应用较广,Currie 等[8]利用一种图像分析程序提取卡尺测量苹果的外形轮廓,并用傅里叶描绘子估算出苹果的外形轮廓,进而分析获得不同的苹果形状的形态学指标;Lee 等[9]采用数字反射式近红外成像的方法对红枣图像进行采集,用不同波长的红外线检测其外表面破损程度来实现红枣的分级。在前人研究的基础上,本实验采用Imageproplus 软件以及计算机处理软件等现代化手段,进而建立枸杞子划分规格等级的量化指标,使得枸杞子自动划分规格等级成为可能[10-11]。随着各个领域人工智能技术的引入,目前图像处理技术已列入中药质量评价的范畴,即利用中药不同饮片的颜色值、大小、外在纹理等指标进行计算机系统分析,对中药的外在质量进行综合评价[12]。此外,张小波等[13]将图像识别技术应用于中药资源普查工作中,如卫星遥感图像识别技术,用于估算药用植物野生资源的分布面积,使得测量偏差降低,估算值的准确度提高。
本实验通过选取宁夏、青海、新疆三个枸杞子的主产区,通过扫描与计算机软件技术相结合的方法,测量不同地区枸杞子的重量值、长宽比、RGB 值以及大量试验探究这四个产区的枸杞子在形状上的不同,进一步优化枸杞子商品规格标准。此外,通过引入药剂学中“均匀度”的概念(均匀度:在一定重量范围内,枸杞子大小分布的均一程度,是指在肉眼观察范围内的枸杞子商品颜色、大小基本一致的程度),并结合单粒重量对枸杞子商品进行分级,旨在为进一步实现枸杞子的自动化划分规格等级技术提供试验依据,也为枸杞子资源的合理开发提供参考标准。
1 实验材料
1.1 实验样品
实验选取产于宁夏、青海、新疆三个地区不同批次共90份枸杞子样品,所有样品均由种植基地直接供应,其中宁夏样品共16 批,青海样品4 批,新疆样品4批,经北京中医药大学王晶娟副教授鉴定,所有样品均为茄科植物宁夏枸杞Lycium barbarumL.的干燥成熟果实,照片见图1。本研究所使用样品均为2015 版《中华人民共和国药典》收录的合格产品,其种植、采收、加工、贮藏等环节可根据二维码进行溯源,并且无农残、重金属和二氧化硫等有害物质残留。
1.2 实验仪器
样品扫描仪(EPSON Perfection V19)、标准卡尺、计算机(Window 8系统)。
2 实验方法
2.1 扫描仪器扫描
为保证实验样品的代表性,采用十字交叉法进行取样。将枸杞子置于扫描仪有参照物的白色透明背景板上,参照物选用一个1cm2的黑色纸板(面积一定),每一批次扫描30 粒,获取枸杞照片,即将枸杞子的实物信息转换成了计算机可识别的图像信息。
2.2 枸杞形状特征提取
由于枸杞子的形状多为类椭圆形,所以本实验采用Image-proplus 软件对扫描的枸杞子图片进行处理。首先利用卡尺建立测量标准,再利用测量工具对枸杞图像进行处理,如图2所示,从而得到枸杞子的长宽数据,进而得到宽长比,比值越接近1 的枸杞子,其形状越接近圆形。
2.3 枸杞子面积值提取
本实验通过扫描仪器与Photoshop软件结合,对枸杞子图像进行处理,利用计算机图像处理技术,计算枸杞子成像后的面积,然后用Photoshop软件对彩色枸杞子图像进行图像分割、调节图像对比度、边缘检测、图像形态学处理,并标记得到枸杞的像素个数,如图3所示。
图1 三个产区枸杞子样品图
图2 枸杞子形状特征提取图
由于数字图像均由一个个的像素点组成,因此只需知道每个像素点代表的真实面积,就可以通过枸杞子的像素数求出其真实面积。故枸杞子面积的计算公式如下:
其中,S 代表实物枸杞子的面积,S0代表参照物的实际面积,N1代表枸杞子的像素个数,N0代表参照物的像素个数。故当参照物的实际面积S0已知时,通过图像处理得到枸杞的像素个数,即可求得枸杞子的面积S。本实验中1cm2的像素是14 153.9,通过对多幅枸杞图像(共60 幅,每幅图片30 粒枸杞子)进行图像处理,计算不同产区的枸杞子面积。
2.4 枸杞子颜色值提取
将枸杞子的扫描图片与Photoshop软件进行结合,提取每个枸杞子的R(Red)、G(Green)、B(Blue)值,并进行记录,具体结果见表1。
表1 枸杞颜色值数据表
图3扫描(左)软件处理(右)
2.5 枸杞子重量值提取
分别精确称量不同批次枸杞子100 粒的重量,计算每粒的平均重量以及上下浮动(±5%)的重量范围,并记录原始数据。然后,准确称量单粒枸杞的重量,计数该100 粒范围内合格的枸杞子粒数,并计算合格粒数占枸杞子总数的百分比,从而得到枸杞子的均匀度(若在在该范围内合格的枸杞子粒数小于80 粒,即均匀度低于80%)。
3 实验结果
3.1 枸杞子果实形状分析
由图4可以看出,通过处理宽长比数据可将三个产区的枸杞子区分开来。宁夏、青海、新疆三个产区的枸杞子宽长比范围分别是0.55-0.65,0.40-0.50,0.65-0.80。数据处理显示,青海、宁夏、新疆三个地区枸杞子的宽长比差异具有统计学意义(P<0.05)。各组间结果进行比较,差异均有统计学意义(P均<0.05),具体情况见表2,图4。
3.2 枸杞子颜色值分析
根据枸杞外表颜色的RGB 值(R 值)可将新疆枸杞与宁夏、青海枸杞区分开,但不可将宁夏枸杞与青海枸杞区分开;并且新疆枸杞的R 值偏小,外表颜色多为暗红色,而宁夏枸杞、青海枸杞的R 值偏大,外表颜色多为红色或深红色,具体结果见图5。
通过聚类分析可知,三个产区的枸杞子样品总数为90,其中36、58、59为一类;样品2、14、32、37、46、51、53、61、63、64、65、66、67、68、69、70、71、72、73、74、75、77、78、79、80、81、82、85、88、89、90 为一类;其余样品归为一类。
与原始数据对比发现,样品36、58、59 号R 值异常大,故将这三个样品剔除。其余样品作为实验样品,可分为两类,其中一类共31 个样品(其中24 个样品来源于新疆,约占80%;其余样品来源与青海和宁夏);另一类共56 个样品(其中6 个来源于新疆,剩余样品均来源于宁夏和青海,占90%)。
3.3 枸杞子重量值分析
综合分析枸杞子的重量值和均匀度的不同,对不同产区的枸杞子商品等级进行划分,结果显示,本实验样品总共划分为三个等级,其中一等品重量值范围为0.22-0.24 g,二等品重量值范围为0.18-0.20,三等品重量值范围为0.14-0.16。
3.4 枸杞子面积值分析
通过SPSS24.0 数据处理软件对宁夏、青海、新疆三个地区的枸杞子面积值进行聚类分析,将普系图中的序列号与实际面积值对应,取其最大值与最小值,进一步得出枸杞子的面积值范围,从而划分枸杞子商品的等级。数据处理结果显示,一等枸杞子的面积值为1.27-1.69、二等枸杞子的面积值为0.79-1.26、三等枸杞子的面积值范围为0.25-0.74,具体结果见图6。
图4 不同地区枸杞子统计结果
通过聚类分析树可知,实验所用的枸杞子样品总数为90,根据SPSS 聚类结果可分为三类:其中907、1 258、906、874、809、1 214、1 239、584、793、1 217、470、923、1 315、1 290、899、567、1 155、893、437、844、544、1 107、350、807、456、600、890、1 181、465、781、709、1 206、698、1 115、796、1 065 为一类;1 016、965、280、970、376、614、976、186、482、499、184、935、31、29、1 138、864、530、672、1 111、419、670、831、343、759、73、304、1 008、321、1 130、859、1 070、440、252、769、244 归为一类;94、390、143、196、502、508、742、966、16、951、129、109、125、150 归为一类(其余结果与原始数据对比差异值较大,故选择剔除)。
4 实验结论
结合本实验对枸杞子商品的指标值,包括宽长比、面积值、RGB 值、重量值等指标研究,可初步划分不同地区枸杞子商品的规格等级。依据宁夏、青海、新疆三地枸杞子的宽长比和RGB 值不同,可将枸杞划分为宁夏枸杞、青海枸杞、新疆枸杞3 种规格;依据枸杞子的面积值和重量值不同,可初步将枸杞子划分为一、二、三3 个等级,初步划分的枸杞子商品规格等级情况见表4。
图5 不同地区枸杞R、G、B值聚类分析
图6 三个地区枸杞子面积值聚类分析图
表4 枸杞子商品规格等级标准草案
5 讨论
目前,枸杞子的挑选分级方式为采摘,晾晒,在干燥后用机械方法脱除果柄,然后手工除去油粒、黑粒、破粒、霉头和不合规格的小粒枸杞子,去除杂质后进行分级包装。此外,目前枸杞子的外观检测方法大多采用原始的人工分级方法,该方法的主要缺点为主观因素较大、效率低、漏检率高[16],且人工分级方法耗时耗力,消耗资源较大,人力物力均需配合使用,且主观因素在枸杞子的评价方法中占主要比例,但易使得优质枸杞子与劣质枸杞子混淆流入市场,加重市场的枸杞子商品规格等级的混乱。虽从传统的“眼观”方法也可判定枸杞子的规格,其中宁夏枸杞为椭圆形、青海枸杞为长椭圆形、新疆枸杞为近圆形,有经验者亦可判别,但通过量化中药材规格等级划分的形性指标,并结合枸杞子的指标成分和药理作用进行相关性分析,在很大程度上可对传统的“辩状论质”[17]经验赋予新的内涵,完善“辩状论质”的评价指标。
随着科学技术的发展,传统的经验鉴别方法已经无法满足现代化生产的需求,各大产业均需要用一些简单的指标来简化药材商品的质量、规格等级划分。此外,按照中药全程质量控制要求,在枸杞子的等级划分标准中,对于无法进行质量追溯或农残、重金属和二氧化硫等物质有残留但低于《药典》要求的产品,均被划分为等外品,即统货。另外,本实验主要集中对不同地区枸杞子的颜色值、重量值、宽长比和面积值进行分析,以期对宁夏、新疆、甘肃的枸杞子进行等级划分,这是对于枸杞子外观性状的评价划分;蔡广知等[18]对甘草的形状并结合成分进行分析,研究药材性状和成分间的相关性,并结合图像处理技术和含量测定方法,最终建立甘草的等级评价体系。以此推之,在本实验的后期也应将枸杞子的形态学指标与内在成分含量进行结合比对分析,完善枸杞子评价参数,建立枸杞子商品规格等级评价体系。
在传统经验鉴别的基础上,本实验采用宽长比、RGB 值、图像处理软件等现代处理方法与技术,实现了对枸杞子规格与等级的快速划分,使枸杞子的规格等级划分有了量化指标。另外,本实验所用的枸杞子样品均从原产地采摘,在源头上杜绝了来自市场售卖枸杞子的混乱情况,进一步增加了本次实验可信度。在本实验中,利用RGB 值的不同可区分宁夏、青海枸杞与新疆枸杞,但不可将青海与宁夏枸杞区分开来,这很大程度上是由于宁夏与青海两地距离较近,生产环境相似,且两地的枸杞子种苗多一致,均为宁杞7号,故所得R值相近,不易区分两地所产的枸杞子商品;其次,借助枸杞子面积值的不同,可在枸杞子规格划分的基础上进一步划分等级,以减轻市场流通的混乱性。这些实验方法简单易行,不仅提高了检测效率,也在一定程度上避免了因人工测量时的主观因素干扰而导致测量结果的不可靠、精确度不高和精密度不准确,从而使得试验结果更加准确可靠,在后期对枸杞子进行形态指标和成分结合测定时提供前期研究基础,减少前期研究周期。若可以将图像处理技术应用到更多传统中药材及中药饮片中,可实现多种中药材的规格等级划分,从而减轻市场流通商品的混乱,为传统中药材的规格等级划分提供量化指标和参考依据。