人工神经网络在橄榄蛏蚌性别鉴定中的应用
2021-07-15马学艳孙光兴徐东坡1闻海波1吕国华跑1顾若波1
金 武,马学艳,孙光兴,徐东坡1,,,王 林,闻海波1,,,吕国华,徐 跑1,,,华 丹,顾若波1,,
(1.中国水产科学研究院淡水渔业研究中心,农业部淡水鱼类遗传育种与养殖生物学重点开放实验室,江苏无锡 214081;2.南京农业大学,无锡渔业学院,江苏无锡 214081;3.中国水产科学研究院淡水渔业研究中心,中美淡水贝类种质资源保护及利用国际联合实验室,江苏无锡214081;4.阜阳市水产管理局,安徽阜阳 236001)
橄榄蛏蚌(Solenaiaoleivora)隶属于瓣鳃纲(Lamellibranchia)蚌目(Unionoida)蚌科(Unionoidae),主要分布于鄱阳湖、巢湖、太湖等水域[1],是我国特有的蚌种,也是湖北天门、安徽阜阳、浙江德清等地十分著名的高档河鲜。橄榄蛏蚌的人工繁殖和生物学研究[2-4]的基础是雌雄性别鉴定,其鉴定方法与三角帆蚌(Hyriopsiscumingii)[5]、短褶茅蚌(Lanceolariaglayana)[6]、紫黑翼蚌(Potamilusalatus)[7]等类似,通常采用鳃丝观察或性腺组织涂片镜检的方法确认性别。
对麦穗鱼(Pseudorasboraparva)和淡水小龙虾(Astacusleptodactylus)的种群结构研究表明,人工神经网络比传统的von Bertalanffy方程具有更高的准确性[8,9]。利用人工神经网络对鱼类生境和空间分布[10]、特种水域的鱼类识别[11]、野生鱼与养殖鱼的区分[12]也取得了较好效果。对斑马鱼采用卷积神经网络进行性别判断准确度近99%[13],但在贝类中开展性别判断的研究仍较少。本研究通过引入人工神经网络辅助鉴别橄榄蛏蚌的性别,先初步筛选出雌雄两个组别的个体,再在两个组别中验证个体性别,以期降低性腺组织涂片镜检的工作量,为橄榄蛏蚌规模化繁育提供技术支撑。
1 材料与方法
1.1 性状测定
样品采集自淮河阜阳段橄榄蛏蚌国家级水产种质资源保护区。将蚌洗净晾干外壳水分后,用电子天平称量个体体质量(BW),数据精确到0.01 g。用游标卡尺测量壳长(SL)、壳高(SH)、壳宽(SW),数据精确到0.01 cm。
1.2 数据归一化
为了避免形态学数据单位cm和体质量单位g的不一致增加人工神经网络建模的难度和不必要的结果,对SL、SH、SW、BW 4个性状的测得数据进行最大值-最小值归一化处理。最大值-最小值归一化处理的公式为[14]:
其中xscaled为归一化后的数据,xmin和xmax为每一个性状测得值的最小值和最大值。
1.3 人工神经网络建模
本研究中训练集从原始数据(221个样本)中随机抽取90%(199个样本),测试集为剩余22个样本。建模中采用SL、SH、SW、BW 4个性状进行建模。由于neuralnet包不能直接处理分类变量,因此性别变量GENDER通过model.matrix()函数创建GENDERFEMALE、GENDERMALE这2个哑元变量用于后续分析。
本研究中人工神经网络建模采用R统计软件[15]和neuralnetwork包(https://CRAN.R-project.org/package=neuralnet)进行分析。人工神经网络的准确度(Accuracy,ACC)计算公式为:
其中TP、TN、FP、FN分别为真阳性、真阴性、假阳性和假阴性,该值越接近于1,说明人工神经网络建模表现越好。
2 结果
2.1 描述性统计
两种性别的橄榄蛏蚌的描述性统计结果如表1。雌、雄橄榄蛏蚌的4个性状表现出明显差异。如图1所示,这4个性状的分布接近于正态分布。
表1 两种性别的橄榄蛏蚌4个性状的描述性统计结果
图1 橄榄蛏蚌雌雄个体4个性状的分布图
2.2 神经网络训练结果
如图2所示,通过构建一个隐含层4个神经元的神经网络,能够较好地模拟橄榄蛏蚌两种性别的数据,准确度为0.68。SH、SW和BW这3个性状的广义权重的散点图(图3)显示这3个性状与性别的关系较弱,只有SL和性别表现出一定的非线性影响关系。
图2 神经网络结构图
图3 广义权重的散点图
2.3 神经网络准确度分析
根据神经网络准确度的计算公式,0.68达到预期目标,可以尝试用于橄榄蛏蚌的性别预测,减轻显微镜镜检的工作量。
3 讨论
3.1 分类性状的人工神经网络建模
随着计算成本和存储成本的降低,计算机能从大量训练样本中直接学习基于统计规律的人工神经网络并用于未知事件的预测,这在图像识别[16]、文本分类[17]、语音识别[18]等领域取得了广泛进展。人工神经网络与传统模型相比,它能够在人们对所模拟的生物和生态过程认识不足而且有较多不确定性的条件下,并能把数量和质量数据的信息融入模型中进行处理,因此具有显著的优越性[19]。但是,在训练样本和测试样本量都不够时,可能有与训练数据过度吻合的现象。因此,对于这种情况下神经网络的分析结果应谨慎并进行验证[20]。人工神经网络模型的模拟精度要远远高于多元线性方程,类似于非线性方程,但不可能与机理模型相比,它可以作为机理模型的重要补充[8]。
表2 神经网络准确度分析
3.2 贝类性别鉴定
对淡水贝类性别鉴定的方法主要有显微镜镜检性腺[21]、观察腮丝间隔宽度[5]、观察触角[22]等方式鉴别。多数淡水贝类的性别比例为1∶1,因此,在规模化筛选用于繁育的亲本时,可以通过“两步走”的方式来达到雌雄性别鉴定目的。首先测量形态学参数并根据人工神经网络性别预测的结果将原群体初步划分为雌雄两组,缩小直接进行人工鉴别橄榄蛏蚌性别的范围,然后再在分好的雌雄两个组别内进行人工辅助验证性别预测结果并贴好不同颜色的贝类标签。
海水双壳贝类雌雄间性状无明显差异、尚未见有性染色体的报道及性别决定因子或性别决定机制仍不完全清楚,因此对双壳贝类进行遗传改良多借助分子生物学进行辅助育种。虾夷扇贝因其养殖群体中一定比例的雌雄同体在性别决定和分化机制研究中的价值而备受关注[23]。淡水经济双壳贝类三角帆蚌不同性别对育珠性能也具有重要影响[5],且三角帆蚌自然群体的雌雄比为1∶1。对橄榄蛏蚌的基础生物学研究仍处于初期,后续应在雌雄个体性别决定、性别分化、生长速度等方面进行进一步研究。