基于母乳氨基酸模式的配方粉营养价值评价方法
2022-12-15逄金柱任发政郑丽敏李依璇
张 恬, 逄金柱, 任发政, 杨 璐, 王 然, 郑丽敏, 李依璇,*
(1.中国农业大学 信息与电气工程学院,北京 100083;2.内蒙古蒙牛乳业(集团)股份有限公司,内蒙古 呼和浩特 011500;3.教育部北京市共建功能乳品重点实验室/中国农业大学 营养与健康系,北京 100190)
婴幼儿配方粉中的三大营养素包含蛋白质、脂肪和碳水化合物。蛋白质是婴幼儿生长发育必需的营养成分,其营养取决于所含各种氨基酸之间的平衡情况[1]。母乳中的氨基酸模式影响了婴幼儿对于蛋白质的消化和吸收[2]。配方粉的氨基酸组成和比例越接近母乳的氨基酸模式,氨基酸的利用程度越高,才能更好地促进婴幼儿的消化及健康成长。国外关于母乳氨基酸模式的研究不包括中国的母乳信息[3-4],国内针对婴配粉和母乳氨基酸模式研究缺乏。逄金柱等[5]分析了我国北京(北方)和深圳(南方)两城市母乳中氨基酸含量的比例差异,段一凡等[6]分析了我国城乡不同泌乳阶段的母乳中氨基酸构成及含量,但是这些研究对母乳氨基酸只进行了组成和含量的分析,并没有进行系统的氨基酸模式分析。
评价配方粉氨基酸营养价值的方法,主要有生物学法和化学指数法[7]。生物学法主要通过人体或动物实验进行相关指标的测定,有较高的准确性和正确性,但是人群试验和动物实验的周期长、实验复杂。化学指数法主要是对蛋白质中的氨基酸进行分析,可靠性不如生物学法,但是高效、简单且耗时短,有很高的参考价值。吴庆贺[8]利用皮尔逊相关系数,对3种新型配方粉和母乳的氨基酸模式进行相关性分析,从而判断出与母乳氨基酸模式最接近的配方粉。宋晓青等[9]在氨基酸曲线相似度计算时,以灰色关联度表示氨基酸的平衡度,各个配方粉的氨基酸组成曲线和理想蛋白质氨基酸模式曲线几何形状越相似,关联度越高,则两者氨基酸组成越接近,该食物蛋白质的氨基酸平衡性就越好。然而,皮尔逊相关系数和灰色关联法单纯从数理统计角度,评估不同婴配粉蛋白质的各种必需氨基酸组成数据存在的变异程度,没有将各种氨基酸作为一个整体从向量的角度来度量配方粉和母乳的相似性,存在一定缺陷。
余弦相似度方法在计算机领域有广泛的应用,如深度学习[10]、多属性决策[11]、分类预测[12]和推荐系统[13],但是在乳品营养领域的研究较少。本研究收集了母乳样本1028份,拟将母乳和配方粉的氨基酸信息转化为矩阵,使用余弦相似度方法从向量的角度比较婴配粉氨基酸组成与母乳氨基酸组成的相似度,对婴配粉的营养价值进行评价,希望为婴配粉的开发和营养价值研究提供参考。
1 材料与方法
1.1 材料与试剂
母乳:针对我国8个城市(北京、济南、包头、成都、昆明、深圳、南京、西宁)的240名产妇,年龄为18~38 岁(伦理审查编号 SHERLL2013007),收取其单侧乳房的全部乳汁并分装,纵向采集早期成熟乳6次(产后15~180 d),采集后的母乳于-80 ℃储藏并通过冷链运输。
配方粉:1段婴幼儿配方奶粉(0~6月龄)12种(简称配方粉),其中包含自主研制的产品6种,市售国产及进口配方粉6种。
盐酸、苯酚、柠檬酸钠等为分析纯生化试剂,上海网化化工科技有限公司;磺酸型阳离子树脂购于上海阿拉丁生化科技股份有限公司。
1.2 仪器与设备
AMINO A300型全自动氨基酸分析仪,德国曼默博尔公司;DHG-9076A型电热恒温鼓风干燥箱,上海精宏实验设备有限公司。
1.3 实验方法和数据分析方法
1.3.1母乳及配方粉氨基酸检测方法
称取120 mg样品(蛋白质质量:10~20 mg)放置在水解管中,加入10~15 mL 6 mol/L盐酸溶液及3~4滴苯酚,并将水解管冷冻35 min,利用真空泵抽真空后充入氮气,重复该过程3次,保证在充氮状态并密封好,放入烘箱内(110 ℃)水解22 h,取出冷却至室温。将水解液转移至50 mL容量瓶内,定容混匀。吸取容量瓶中1.0 mL滤液至试管内, 45 ℃环境中减压干燥,用1~2 mL超纯水溶解后进一步减压干燥后蒸干,加入1~2 mL柠檬酸钠缓冲液(pH值2.2)振荡溶解,利用0.22 μm滤膜过滤并转移至进样瓶中测定。
氨基酸分析仪的色谱条件:磺酸型钠离子分离柱,柱温57 ℃,反应器温度135 ℃,流动相流速0.45 mL/min,衍生液流速0.25 mL/min。检测器波长570 nm和440 nm,进样量50 μL。测得母乳及配方粉各氨基酸值的单位为g/100 g。
1.3.2母乳氨基酸频数矩阵优化方法
对母乳样本进行一般统计分析,发现每个母乳样本各氨基酸含量之间平均误差较大,导致母乳整体样本差异不显著,但从母乳样本各氨基酸含量的分布上看,有集中分布的趋势,因此通过确定大多数氨基酸含量的分布区间范围,以确定母乳氨基酸模式。
计算氨基酸含量的最大值MAXi和最小值MINi,得到极差=MAXi-MINi,根据MAXi和MINi确定各个氨基酸含量的分布区间为[MINi,MAXi]。根据最大值和最小值将氨基酸区间划分为N等分(根据样本个数确定N的大小,本实验母乳样本数大于100,小于500,因此,N取值:10≤N≤20),用于分析确定各氨基酸的区间间隔,每个子区间间隔如式(1)。
(1)
式(1)中,level为每个子区间间隔,MAXi为各个氨基酸含量的最大值,MINi为各个氨基酸含量的最小值,N为氨基酸区间N等分。区间间隔决定分析控制精度,根据区间间隔计算N个子区间的范围,每个子区间范围如式(2)。
count1:MINi≤x (2) 式(2)中,MAXi为母乳某种氨基酸含量的最大值,MINi为母乳某种氨基酸含量的最小值,level为N等分后的子区间间隔,countN为每个子区间。 分别统计每种氨基酸在各子区间的分布频数,分布频数即氨基酸在该区间内母乳样本的个数。得到区间分布频数矩阵(matrix)如式(3)。矩阵中行为M种氨基酸,列为N个子区间。 (3) 式(3)中,aaMN表示第M种氨基酸含量在countN子区间中的分布情况。 得到母乳样本的分布频数矩阵,可以了解母乳样本各氨基酸含量的频率分布,但需要进一步对分布频数矩阵进行优化,求解各氨基酸含量的多数分布区间,以得到合理的母乳氨基酸模式。采用钟摆算法进行优化,钟摆算法伪代码见表1。首先找到母乳分布最多的区间;分别比较上下两个区间的分布数值,选择其中的较大者,直至找到连续的区间;且连续区间的母乳氨基酸种类之和最接近母乳总样本量的k%[根据理想标准正态分布规律,由标准差σ确定分布的幅度,±1σ分布概率为68.2%,±2σ分布概率为95.4%,但本研究中的母乳样本不是标准正态分布,因此取k%母乳样本数表示分布概率(68.2%≤k%≤95.4%)]。对早期成熟乳样本,通过钟摆算法计算会得到各氨基酸含量的分布区间,形成新的最小值、最大值和平均值,即为早期成熟乳的母乳氨基酸模式。 表1 钟摆算法伪代码 1.3.3配方粉氨基酸和母乳氨基酸的余弦相似度计算方法 1.3.3.1 配方粉和母乳氨基酸数据的标准化 标准化是距离计算中最重要的步骤之一。数据标准化使各个氨基酸在距离计算过程中具有相同的权重,能够减少氨基酸数值范围变化对距离计算结果的影响。用公式(4)进行标准化。 (4) 式(4)中,x为配方粉或母乳氨基酸的含量,x*为归一化后配方粉或母乳氨基酸含量,ave为配方粉或母乳氨基酸含量的平均值,std为配方粉或母乳氨基酸含量的标准差。 1.3.3.2 配方粉和母乳氨基酸数据的余弦相似度计算 对标准化后的数据进行相似度衡量。氨基酸之间的特定比例反映在不同配方粉的具体数值上,即配方粉相似,对应的每一个氨基酸数值以及氨基酸之间的比例都相似。传统的基于数值的距离度量方法,如欧式距离,忽略了这种特性,只计算了数值上的差异,而余弦相似度将氨基酸作为一个整体来考虑,因此选择余弦相似度进行配方粉的相似性度量。余弦相似度的数值越大,表明相似度越大,余弦相似度计算方法如式(5)。 (5) 式(5)中,d为余弦相似度,Xi为不同配方粉,Yi为母乳氨基酸模式,n为氨基酸种类。 利用Excel 2016软件进行数据整理和统计分析,Origin软件绘图可视化,Python 3.7和PyCharm软件对氨基酸组成进行余弦相似度的计算。 利用全自动氨基酸分析仪测定母乳(显示部分样本)和配方粉样本氨基酸组成和含量,见表2。由表2可见,各母乳中的氨基酸含量存在显著差异,如赖氨酸质量比为0.076~0.129 g/100 g,苏氨酸质量比为0.055~0.094 g/100 g,缬氨酸质量比为0.056~0.1 g/100 g等;另外,母乳与配方粉中的氨基酸含量也显著不同,配方粉中的氨基酸(除精氨酸、脯氨酸、半胱氨酸外)含量比母乳中高。 表2 部分母乳和配方粉中氨基酸的组成和含量 首先对母乳氨基酸进行区间划分,确定早期成熟乳中氨基酸含量的最大值和最小值,N等分后确定区间范围,以10等分为例,根据氨基酸含量的最大值和最小值,将区间分为10份。统计氨基酸在各子区间的种类,除以氨基酸的总数得到氨基酸频数矩阵,见表3(以必需氨基酸为例)。 表3 必需氨基酸频数矩阵 根据氨基酸的区间分布情况,结合钟摆算法,找到分布最多的区间,分别比较上下两个区间的样本分布情况,选择较大者(目的是为了确保最终选择的区间是连续的),直至选取的样本数趋近总样本的80%。氨基酸原始区范围和处理后的范围比较情况见表4。优化后的母乳氨基酸模式的标准差相较于原始数据的标准差变小,说明了优化后的氨基酸数据更加稳定。 表4 氨基酸原始区范围和处理后的范围比较 确定每种氨基酸的80%区间后,计算氨基酸含量的平均值得到优化后母乳氨基酸模式,以WHO母乳氨基酸模式[14]为对照,包括原始母乳氨基酸在内的3种氨基酸模式见表5。原始和优化后母乳模式与WHO母乳模式相比,氨基酸含量较低,说明中国母乳与WHO母乳氨基酸模式存在显著差异,评价婴配粉的营养价值需采用中国母乳氨基酸模式。 表5 各种母乳氨基酸模式 为了验证区间处理后母乳氨基酸模式的有效性,比较原始的母乳氨基酸模式、优化后的母乳氨基酸模式和WHO母乳氨基酸模式之间的距离。按照式(5)中的余弦相似度比较3种模式的相似性,余弦相似度越大,表明相似性越强,计算结果见表6。相较于原始母乳氨基酸模式,区间处理后的母乳氨基酸模式和WHO母乳氨基酸模式更相似,验证了区间处理确定母乳氨基酸模式的有效性。 表6 母乳氨基酸模式 为了说明必需氨基酸和非必需氨基酸的作用,将母乳样本分别取9种必需氨基酸和18种全部氨基酸进行比较。针对9种必需氨基酸,计算配方粉与3种母乳氨基酸模式间的余弦相似度,结果见图1。由图1可以看出,3种情况下配方粉的排序相似,且相较于原始母乳氨基酸模式,区间处理后的母乳氨基酸模式和WHO母乳氨基酸模式的结果更接近,说明了优化后母乳氨基酸模式更接近WHO母乳氨基酸模式。与母乳相似度最高的均为配方粉F,相似度较低的均为配方粉A。 图1 针对9种必需氨基酸的配方粉与母乳氨基酸 模式的余弦相似度比较 针对18种全部氨基酸计算配方粉与3种母乳氨基酸模式之间的余弦相似度,结果见图2。由图2可以看出,3种情况下配方粉的排序相似,相较于原始母乳氨基酸模式,区间处理后的母乳氨基酸模式和WHO母乳氨基酸模式的结果更接近,说明了区间处理后的母乳氨基酸模式更加接近WHO的母乳氨基酸模式。与母乳相似度最高的均为配方粉H和配方粉D,相似度较低的均为配方粉F,这与9种必需氨基酸的分析结果不一致,表明氨基酸的组成不同影响配方粉的氨基酸评价结果。 图2 针对全部18种氨基酸的配方粉与母乳氨基酸 模式的余弦相似度比较 本研究利用频数矩阵优化方法提出了新的中国早期成熟乳氨基酸模式,并利用余弦相似度评价方法,将配方粉和新的母乳氨基酸模式进行比较。结果表明,优化母乳、原始母乳和WHO母乳氨基酸模式与各配方粉的余弦相似度比较,趋势一致,说明余弦相似度比较可以客观评价配方粉的营养价值。针对9种必需氨基酸,配方粉F与母乳相似度较高,配方粉A与母乳相似度较低;针对18种全部氨基酸,配方粉H和配方粉D与母乳相似度较高,配方粉F与母乳相似度较低。不同种氨基酸对比结果表明,氨基酸组成不同影响配方粉的氨基酸评价结果。本研究采用的余弦相似度方法可以用来客观评价配方粉与中国母乳的氨基酸营养价值,希望为婴配粉的开发和应用提供新的评价手段。1.4 数据处理
2 结果与分析
2.1 母乳和配方粉样本中氨基酸组成分析
2.2 母乳氨基酸模式的优化结果
2.3 母乳和配方粉氨基酸的余弦相似度分析结果
3 结 论