APP下载

药学类专业开设多变量解析课程的可行性研究

2022-06-18苏日娜白文明

卫生职业教育 2022年12期
关键词:药学解析变量

布 仁,莲 花,苏日娜,牧 丹,白文明

(内蒙古医科大学药学院,内蒙古 呼和浩特 010010)

随着时代的发展、科技的进步,时代赋予医药工作者以更高的要求,医药工作者应以更快的速度提供更好的药物,这就要求医药工作者必须有更为扎实的基础知识、更加过硬的基本素养技能。药学相关工作具有实践性、技能性、综合性等,该专业学生应具备扎实的药学相关专业知识。医药学本科院校设置的药学类专业包含药学、药物制剂、临床药学等多个专业[1],其开设的核心课程有药物制剂、药理学、药物化学、药物分析、医药数理统计等课程。大四学年设置的毕业专题研究既是本科阶段所学各类知识的综合应用训练,也是完成学校各项科研任务的重要支撑。药学类专业涉及的毕业研究课题大多是以测量数据为基础的实验研究,随着现代仪器测试技术的飞速发展,采集数据的分辨率、维度及范围都得到了提高和扩展,即数据变量增多、数据量发生爆炸式增大,所以如何对多变量大数据进行处理和分析已成为实验研究面临的重要课题。但是,现阶段国内各院校设置的药学类专业并未开设专门面向实验测试数据解析的独立课程,数据解析方法的学习更多依靠自学。如前所述,随着实验数据量和数据结构的变化,简单的数据处理方法有时无法达到数据解析的目的,有效的数据解析常需要结合复杂的数学算法、统计学原理及计算机技术,所以数据解析技能的培养不能仅仅依靠学生的自学,非常有必要开设专门课程,系统、全面地学习相关算法、原理及数据解析特点等。

多变量解析是指对多变量数据进行数学、统计学分析的方法总称。多变量数据解析方法种类繁多,根据分析对象数据的类型(形式)和分析目的等,解析方法也不尽相同。选择合适的数据解析方法,正确完成数据分析是确保课题研究顺利进行的重要前提。本文结合授课群体的专业特点、实际需求及数据解析目的,研究讨论了药学类专业开设多变量解析课程的可行性,为多变量解析课程的开设提供理论依据及参考。

1 实验数据解析的必要性

实验研究的分析对象多为复杂体系,现代分析测试技术通过增加数据采集点、通道数及维度等方式显著提高了采集数据对目标属性的解释能力,即增加了实验数据包含的有效信息。与此同时,实验数据的结构变得更加复杂,数据解析的难度随之增大。现阶段,药学类专业开设的数据解析相关的课程有高等数学、线性代数及统计学等,但都侧重于数学原理的讲授,缺乏对实际实验数据的解析案例,学生虽然掌握了一些数学基础知识,但是遇到解析具体实验数据时,往往会出现无从下手的状况。实验数据解析,究其本质是寻找自变量与因变量之间相关关系的过程。通过实验获得的结果,从理论上都可以归属为自变量,可以是数值变量,也可以是分类变量[2]。而因变量是由自变量的变动引起的结果,在课题研究中因变量往往被设定为与研究目的直接相关联的具体变量,与自变量相同,类型有数值变量和分类变量两种。实验数据中不仅包含与目标属性相关的有效信息,同时还含有大量无效信息,如由于仪器噪音、测量条件的变化引起的背景干扰、与目标属性无关的共存物质的响应及样品物理化学状态的差异引起的干扰响应等。由于数据采集过程中无法对上述类型的无效信息进行过滤,所以由各类测试技术采集得到的是同时包含了有效信息和无效信息的混合数据。在实验研究过程中,有效地分离数据包含的无效信息和有效信息、降低无效信息的干扰及消除变量间的共线性等问题是现代科学研究共同面临的课题。将数学和统计学的方法应用于实验数据的解析过程,即多变量解析,是解决实验研究中各种问题的有效手段。

医药学高等院校作为培养医药专业人才的阵地,本科阶段的课程体系应根据专业发展的新特点和新需求进行合理调整,以求培养出适应新时代要求的合格专业人才。所以,在药学类专业的课程体系中增设多变量解析课程完全符合专业发展的特点和需求,对提高人才层次、社会适应度及专业技能等方面有重要的现实意义。

2 多变量解析课程的授课特点

探究实验结果与影响实验结果的因素之间的关系是实验研究的最终目的。作为解析手段,我们可以逐一讨论各个因素(变量)与结果之间的关系,这种手法被称为单变量解析。当然,单一的因素可能无法充分解释结果,所以必须把所有因素都考虑进去,用这些因素综合解释结果。但是,往往各个因素之间又存在一定的相关,关系会变得非常复杂。因此,对各个因素进行逐一讨论后,综合解析的手法不仅费时费力,且当因素数目增多时,这种综合解析本身就变得非常困难。所以需要一种能够将相互关联的因素(即实验数据)所具有的特征进行汇总,并根据目的进行合成的技术,该技术称之为多变量解析。随着计算机的普及和软件技术的迅速发展,多变量解析法在包括自然科学和人文科学在内的各个领域得到了广泛应用。作为以实验研究为主体的相关工作人员而言,掌握多变量解析方法是必备的实践技能之一。根据现有理论统计,多变量解析方法有上百种,想要对所有内容进行充分理解,必须具备非常高阶的数学知识。而对于除少数统计学专家之外的大部分人而言,只要具备清楚理解多变量解析的目的,在可能的范围之内掌握几种具有代表性的解析方法,对解析结果进行正确解释的能力即可。

如前所述,多变量解析法的种类繁多,如果不对其进行归类区分的话,很容易带来混淆概念,混用乱用的现象。根据各类解析手法的特点总结出的分类结果[2]见图1。

图1 多变量解析手法的分类树形图

3 课程内容的选择

如前所述,多变量解析方法种类繁多,将所有解析方法全部进行讲解对于单一的一门课程而言,任务过重,负担太大,几乎不可能完成。根据数据结构特点和解析目的不同,多变量解析方法在不同领域中的具体应用存在很大差异。笔者试图从药学类专业的学科特点出发,从众多解析法中精炼出部分具有代表性的多变量解析方法,通过对其方法内容、目的、适用范围及结果解释逻辑等进行讲解,使学生系统地掌握常用的多变量解析方法,并能自主地将所学方法适用于多变量数据的解析。

药学类专业常用的多变量解析法有聚类分析、主成分分析(PCA)、因子分析、多元回归分析、判别分析、K近邻分析、数量化分析、主成分回归分析、偏最小二乘(PLS)回归分析等。该课程将以定性分析和定量分析领域常用的聚类分析、主成分分析、PLS回归分析为主线,对多变量解析法进行讲解。

3.1 聚类分析

聚类分析是指在对已知样品和未知样品不进行区分的前提下,利用n维坐标(每个样品有n个测量值)内的所有样品间的欧几里得距离的长短对样品进行分组的方法[3]。该方法可以得出已知样品的分散程度、未知样品在各个已知样品组的归属和未知样品在所归属的已知样品组内与哪个已知样品最相似等信息,且当未知样品不归属任何已知样品组时,仍可以将这种无归属的情况进行明确的判别。

在进行聚类分析前可以通过PCA对所有用于聚类的样品进行奇异值分析,进而去除奇异样品。为了让聚类分析的结果易于理解,利用树状图表示样品间的关系。树状图的横轴表示的是由欧几里得距离确定的相似度,纵轴为样品编号。

3.2 主成分分析

主成分分析是指在尽量不丢失原有信息的前提下,将已知样品和未知样品的测量值构成的矩阵进行降维的方法[4]。该方法由一系列步骤构成,首先是将所有样品按测量项目进行排列,得到行数等于样品数、列数等于测量项目数的矩阵数据。其次,将上述矩阵投影到与测量项目数相等的多维坐标系中(一个点即一个样品),并且按照最大限度提取所有样品各个测量项目反映的共同信息的方式绘制新坐标轴,该坐标轴称之为第一主成分。而第一主成分无法全部描述所有的原有信息,所以用相同的方法对剩余信息绘制第二条坐标轴,称之为第二主成分,且该坐标轴应正交于第一主成分,即第二主成分反映的信息与第一主成分反映的信息间完全不相关。依上述方法还可以得到更多的主成分,直至原有的信息全部被提取出来为止。在主成分分析中,将样品在上述新的坐标轴即主成分上的投影称之为该样品在该主成分上的得点(score)。

在定性分析过程中,以主成分为坐标轴,基于主成分得点用二维或三维图表示样品分布状况的做法即为主成分分析法。另外,还可以通过对主成分得点和样品含量数据进行多元回归的方式进行定量分析,该方法称之为主成分回归分析法。

3.3 PLS回归分析

基于多元回归的定量分析受到自变量间存在的多重共线性的影响,其预测精度将大大降低。主成分回归分析虽然解决了自变量间存在的多重共线性问题,但是主成分提取过程中未考虑自变量与因变量间的关系,所以回归精度仍然可能不足。为了提高回归分析的预测精度,提出了PLS回归分析[5]。对实验数据进行PLS回归分析时,首先需要在保证潜变量与因变量间的协方差最大,且潜变量间完全不相关的条件下提取潜变量。再基于部分潜变量和因变量进行多元回归分析,即得到预测因变量数据的数学模型。当然,建立定量预测模型的过程当中还必须考虑构造模型的潜变量数、有效变量的选择及模型的评价等相关问题,一并将在课程内容当中予以体现。

本课程内容除了上述3种多变量解析方法外,还将包含与这三类方法相似、相关的其他多变量解析内容。例如,与聚类分析法相关的判别分析、数值化分析,与主成分分析法相关的因子分析、独立成分分析,与PLS分析相关的PLS-DA分析、正交PLS分析等方法[6-9]都将是本课程的讲授内容。

4 结语

随着计算机和各种统计软件的普及,多变量解析法已然成为实验研究数据分析不可或缺的重要工具。但是,大部分相关人员未上过系统的多变量解析课程,对解析法的理解不全面,常出现解析法的不当应用等情况。常出现的不当应用有模型的不适用、有效变量的选择错误、研究目的和解析方法不匹配、统计鉴定的混用和乱用等。所以作为培养专业人才基地的高等院校,应根据自身专业的学科特点开设多变量解析相关的课程,以培养出符合时代发展要求,具有合格的数据处理、分析能力的人才。

猜你喜欢

药学解析变量
口服中药汤剂常见不良反应及药学干预
《药学进展》编辑委员会
《药学进展》杂志征稿启事
三角函数解析式中ω的几种求法
抓住不变量解题
PCC0104007在精神分裂症大鼠模型中的药学研究
睡梦解析仪
复合场中类抛体运动解析
对称巧用解析妙解
分离变量法:常见的通性通法