基于颜色与物质浓度辨识的数学模型
2019-03-06王庆
王 庆
(苏州市职业大学 数理部,江苏 苏州 215104)
1 问题的提出
比色法是目前常用的一种检测物质浓度的方法,即将待测物质制备成溶液后滴在特定的白色试纸表面,等其充分反应以后获得一张有颜色的试纸,再将该颜色试纸与一个标准比色卡进行对照,以确定待测物质的浓度档位。由于每个人对颜色的敏感差异和观测误差,使得这一方法在精度上受到很大影响。随着照相技术和颜色分辨率的提高,希望建立颜色读数和物质浓度的数量关系,即只要输入照片中的颜色读数就能够获得待测物质的浓度[1]。
本文参照2017高教社杯全国大学生数学建模竞赛C题,给出5种物质在不同浓度下的颜色读数,提出下列3个问题:
问题1:从这5组数据中能否确定颜色读数和物质浓度之间的关系,并给出一些准则来评价这5组数据的优劣。
问题2:建立颜色读数和物质浓度的数学模型,并给出模型的误差分析。
问题3:探讨数据量和颜色维度对模型的影响。
2 问题的分析和模型假设
为解决以上3个问题,通过对所列数据的分析,本研究对3个问题分别作分析和模型假设。
问题1:探究颜色读数与物质浓度之间的关系,并判断5组数据的优劣,采用多元线性回归[2]拟合出颜色读数与物质浓度之间的函数关系,给出预测值与真实值的误差,以平均相对误差M作为评判5组数据优劣的准则。为了更直观的评判数据的优劣,进一步,考虑用软件进行降维画图,依据图像的平稳度来判断。
问题2:采用Logistic变换[3]建立颜色读数和物质浓度的广义线性模型[4],并给出模型的误差分析。
问题3:选取5种物质在不同浓度下的颜色读数的数据,使每次浓度的数据量和颜色读数的维度发生改变,判断数据量和颜色维度对模型的影响。
3 模型的建立和求解
3.1 问题1模型的建立和求解
根据题目中给出的数据并查阅相关资料,选取颜色读数为R、G、B、S、H,建立物质浓度y与颜色读数的多元线性模型:
以组胺为例,利用组胺的数据得到组胺浓度y与R(x1)、G(x2)、B(x3)、S(x4)、H(x5)之间的函数关系:
给出预测值与真实值的误差,如表1所示。
表1 组胺浓度的预测值与真实值的误差
同理,利用多元线性回归拟合出溴酸钾浓度y1、工业碱浓度y2、硫酸铝钾浓度y3、奶中尿素浓度y4与颜色读数R(x1)、G(x2)、B(x3)、S(x4)、H(x5)之间的函数关系如下:
计算出各物质浓度的平均相对误差,M1=0.092 564,M2=3.496 4,M3=0.202 447,M4=0.136 626。
得到数据的优劣为:组胺>溴酸钾>奶中尿素>硫酸铝钾>工业碱。
为了更直观地评判数据的优劣,用Mathematica软件[5]将五维颜色读数降低为两维,如图1所示。
因此,如果专利权人拥有某个产品专利,但经他同意而将构成该产品的某个部件(即“专门用于制造专利商品的零部件或设备”)投入市场,由第三方将该部件组装成产品,这种情形下,也不适用权利用尽理论,而可能适用默示许可理论。
根据图像的平稳度,直观地判断数据的优劣为:组胺平稳度>溴酸钾平稳度>奶中尿素平稳度>硫酸铝钾平稳度>工业碱平稳度。
图1 降维处理后图像的平稳度
3.2 问题2模型的建立和求解
为了得到二氧化硫颜色读数和物质浓度的数学模型,首先采用问题1颜色读数和物质浓度的多元线性模型,得到一个简化的直观图,如图2所示,发现其线性程度较差。
为此,采用Logistic变换建立颜色读数和物质浓度的广义线性模型
其中Logistic变换
图2 二氧化硫颜色读数和物质浓度的多元线性模型
根据题目中给出的数据得到
进一步,根据Logistic变换和平均相对误差,给出模型的误差分析,得到模型的精准度与数据量的关系,如图3所示。
图3 模型的精准度与数据量的关系
由图3可知,当数据量小于20时,模型精准度较差,因为数据量较小时所建立的模型不稳定,容易造成较大的误差。
3.3 问题3模型的建立和求解
为了探讨数据量和颜色维度对模型的影响,可以选取5种物质在不同浓度下的颜色读数的数据,使每次浓度的数据量和颜色读数的维度发生改变,利用多元线性回归拟合出颜色读数与物质浓度之间的函数关系,给出预测值与真实值的误差,以平均相对误差M判断数据量和颜色维度对模型的影响,如表2所示。结果得到,模型的精准度与颜色维度正相关。
表2 以平均相对误差M判断数据量和颜色维度对模型的影响
进一步,采用Logistic变换建立颜色读数和物质浓度的广义线性模型,判断数据量和颜色维度对模型的影响,如图4所示。
图4 数据量和颜色维度对模型的影响
由图4可知,模型浓度的数据量越大、选取的颜色读数的维度越多,模型的精准度越高,预测值与真实值的误差越小。
4 结论
目前常用的检测物质浓度的比色法,由于每个人对颜色的敏感差异和观测误差,使得这一方法在精度上受到很大影响。本文建立颜色读数和物质浓度之间关系的多元线性模型,即只要输入照片中的颜色读数就能获得待测物质的浓度。为了提高检测的精准度,在多元线性模型的基础上,利用Logistic变换建立颜色读数和物质浓度的广义线性模型,给出模型的误差分析。进一步,探讨了数据量和颜色维度对模型的影响,有着实际的应用意义。