食用高热量食物体重影响的因果效应分析
2022-06-06刘鹏蒋泽坤
刘鹏 蒋泽坤
一、引言
本文是基于墨西哥、秘鲁和哥伦比亚等国的饮食习惯和身体状况生活习惯等数据进行的实证分析,在诸多方法的比较之下,最小二乘法仍是最为简单有效的估计方法。本文利用最小二乘法计算出相应的条件期望函数,得到关于经常食用的高热量食物对于体重影响的因果效应。在条件期望函数是线性的情况下,那么总体回归函数和条件期望函数将完全一致。我们所要估计的因果效应参数便是总体回归函数的系数。
二、估计方法和研究思路
我们假设的条件为:经常摄入高热量食物和身高(HEIGHT)以及主餐次数(NCP)对于体重的影响是线性的。故我们将模型(1)假定为:
模型(1)正确的描述了被解释变量体重、解释变量经常摄入高热量食物、身高、主餐次数和干扰项e之间的关系。由于因果效应参数就是用条件期望函数来定义的,在条件期望函数是线性的情况下,那么总体回归函数和条件期望函数将完全一致。因此我们所要估计的因果效应参数便是总体回归函数的系数。
模型(1)在估计经常食用高热量食物对体重影响的因果效应上可能会存在偏差,所以我们又在模型(1)的基础之上添加了模型(2)和模型(3)。控制变量的引入,能够消除混杂偏差。模型(2)则是在模型(1)的基础之上添加性别变量(GENDER)作为控制变量,我们男性设置为1,女性设置为0。而模型(3)则是在模型(2)的基础之上在添加了家族肥胖史(FAM)作为一个控制变量,设置同上。对于控制变量,我们引入的目的就是为了保证原因变量的系数有因果效应的解释。
三、数据来源和描述
本文的这些数据来自UCI机器学习库,该数据集包括墨西哥、秘鲁和哥伦比亚等国的饮食习惯和身体状况和生活习惯等数据。表1是本文数据中各变量的描述性统计。
由表1可知,三个国家的人均体重为86.69kg,有88%的人经常食用高热量食物。从经常食用高热量食物人群和不经常食用高热量食物人群对比分析中可以得出经常食用高热量食物人群的平均体重要比不经常食用高热量食物人群平均体重重22.27kg。
四、回归结果分析
1.本文采用最小二乘法(OLS)对模型(1)进行估计,具体的回归结果如下图所示
由回归结果可知,在模型(1)满足了条件独立性假设的条件的情况下,是否经常食用高热量食物对体重的影响的估计中,经常食用高热量食物的人群要比不经常食用高热量食物的人群体重要重16.04kg。
2.同样采用最小二乘法对模型(2)进行估计。回归结果如下图所示。
由回归结果可知,加入了性别作为控制变量后,经常食用高热量食物的人群要比不经常食用高热量食物的人群体重要重15.24kg。
3.同样采用最小二乘法对模型(3)进行估计。回归结果如下图所示。
由回归结果可知,加入了家族肥胖史作为控制变量后经常食用高热量食物的人群要比不经常食用高热量食物的人群体重要重10.1kg。
五、结论
本文是先假设体重与身高、是否经常食用高热量食物和主餐次数之间的关系是线性的,然后构建了一个线性方程,并在方程中加入控制变量,在加入了性别作控制变量之后又加入了家族肥胖史作控制变量。经过本文三个模型的研究发现,经常食用高热量食物对体重的影响有着显著的因果效应。经常食用高热量食物人群的平均体重要显著高于不经常食用高熱量食物的人群的平均体重。
在本文的研究中可以发现,高热量食物的摄入和体重有显著的因果关系,所以减少高热量食物的摄入是控制肥胖问题的一个关键途径。
参考文献
[1]王绍云. 高蛋白早餐对摄入量、食欲及体重的影响研究[D].中国人民解放军医学院,2014.
[2]谢元娟. 线性因果关系建模方法演进及其应用研究[D].山东财经大学,2017.
作者简介
刘鹏(1995-),男,江西赣州人,硕士研究生,主要研究方向大数据分析。