APP下载

基于地理加权回归(GWR)模型对国民体质与社会、自然因素关系的分析

2018-01-19胡精超

吉林体育学院学报 2017年6期
关键词:文盲国民系数

王 莉 胡精超

(1.河南理工大学测绘与国土信息工程学院,河南 焦作 454003;2.河南理工大学体育学院,河南 焦作 454003)

1 前言

我国历来高度重视国民的体质健康,国民体质是一个国家健康发展的重要保障。从2000年起我国每5年进行的国民体质测试是落实《中华人民共和国体育法》和《全民健身计划》的重要工作[1]。2016年10月25日,中共中央、国务院印发了《“健康中国2030”规划纲要》。“共建共享、全民健康”,是建设健康中国的战略主题。2016年《中华人民共和国国民经济和社会发展第十三个五年规划纲要》提出“实施全民健身战略,促进群众体育与竞技体育全面协调发展”的战略规划[2]。2017年2月,刘延东副总理在国务院全民健身工作部际联席会议上强调:面对新形势、新任务、新要求,坚决贯彻落实习近平总书记关于体育工作重要论述,全面贯彻落实《“健康中国2030”规划纲要》和《全民健身计划(2016-2020年)》,把全民健身工作作为整个体育事业的重中之重,着眼实现全体人民对幸福生活的追求[3]。

人的体质受遗传因素和自然环境、经济社会环境影响。国内外学者对国民体质的空间分布特征进行大量研究[4]。身体素质的好坏直接反映人们在日常生活中承受能力的强弱,各种器官的承受力除了与先天遗传与后天锻炼有直接关系外,也受生活质量(包括环境、营养、工作性质等)的影响。后天的体育锻炼与健身对身体素质的强弱有着决定性的作用,但这一行为又与人们接受体育教育程度、经济状况、消费观念和习惯等有密切的关联,而这些又都与社会经济的发展有直接或间接的关系。胡利军、扬远波(2005)、周新新(2012)应用统计分析方法研究了社会经济对国民体质发展的影响,发现社会经济因素对国民体质的影响逐渐在减弱[5,6]。张天成(2010)和李纪江(2010)分别研究了我国青少年和成年人体质水平与自然环境的差异性[7,8]。卢福玲(2014)对2000年和2010年我国各省国民体质综合指数和社会自然因素进行全局 Moran s' I 指数和 LISA 聚类分析[9]。王莉、胡精超(2017) 运用空间关系建模工具对中国各省市(自治区)国民体质与社会经济、自然环境的相关关系进行了研究[10]。体质的强弱受生活环境、营养、健康锻炼影响,同时也受人们的教育程度、消费观念等的影响。但是,在不同的经济发展时期,社会经济对国民体质的影响是不同的,经过多年的经济高速增长,我国经济已经发生了翻天覆地的变化,经济发展到一定高度,对体质的影响作用逐渐减小。本文仅研究社会、自然等因素对国民体质的影响,而不考虑经济因素的影响,运用GIS技术和空间视角去研究我国国民体质数据,全面地认识我国国民体质与地域空间、社会自然环境的关系。

2 数据选取与研究方法

2.1 数据选取

本研究通过国家体育总局发布的《2015年国民体质监测公报》获得我国31个省市(自治区)(缺少香港、台湾和澳门的相关数据)国民体质综合指数相关体质测试数据。通过《2016中国统计年鉴》获

得全国各省市(自治区)的相关社会经济、自然环境数据[11]。以全国1:400万行政区划图(shp格式)作为底图进行回归分析,使用ArcGIS10.1软件进行分析处理。

国民体质综合指数(CI)用来描述国民体质总体水平,包括身体形态、身体机能和身体素质等。国民体质综合指数的数学模型:

CI=∑Pifi∑Ki(xij/xi),

(1)

其中:i为第i个指标,j为第j个人群分组,Pj为人口数年龄别结构权重,Ki为各指标权重,fi为调节因子,xi为基期单指标测试平均值,xij为报告期单指标测试平均值。

应用ArcGIS10.1软件,以国民体质综合指数为变量制作专题图(如图1所示),2015年我国各省国民体质呈现“东高西低”的状态。

2.2 研究方法

回归分析是用于描述一个因变量与若干个解释变量之间的相关关系并进行建模的一组方法的集合。传统的普通最小二乘法(Ordinary LeastSquare,简称OLS)只是对参数进行“平均”或“全局”分析,不能反映参数在不同地理空间的差异性。进行国民体质与社会经济和自然环境等因素的普通回归分析(例如OLS)过于简单,应当考虑空间数据的差异性,空间变系数地理加权回归模型就能很好地处理这种差异性。

地理加权回归(Geographically Weighted Regression,GWR)是Fothegingham,Charlton and Brunsdon(1996,2002)提出,是若干空间回归技术中的一种,允许模型系数在空间上变化的回归分析方法[12,13]。GWR为数据集中的各要素构建了局部回归方程。GWR公式表示为:

(2)

其中,系数βj的下标表示与观测值相联系的参数,是关于空间位置(ui,vi)的n+1元函数,通过检验每个采样点明确定义的邻域内的点集来确定。ε是第i个空间位置的随机误差。

在全局回归模型中,当存在两个或更多冗余变量共同提供同一“信息”时,结果并不可靠,如果解释变量存在强关联并且总体上是线性的,应该剔除相应变量。运用地理加权回归分析国民体质异质性时,首先通过OLS法获得正确解释变量,然后使用同样的解释变量生成GWR模型。对GWR的残差计算空间自相关(Moran's I)指数,可确保回归残差在空间上随机分布。高残差或低残差在统计学上的显著聚类表明错误地指定了GWR 模型,则需要修改解释变量,重新指定GWR模型。

3 研究结果与分析

3.1 国民体质综合指数回归分析

本研究选取2015年全国31个省市(自治区)国民体质综合指数作为因变量,城市人口密度、文盲比率等社会指标,年平均温度、全年降水量、全年日照时等反映各地区气候等的自然指标,森林覆盖率、废水排放量等环境指标作为解释变量。在ArcGIS 10.1软件创建我国各省国民体质空间数据库,逐一剔除存在多重共线性的变量,最终保留与国民体质综合指数相关性大的7个解释变量:城市人口密度、文盲比率、年平均温度、全年降水量、全年日照时、森林覆盖率、废水排放量。AICc(Akaike信息准则的小样本修正版)为157.540728,R2为0.594148。7个解释变量中,城市人口密度、全年日照时、森林覆盖率和文盲人口比率的系数为负,说明这4个解释变量与国民体质综合指数呈现负相关。其中全年降水量和文盲人口比率具有统计显著性的概率。年平均温度和文盲人口比率的系数远大于其他指标,总体看来,现阶段自然环境等因素和国民教育程度对国民体质的影响大于社会环境的影响。

3.2 国民体质综合指数地理加权回归分析

在ArcGIS 10.1中运用地理加权回归(GWR)工具,对7个解释变量与因变量国民体质综合指数进行地理加权回归分析,生成国民体质综合指数GWR残差图(图2)、GWR残差Moran's I指数图(图3)、GWR系数图(图4)和GWR估计结果(表1)。GWR模型的残差平方和为112.982776,调整后的拟合优度达到了63.0478%,说明整个 GWR 局域估计模型能较好地反映国民体质综合指数以及邻域社会自然等指标对该地区国民体质的综合影响。表1中,C1~C7分别代表城市人口密度、文盲比率、年平均温度、全年降水量、全年日照时、森林覆盖率、废水排放量的系数。社会和自然环境因素的关联系数从大到小依次为:文盲人口比率>年平均气温>森林覆盖率>全年降水量>全年日照时>城市人口密度>废水排放量。

由标准残差图(图2)可以显示预测异常地区,深蓝色显示的贵州省、新疆维吾尔自治区和深红色标注的辽宁省、上海市和北京市存在较高的偏差,由于贵州省和新疆维吾尔自治区国民体质指数较低,辽宁省、上海市和北京市的国民体质指数较高,导致这些地区存在较高的偏差。检查GWR 模型残差的分布格局可了解是否可从这些分布格局中确定可能丢失的那些变量。对GWR回归残差应用ArcGIS 10.1的空间自相关(Moran's I)工具,可以通过分析结果确保回归残差在空间上随机分布。从图3中的结果可以得出,Moran I 指数为-0.092150,z 得分-0.819343,p 值为0.412591,没有呈现聚类分布,说明GWR模型正确。

图4 2015年国民体质综合指数GWR废水排放量和文盲比率系数图

NAMECondLocalR2C1C2C3C4C5C6C7黑龙江省29.9978160.579653-0.000231-0.0843820.0036570.001180-0.0467660.000003-0.269549内蒙古自治区29.0529790.584603-0.000189-0.0788130.0034870.001150-0.0433970.000003-0.252337新疆维吾尔自治区28.2664230.589182-0.000108-0.0489450.0029820.001086-0.0318420.000004-0.213572吉林省29.5704430.583978-0.000225-0.0894670.0036780.001163-0.0477460.000003-0.269860辽宁省29.2023880.586725-0.000214-0.0902630.0036500.001151-0.0474080.000003-0.266186甘肃省28.1878840.592098-0.000149-0.0731330.0033190.001111-0.0403570.000003-0.236867河北省28.7816240.589143-0.000194-0.0872140.0035670.001138-0.0457750.000003-0.257895北京市28.8478690.588424-0.000195-0.0866490.0035670.001141-0.0456910.000003-0.258096山西省28.4813040.591553-0.000181-0.0859760.0035190.001127-0.0449430.000003-0.253079天津市28.8132760.589254-0.000197-0.0885880.0035880.001139-0.0462640.000003-0.259700陕西省28.1772250.594438-0.000168-0.0850980.0034750.001115-0.0442560.000003-0.248672宁夏回族自治区28.2649240.592393-0.000163-0.0797510.0034150.001118-0.0426410.000003-0.244317青海省27.9090940.594966-0.000131-0.0684660.0032260.001093-0.0385230.000004-0.229324山东省28.6107980.592260-0.000197-0.0931290.0036230.001130-0.0473910.000003-0.261962西藏自治区27.4756980.600817-0.000100-0.0602740.0030680.001060-0.0355410.000004-0.217142河南省28.2439190.595295-0.000181-0.0917380.0035660.001117-0.0464240.000003-0.256119江苏省28.4128950.595589-0.000199-0.0986930.0036700.001120-0.0487870.000003-0.265261安徽省28.2334510.597034-0.000191-0.0979740.0036410.001114-0.0483010.000003-0.262304四川省27.6540990.600106-0.000145-0.0823750.0033840.001091-0.0428100.000003-0.240118湖北省27.9804260.598493-0.000175-0.0936850.0035610.001107-0.0466570.000003-0.254930重庆市27.7637950.600036-0.000160-0.0895570.0034860.001098-0.0451360.000003-0.248324上海市28.3713090.597183-0.000204-0.1028360.0037150.001116-0.0499480.000003-0.269003浙江省28.1674300.599399-0.000198-0.1041250.0037080.001108-0.0500020.000003-0.267731湖南省27.7220080.602124-0.000170-0.0969140.0035720.001096-0.0472740.000003-0.255024江西省27.8739340.601576-0.000183-0.1014830.0036440.001100-0.0488040.000003-0.261386云南省27.2272230.606576-0.000135-0.0862240.0033860.001072-0.0436100.000003-0.239092贵州省27.5055030.603668-0.000154-0.0917570.0034850.001087-0.0455030.000003-0.247476福建省27.8644480.602836-0.000189-0.1057920.0036940.001097-0.0500130.000003-0.265559广西壮族自治区27.3703870.606549-0.000157-0.0974150.0035390.001081-0.0469890.000003-0.251309广东省27.5035530.606315-0.000172-0.1037630.0036290.001085-0.0489340.000003-0.259029海南省27.1197730.611254-0.000156-0.1036670.0035840.001070-0.0484270.000003-0.254199

对于各个系数均制图显示,本文只列出废水排放量和文盲比率的系数图,颜色越深代表系数越大。图4强调了一个明显的变化格局,文盲人口比率和废水排放量的系数均为西北部地区高而东南部系数低。

4 结果与分析

(1)城市人口密度和各省文盲人口比率的系数为负,与国民体质均呈现负相关关系(如图5所示)。文盲人口比率对国民体质影响系数最大,大于其他系数,说明一个地区的教育水平对这个地区国民体质影响巨大。改革开放以来,由于经济的快速发展,教育投入增加,文盲人口越来越少,为人们提供更好的教育和体育环境,使得人们生存环境得以改善,人们健身意识也随着受教育水平而增强。随着东、中部地区和西部地区经济差异加大,教育差距进一步加大,造成了东部和中部地区受教育程度高于西部地区。一个地区的生活质量反应这个地区的物质生活状况和精神生活状况,应该包括文化、教育、环境等方面的综合反映。而本研究采用的反应一个地区城市发展的指标,如电力消费、铁路营业里程、出租车数量也由于多重共线性问题被剔除出去。研究发现城市人口密度的系数较小,关联性没有气候等自然因素大。由于城镇人口的体质水平高于农村,城市人口密度和交通条件高的区域的人口平均体质水平就高于城市发展水平低的区域,即城市化率越高,居民体质就越好。

图5 2015年各省城市人口密度与各省文盲比率专题图

(2)由表1可以看出年平均气温的系数和森林覆盖率的系数较大,分别为-0.105792 ~-0.048945和-0.050013 ~-0.031842。说明自然气候条件对国民体质影响较大,且呈现负相关的关系(如图6所示)。年平均温度较高的省份,如四川、云南、广西、贵州等区域的国民体质综合指数均较低。由于气温对人体的运动速度和耐力影响显著,而国民体质综合指数中速度和耐力所占的权重较大,导致气温对国民体质综合指数有较大影响。森林覆盖率较高的南部省份如云南、广西、福建等地区由于距离赤道近,天气炎热,降水量大,虽然气候怡人,但是南方省份人们身材普遍矮小,体质水平也受影响。我国国民体质综合指数高值聚集区主要集中东部沿海地区,由于该地区自然环境优越,气候宜人,经济发达,居民的饮食结构比全国其他省区合理,在日常生活中更注重体育锻炼。表明国民体质受自然环境影响较大。

图6 2015年平均温度和各省森林覆盖率专题图

(3)而本次研究中相对湿度指标与全年降水量指标具有多重共线性,降水量与湿度大的区域基本一致(图7所示),则把冗余指标相对湿度去掉。由于2015年平均湿度大的地区主要是四川、贵州、湖北、湖南、广西、云南等西南部地区,而且湿度均大于70%,人体的相关身体指标在这些区域明显下降,所以这些地区国民体质水平一般,相对湿度对国民体质水平影响不显著。

(4)全年日照时的系数为正,但影响不显著(如图8所示),全年日照时间长的为我国西北部省份如新疆、内蒙、西藏和青海等海拔高的地区。这些地区维度偏高,天气寒冷,气候干燥等因素影响了人们的身体发育,由于气候环境恶劣造成国民体质水平不高。而北京、山西、辽宁、山东等北部平原地区虽然维度偏高,日照时高于南方省市,而这些地区国民体质综合指数均较高,说明一个地区的地势高低对于国民体质也有较大影响,所以研究全年日照时对国民体质的影响并不显著,也说明纬度对于国民体质的影响不显著。

(5)本次研究将各省废水排放量作为解释变量,研究一个地区生态环境与国民体质的影响,发现废水排放量的系数很小,生态环境对国民体质影响并不显著(如图8所示)。国民体质受自然、经济环境影响,随着经济的发展,机动车增加,水土流失,生态环境遭到破坏,雾霾天气增加,雾霾程度的加重,同样也会影响群众的健身活动和国民体质健康发展[14]。由于本次研究仅仅选择废水排放量作为一个地区生态环境指标,不能完全反映一个地区的生态环境,应该加上雾霾天气等因素共同研究。

图8 2015年各省全年日照时和废水排放量专题图

4 结论和建议

(1)通过实证分析得出,我国各省国民体质不仅存在着地理空间上的关联,还存在一定的差异,具有显著的空间效应。国民体质综合指数高的地区为我国东部沿海地区,而中西部地区较低。传统的回归分析方法不能反映参数在不同地理空间的差异性。GWR 模型得到的回归系数有着显著的差异性,表明随着地理空间区域的不同,社会、自然等因素对国民体质的影响程度有着显著的区别。

(2)我国国民体质也存在显著空间异质性。由于采用的研究方法不同,采用的指标数量不同,自然因素对国民体质的影响与相关研究有一定出入,但是,气温对国民体质的影响在自然因素中的主导作用是一致的。自然环境也包含一个地区的空气质量,随着经济的发展,机动车增加,生态环境遭到破坏,雾霾程度的加重,同样也会影响群众的健身活动和国民体质健康发展。本次研究虽然将一个地区的废水排放量作为生态环境因素进行研究,但是发现影响并不显著,空气质量等因素对国民体质的影响将有待于进一步研究。

[1] 赵超,董成鹏.2014年第四次国民体质实地监测中的问题及对策研究[J].湖北体育科技,2015,34(1):25-26.

[2] 仇军.群众体育发展的困境与出路[J].体育科学,2016,36(7):3-9.

[3] 叶瓣.扎实推进全民健身国家战略实现人民群众对幸福美好生活的追求[EB/OL][2017-05-11].中国体育报, http://read.sportspress.cn/zgtyb/html/2017-05/03/content_371729.htm,2017-05-03.

[4] 宋彦李青,王竹影.基于空间自相关分析的中国国民体质综合指数研究[J].山东体育学院学报,2016,32(4):70-76.

[5] 胡利军,杨远波.社会经济发展与国民体质关系的研究[J].体育科学,2005,25(5):3-10.

[6] 周新新.我国国民体质与经济社会发展相关性研究[J].体育文化导刊,2012(11):1-4.

[7] 张天成.中国23 个少数民族18 岁学生生长发育自然环境差异的研究[J].中国体育科技,2010,46(5):134 -138.

[8] 李纪江,蔡睿,何仲涛.我国成年人体质综合水平与自然环境因素的关联分析[J].体育科学,2010,30(12):42-47.

[9] 卢福玲.近十年我国国民体质空间变化及影响因素分析[J].南阳师范学院学报,2014,13(12):52-57.

[10] 王莉,胡精超.健康中国背景下我国各省国民体质影响因素空间异质性[J].武汉体育学院学报,2017,51(2):5-11.

[11] 中华人民共和国国家统计局.中国统计年鉴[M].北京:中国统计出版社,2016:55.

[12] Fotheringham AS, Brunsdon C, Charlton M. The geography of parameter space: an investigation of spatial non-stationary[J], International Journal of Geographical Information Systems,1996(10):605-627.

[13] Fotheringham AS, Brunsdon C, Charlton M.Geographically Weighted Regression:The analysis of spatially varying relationships[M], Wiley, New York.2002:97.

猜你喜欢

文盲国民系数
中国民协在京召开《白胜文集》出版座谈会
《假文盲》的启示
“新文盲时代”
莲 藕
小小糕点师
苹果屋
嬉水
明证
数学潜能知识月月赛
“国民”与民意