城镇成年居民健身活动状况与生活背景因素关联分析研究——以沈阳市和大连市为例
2016-12-02梁成军
梁成军
(辽宁师范大学体育学院,辽宁 大连 116029)
城镇成年居民健身活动状况与生活背景因素关联分析研究——以沈阳市和大连市为例
梁成军
(辽宁师范大学体育学院,辽宁 大连116029)
城镇成年居民的生活背景对其参与健身活动的状况有着或多或少的影响,二者之间应具有一定的关联性。采用问卷调查法和数据挖掘分析法对辽宁省沈阳和大连2地的成年居民进行问卷调查并对调查结果进行数据挖掘分析,旨在探讨城镇成年居民健身活动状况与生活背景因素间的联系。研究发现:城镇居民的健身次数与小区健身设施、健身场所与居住地距离、体育信息关注度、住房情况等因素具有一定的关联性;健身时间长度、健身场所、锻炼方式、健身项目与背景因素关联分析得到的规则体现出它们与年龄阶段相关的特点,部分规则还体现出与性别、自由支配时间等因素的关联性;对于健身消费,年均体育消费1 000元以上者,与收入具有一定的关联性;健身消费与居住地距离健身场所距离的关联也具有较高的置信度和支持度。
城镇成年居民;健身状况;生活背景;关联分析
城镇居民参与健身活动状况可能与其所处的生活背景因素如年龄、生活小区距离健身场所远近、家庭生活环境、生活习惯、职业、学历、收入、病史等存在某种联系。这种联系存在何种健身活动状况与生活背景因素之间,以及联系的紧密程度如何,是一个值得研究弄清楚的问题。该研究结果可为城镇居民群体健身活动及政府职能部门相关决策提供参考辅助,具有良好的现实意义。
现有关于全民健身状况研究主要体现在对某特定职业群体[1]、城镇居民[2]、农民[3]等人群的健身活动研究上。关于特定人群的健身状况研究[4-5]主要是对指定研究对象的锻炼次数、时间、运动项目、场所等方面进行调查研究,并对目前的状态原因进行分析。农村人口全民健身状况研究主要从健身设施、场地、全民健身意识等方面探讨农民全民健身活动的开展状况[6]。目前多数研究报道研究对象选择了城镇居民,主要研究包括不同职业、文化程度、参与健身项目、锻炼时间、场所等方面调查城镇居民的健身状况[7-10],并对目前状况形成的原因进行了分析。但现有研究对调查数据的处理是孤立的,没有将二者关联起来一起进行分析研究。采用数据挖掘方法来发现数据中隐含的规律的文献未见报道。
数据挖掘是从大量的数据中发现事物的某些内在的规律,是多学科多技术相结合的一门新兴产物。统计学对数据的分析处理方法主要是通过建立某种假设,然后采用相关理论验证其假设是否成立,进而达到由样本推断总体特征的目的。该方法对于大量数据中潜在的隐含规律则无法给出判断。数据挖掘采用适当的算法从大量数据中发现隐含的规律或模式,又称为知识发现。它可以发现隐藏于大量数据中事物之间令人感兴趣的联系[11]。
数据挖掘中的关联分析算法是发现大数据中隐含规律的一种算法。因此本研究拟采用Apriori算法建立数据挖掘模型。依据对数据中频繁出现的模式挖掘,找出沈阳市和大连市全民健身活动中健身活动现状与生活背景因素间存在的关联特征。研究通过运用关联分析算法,建立数据挖掘模型,实现对民众参与健身活动状况和生活背景因素间的关联分析,得到决策规则,并对决策规则作出合理的解释。
利用数据挖掘得到的关于民众健身活动与生活因素之间的关联的决策规则,可为居民提高自己在全民健身活动中的参与程度提供参考依据,如职能部门或居民可通过逐步改变某种城镇居民的生活背景因素来培养提高居民的锻炼习惯等。同时也可为政府决策部门在推进全民健身活动中的部分决策提供科学的决策支持依据。
1 研究对象与方法
1.1研究对象 以辽宁省沈阳市和大连市城镇成年居民健身活动状况与生活背景因素之间存在的联系为研究对象。
1.2研究方法
1.2.1问卷调查法 设计反映居民健身情况和生活因素的问卷,并对辽宁省沈阳、大连成年居民进行问卷调查。共发放问卷5 000份(沈阳3 000份,大连2 000份),收回有效问卷4 802份,回收有效问卷率为96%。研究采用专家咨询的方式确定问卷内容设计的有效性;问卷的信度采用重复调查的方式来确定,重复调查样本沈阳、大连各50人,2次调查间隔时间为1周,获得问卷数据后计算前后2次问卷的Kappa系数为0.94,问卷调查数据具有较高的可信度。
1.2.2数据挖掘分析法 采用Apriori算法,对调查问卷所得到的数据进行关联规则数据挖掘分析,并得到决策规则。结合专业知识,对得到的决策规则进行分析与解释。
2 关联分析数据挖掘模型实现过程
根据关联分析数据挖掘的理论,可知其可对多项指标与某项指标之间的关联性进行挖掘分析。考虑到课题研究的内容特征,这里主要研究反映民众健身状况各主要指标与生活背景因素间的关联性。数据挖掘的主要步骤如图1所示,其实现主要以“Weka”为平台来完成数据挖掘工作,最小置信度设置为0.8,最小支持度设置为0.1。
图1 数据挖掘过程
2.1数据采集 首先将问卷的每一个问题的选项进行量化赋值,如A选项赋值为1,B选项赋值2,以此类推。然后将有效的每1份调查问卷结果进行量化后数据输入EXCEL表格。
2.2数据处理 对已输入EXCEL的数据进行检查和处理,并对原始数据进行格式转换,使其在数据格式、数据类型等方面相一致,并符合挖掘工具对数据输入的格式要求。
2.3数据挖掘分析 将预处理后符合要求的数据导入关联分析数据挖掘工具,进行数据挖掘分析,并对数据挖掘产生的关联规则结合专业知识给出合理分析与解释。
3 结果与分析
3.1生活背景因素与锻炼次数关联分析 生活背景因素与健身次数的关联分析结果见表1。规则1表明,生活小区的健身设施比较齐全完好且经常关注体育信息的人群,且其住所距离健身场所的距离在500m以下,参加体育锻炼次数在每周3次以上。规则2揭示每天自由支配时间在5h以上的人群,每周锻炼次数也在3次以上。偶尔关注体育信息的青年租房居住人群,每周锻炼次数少于1次(规则3)。上述规则提示健身场所距离是影响居民健身次数的一个主要因素,居住场所距离健身场地距离在500 m以下者,每周参加锻炼的次数较多。规则提示,居民小区周边规划建设健身场地或设施可促进全民健身运动的开展。自由支配时间长短也是影响民众锻炼次数的因素之一,由规则2可判断自由支配时间长,会使每周锻炼次数增加。体育健身需要时间,人们每天除去工作、休息、家务劳动及必要的社会活动等时间,余下的时间多者,每周锻炼次数会增加,且此条规则与年龄无关。租房住的青年人可能由于工作或生活压力较大的原因,每周参与健身锻炼次数相对较低。
表1 生活背景因素与锻炼次数关联规则
3.2生活背景因素与锻炼时间长度关联分析 表2是生活背景因素与锻炼时间长度关联分析数据挖掘得到的主要规则。规则1、2表明偶尔关注体育信息的中年人,每次锻炼时间长度在30~60min;每天自由支配时间在3h以下的中年人,生活小区有些简单健身设施,每次锻炼时间也在30~60min左右,上述规则置信度均为1。规则3则说明,对体育信息偶尔关注的中年人群,居住地距离健身场所距离在500~1 000m之间,锻炼时间长度在30min以下。中年人是社会的中坚力量,大多肩负工作中的相对重要岗位,加上家庭生活责任等多种因素致使其自由支配时间相对较短,影响了锻炼时间长度;另一方面,和青年人相比,体能相对下降,选择运动项目时中年人不会选择老年人运动项目,一般是自己青年时喜爱的运动项目的延续,运动强度一般而言相对较高,也是导致运动时间与青年人相比缩短的一个原因。不太关注体育信息的中年人,住所离健身场所距离相对较远,锻炼时间也缩短,可能原因是住所到健身场所的距离需花费较长时间,加上中年人群自由支配时间较短,客观上制约缩短了锻炼时间;主观上这类人群由于大多不关注体育信息,部分反映出其体育健身观念与意识还不够强烈,导致锻炼时间较短。而年龄在60岁以上的人群,自由支配时间在5h以上者,每次锻炼时间则在1h以上,规则的置信度为0.93(规则4)。老年人自由支配时间长,所选运动项目强度一般不高,既健身又娱乐,运动时间相对长些。规则5表明未婚青年人每次锻炼时间则较长,一般在1h以上,规则置信度为0.94,支持度为0.16。由前述分析可知,部分青年人可能由于工作生活压力较大的原因使得每周锻炼次数较低,为了保证有个健康体魄,青年人每次锻炼时间相对较长。
表2 生活背景因素与锻炼时间长度关联规则
3.3生活背景因素与锻炼场所关联分析 生活背景因素与锻炼场所关联分析数据挖掘结果见表3。规则1表明老年人一般选择在小区周边空地广场进行健身活动。自由支配时间较短的中年人群,也选择在住宅附近进行锻炼(规则2)。中等收入中年人,自由支配时间在3~5h/d者,一般选择在公园、校园进行锻炼(规则3)。收入较高的中年人群,小区无健身设施,一般选择到收费场所进行健身,规则的置信度为0.95,支持度为0.117(规则4)。规则5、6则提示青年人健身场所相对不单一,一般是有多种健身场所可供选择。上述规则表明,健身场所的选择体现出年龄特点,中等收入中年人和老年人群健身场所大多选择在住宅小区附近的空地广场,收入较高的中年人部分会选择收费场馆;青年人则健身场所多样化。
表3 生活背景因素与锻炼场所关联规则
3.4生活背景因素与健身项目关联分析 表4为生活背景因素与健身项目之间的关联分析结果。偶尔关注体育信息且收入在3 000元以下的中年人群,锻炼方式一般为走步、跑步(规则1)。规则2说明不太关注体育信息的60岁以上女性,健身项目主要是健身操、舞蹈和秧歌,规则具有较高的置信度与支持度。经常关注体育信息,且有自己的住房的青年人,经常采用多种健身项目进行健身锻炼(规则3)。而自由支配时间在3~5h/d的中年人,锻炼项目采用多种项目相结合的方式(规则4)。上述规则均包含有年龄特征,反映出健身项目选择具有年龄特点,青年人和自由支配时间较长的中年人健身项目多样化,老年女性则以健身操、舞蹈和秧歌为主。
表4 生活背景因素与健身项目关联规则
3.5生活背景与锻炼方式关联分析 生活背景因素与锻炼方式相关联得到的规则见表5。规则1表明自由支配时间充足,居住小区无健身设施的老年人群,多采用集体组织方式锻炼。职业为工人,具有自有住房的中年人健身方式则多采用个人方式(规则2)。规则3提示经常关注体育信息的未婚青年人,锻炼方式一般选择约好友健身锻炼。居住小区有简单健身设施,健身场所距离居住地500m以下,家庭其他成员身体健康的人群,大多采用集体方式锻炼(规则4)。上述规则表明,居民健身方式体也现出年龄特点。由前述分析可知青年人喜爱参与的运动项目一般是多种运动项目,运动强度相对较高,这些运动项目大多具有一定的对抗性,需要对手或搭档的参与,因此大多约好友进行锻炼。老年人由于时间充足,易于组织各种形式的健身活动队伍,并且集体方式锻炼有助于语言交流,对于接触老年人群的孤独感有益,因此大多选择集体健身方式;居住地距离健身场所距离较近的居民,大多选择集体方式健身,说明居住区周边健身场地建设对鼓励居民群体健身是有帮助的。
表5 生活背景因素与锻炼方式关联规则
3.6健身状况与体育消费关联分析 通过对问卷体育消费和健身状况数据的关联规则数据挖掘分析,得到如表6所示有意义的规则。规则1提示健身锻炼大多利用晚饭后时间进行健身走或者跑步健身的老年群体基本不进行体育消费。分析原因主要是该类人群健身锻炼不需要专用装备,场地也不需付费,因此基本上无专项消费。规则2揭示健身场所距离住处500m以下者,体育消费年均501~1 000元之间,规则置信度为0.86,支持度为0.336。这反映出健身场所与住所之间的距离远近与体育消费有一定的关联性。这条规则意味着加大居民区周边的体育场地设施建设,对促进体育消费是有利的。如居民区有篮球场地,会引导适龄居民群体选择该项目进行健身,促进篮球鞋、运动服等消费;有羽毛球、网球场馆场地的则会促进球拍、球、球鞋等的消费等等。规则3表明,高收入群体一般选择收费健身场馆健身,年度体育消费较高。而中低等消费和基本无体育消费群体与收入没有关联性。规则4则提示,偶尔进行短时间健身锻炼群体,基本不进行体育消费。
表6 生活背景因素与健身消费关联规则
4 结 论
运用关联规则数据挖掘技术可实现对居民健身状况和生活背景因素的关联分析,并能够得到一些有意义的规则。主要结论如下:城镇居民住宅距健身场所较近,且经常关注体育信息的人群每周锻炼次数较多。偶尔关注体育信息且住宅距离健身场所较远的中年人每次锻炼时间较短;自由支配时间较长的老年人群和未婚青年人群每次锻炼时间较长。老年人群和每天自由支配时间较短的中年人群一般选择在住宅周边健身,月收入较高的中年人群一般选择收费场馆。老年女性一般选择健身操、舞蹈类项目健身,青年人和自由支配时间较长的中年人健身项目多样化。青年人一般选择约好友健身,老年人一般选择集体方式锻炼。老年健身群体基本无体育消费,中等体育消费与收入没有体现出关联性,体育消费较高群体一般收入较高。
[1] 王然科.福建省高校体育教师健身现状调查分析[J].吉林体育学院学报,2011,27(5):111-114.
[2] 陈建才.影响广州居民健康状况的主要生活方式认知因素分析[J].体育学刊,2013,20(4):71-74.
[3] 宁亮生,曾庆云.江西省农民健身状况调查与发展思路构想[J].成都体育学院学报,2005,31(1):35-39.
[4] 朱明.北京体育大学教师身体健康状况及影响因素的调查研究[D].北京:北京体育大学,2009.
[5] 蔡建辉.高校教师健身状况调查及改善对策[J].体育学刊,2003,10(2):61-62.
[6] 姜喜平,黎宇,徐娥.休闲环境下如何提高云浮地区全民健身状况[J].南京体育学院学报(自然科学版),2012,11(2):139-141.
[7] 周玫.沈阳市北陵周边地区中老年妇女健身状况的调查与分析[J].沈阳体育学院学报,2007,26(1):62-64.
[8] 张平.四川省小城镇健身运动发展状况调查分析[J].成都体育学院学报,2010,36(2):63-65.
[9] 李鹏.南京市非公有制经济企业职工参与全民健身状况的研究[J].南京体育学院学报(自然科学版),2010,9(4):149-151.
[10] 屈东华,史有光,黄光辉,等.河南省城市女性体育健身状况调查[J].中国体育科技,2008,44(3):71-76.
[11] Pang-Ning Tan,Michael Steinbach.Vipin Kumar,著.数据挖掘导论[M].范明,范红建,译.北京:人民邮电出版社,2006:1-7.
Research on Association Analysis between Exercise States and Living Background Factors in Urban Adult Residents——Taking Shenyang and Dalian City as an Example
LIANG Cheng-jun
(College of Physical Education,Liaoning Normal University,Dalian 116029,Liaoning China)
The living background has more or less influence on exercise states of urban adult residents, and that means some association should be have between them. The main purpose of this research is to explore the association between exercise states and living background of urban adult residents. The questionnaires were performed to explore exercise states and living background of urban adult residents in Shenyang and Dalian cities. The data mining technology was adopted to analyze the survey data. It found that: The exercise times of urban adult residents is associated with the factors of community fitness facilities, the distance between fitness place and residence, the attention on sports information, housing conditions etc. The association analysis rules indicate that exercise states index, which including Length of exercise time, fitness place, Exercise mode, sport item, are all associated with age stage, and some rules are also indicate exercise states associated with gender, length of free time etc. It is associated with income that the consuming on sports of urban adult residents is more than 1000 RMB; The rules also accompany with the higher confidence and support indicate that consuming on sports associated with the distance between fitness place and residence.
urban adult residents; exercise states; living background; association analysis
G811.4
A
1004 - 7662(2016 )05- 0010- 05
2016-03-24
梁成军,讲师,博士,研究方向:体育工程。