Apriori算法分析我国离结比
2019-09-10武佳琪
武佳琪
摘 要:婚姻的本质是一种人际关系,是两个亲密的人搭建的关系连接。但近年来,我国离婚率逐步升高,如今已成为一种引人重视、令人不安的社会现象。离结比是对离婚率的一种特征描述,本文采用Apriori算法對所采集的数据进行处理,探究其中相关因素。
关键词:Apriori算法;离结比;离婚率
1离结比影响因素
现今的学术研究中对离婚率有多种特征描述,其中最主要的为离结比,即为单位时间内人们离婚登记对数与结婚登记对数之比。随着经济体制的改革和社会的进步发展,人们的婚姻关系被多种因素综合作用。
▲流动人口规模的扩大给许多婚姻家庭带来很多不稳定因素,如不经常的沟通会导致各种家庭矛盾,以至于双方矛盾被放大,从而很可能导致离婚。
▲子女永远是婚姻中重要的纽带,如果一个家庭里的子女数量较少,那么双方在处理婚姻问题的过程中来自孩子的牵绊更少[1],这也是部分地区的离结比高于其他地区的重要原因。
▲新时代女性越来越重视知识的学习,从而使其经济逐步走向独立,在婚姻中受感情以外因素的制约越来越小。因此,当双方赖以维系的感情基础消磨殆尽时,女性因为经济原因委曲求全的可能性降低,而更倾向于结束婚姻关系[2]。
2Apriori算法应用
2.1事务数据库
事务数据库的定义是生成关联规则的基础,根据搜集的数据材料,将教育质量排到全国前15名(事件a)、生育率小于等于1.050(事件b)、离结比超过45%(事件c)作为事件,经过筛选后得到各个省份的事务,建立如下表所示的事务数据库。
表1事务数据库
地区 教育质量排名 生育率 离结比
北京 1 0.707 48%
江苏 2
上海 3 0.737 49%
湖北 4
山东 9
广东 5
浙江 7 1.017
辽宁 10 0.741 54%
陕西 6
2.2频繁项目集
定义1:对于项目集I和事务数据库D,在T中所有满足指定的最小支持度的项目集称为频繁项目集,并且在其中挑选出所有不被其他元素包含的频繁项目集称为最大频繁项目集。
充分考虑各个地区的具体情况,将事务数据库的最小支持度定义为6,根据最终整理好的事务数据库,得到minsupport=6/16,生成候选集并通过扫描数据库首先得到支持数C,然后挑选出minsup_count≥6/16的项目集组成频繁项目集L。
▲C1={(a,15),(b,7),(c,7)};L1={a,b,c}。
▲C2={(ab,7),(ac,7),(bc,6)};L2={ab,ac,bc}。
▲C3={(abc,6)};L3={abc}。
▲C4=∅;L4=∅。
得到所有的频繁项目集为{a,b,c,ab,ac,bc,abc},得到最大频繁项目集为{abc}。下面跟踪关联规则的执行过程(设minconfidence=70%)
定义2:对于事件A与事件B
关联规则的支持度:
support=P(A∪B) (1)
关联规则的置信度:
confidence=support=P(A∪B)/support(A) (2)
表2关联规则生成过程示意
序号 lk xm-1 confidence support 规则(是否是强规则)
1 abc a 40% 70% a→abc(否)
2 abc b 85% 70% b→abc(是)
3 abc c 85% 70% c→abc(是)
4 abc ab 85% 70% ab→abc(是)
5 abc ac 85% 70% ac→abc(是)
6 abc bc 100% 70% bc→abc(是)
每个地区离结比不同,影响离结比的因素也有多种,有点地区受人文因素影响,也有地区是因为人口流动等,由上表可以得出生育率和受教育水平与地区的离结比有着较强的关联度。
3结束语
家庭是社会和谐稳定的基础,如果家庭不稳定将会影响社会秩序。离婚的现象随着社会经济的发展不断涌现,这可能会解除一些人的痛苦,但可能会导致房价的涨跌、社会生育率的高低甚至是老龄化的快慢,现如今离婚已不再是个人问题, 而是一个社会问题[3]。
参考文献
[1]刘娟.从责任角度探究农村离婚的原因[J].法制与社会,2017(22):156-157.
[2]李雨潼,杨竹.东北地区离婚率特征分析及原因思考[J].人口学刊,2011(03):47-52.
[3]付琳,王丽华.降低我国离婚率的立法对策探析[J].法制与社会,2013(31):280-281.