APP下载

基于Python 的人口普查数据可视化分析

2022-02-07邓慈云余国清

智能计算机与应用 2022年12期
关键词:人口数性别比出生率

邓慈云,余国清

(湖南信息职业技术学院,长沙 410200)

0 引言

时下,大数据已逐渐成为技术热词,对数据进行统计分析和可视化的工具也陆续问世。Python 语言由于其简洁性、易读性、可扩展性,以及具有丰富的标准库,备受学术界众多科研机构的关注与青睐。Pandas 是Python 的一个数据分析包,提供了大量快速便捷地处理数据的函数和方法。Pyecharts 是一款用于生成Echarts 图表的类库,可以通过图形参数配置轻松绘制精美的图表。而在社会经济和信息技术飞速发展的同时,2021 年7 月20 日,中共中央、国务院印发《关于优化生育政策促进人口长期均衡发展的决定》,宣布实施三孩政策并配套实施积极生育支持措施。国内人口在持续增长的同时,却也表现出人口老龄化速度变快、出生率断崖式下降和男女性别比失衡等问题,一直引起社会各方的高度重视。

目前研究人口问题的相关文献很多,但是对于人口普查数据进行可视化展示和分析探讨的较少。鉴于此,本文以第七次人口普查数据为研究对象,选用Python 语言、Pandas 库和Pyecharts 可视化工具对总人口数及增速、男女人口数及性别比例和城镇乡村人口分布等情况进行了直观分析展示,以期为未来有关研究工作提供参考基础。

1 整体设计

1.1 数据来源

本文主要选取国家第七次人口普查结果数据中的总人口、人口性别结构、人口年龄结构和人口出生率等作为主要研究对象。采用的数据来源于国家统计局的开源数据。在国家统计局官网(https://data.stats.gov.cn/index.htm)年度数据中人口类别获取上述普查数据结果,并以csv 格式下载保存数据到本地。

1.2 流程设计

采用Python 技术可视化分析的过程为:首先,利用Pandas 库读取csv 文件;然后,筛选和处理数据;最后,使用Pyecharts 库对数据进行可视化。整个项目流程如图1 所示。

图1 项目流程图Fig. 1 Flow chart of the project

2 可视化过程实现

2.1 数据读取

本文使用总人口数、人口出生率、死亡率和自然增长率及人口年龄结构等数据信息,包含的数据字段有:年末总人口、男性和女性人口、城镇和乡村、人口出生率和0~14 岁人口等。数据完整性和数据质量均良好,只需删除每个文件中表头内容和多余的补充说明文字即可。利用Pandas 库读取csv 数据文件,因篇幅有限,仅介绍其中一个数据文件的读取、筛选和处理。首先,利用方法read_csv()读取csv文件。相关代码如下:

2.2 数据筛选和处理

从读到的文件数据中,通过筛选及相关处理后才能获得可以用于绘图的数据。如筛选出年末总人口数后,将其转换成列表,并去掉字段说明。因考虑到绘制的图表便于用户阅读,故采取年份按从低到高排列。为配合这一设计,调用方法reverse()将年末总人口数列表中的元素反向排序,并将列表元素类型转换成float。相关代码如下:

2.3 绘制和保存图表

本文绘制了男性、女性人口对比和城镇、乡村人口对比等6 张图。为了呈现总人口数的变化和增长率的差异,绘制了双坐标轴图,将柱状图和折线图组合在一起。研发代码具体如下:

3 实验结果与分析

3.1 男性、女性人口及性别比分析

从性别结构看,男性人口高于女性人口,性别比都近似维持在105 左右(以女性为100),但这个数据已经逐渐在往好的方向转变。其中,2012 年男性人口69 660 万人,女性人口66 262 万人,性别比为105.13;2021 年男性人口72 311 万人,女性人口68 949万人,性别比为104.88,如图2 所示。

图2 男性、女性人口对比Fig. 2 Proportion of male and female

3.2 城镇、乡村人口结构分析

从城乡结构看,中国城镇人口数量长期占据中国人口总数50%以上的比例,尤其自2017 年起占比达到60%以上,且逐年攀升。2021 年城镇人口达到91 425 万人,比上年末增加1 205 万人,城镇人口占总人口比重为64.72%,比上年末提高0.83 个百分点;乡村人口数量49 835 万人,减少157 万人,比上年末下降了0.83 个百分点,如图3、图4 所示。

图3 城镇、乡村人口结构Fig. 3 Composition of urban and rural populations

图4 城镇、乡村人口占比Fig. 4 Proportion of urban and rural populations

3.3 人口年龄结构分析

从年龄构成看,2020 年中国0~14 周岁的人口25 277 万人,占总人口的17.9%;随着老龄化进程的加剧,15~64 周岁劳动年龄人口数量和比重呈双降态势。劳动年龄人口数量从2012 年的100 718 万人下降到96 871 万人,占比从2012 年的74.1%持续下降到68.6%。劳动年龄人口规模及比重下降的趋势十分明显。65 周岁及以上人口从2012 年的12 777万人增加至19 064 万人,占比从2012 年的9.4%上升到13.5%。老年人口比重增幅均呈现不断上升的趋势,如图5、图6 所示。

图5 人口年龄结构Fig. 5 Composition of populations age

图6 人口年龄占比Fig. 6 Proportion of populations age

3.4 人口出生率和死亡率分析

2012 年中国人口出生率为14.57‰,是近10 年来出生率最高的一年,然后逐年下降,至2021 年人口出生率跌至7.52‰。2014 年和2016 年人口出生率相比上一年有小幅的增加,其中,2014 年和2016年人口出生率分别为13.83‰和13.57‰。2012~2020 年期间,人口死亡率整体呈缓慢下降态势。2012 年人口死亡率7.13‰,2020 年人口死亡率7.07‰,较2012 年下降0.06‰,但2021 年人口死亡率有明显上升,达到7.18‰,与这一年的人口出生率仅相差0.34‰,如图7 所示。

图7 人口出生率和死亡率Fig. 7 Birth rate and mortality

4 结束语

本文基于第七次全国人口普查数据,利用Python中的Pandas 对男性、女性人口等数据进行读取、筛选和处理后,使用Pyecharts 对男性、女性人口对比和城镇、乡村人口对比、人口出生率和死亡率等方面总体情况进行分析。通过可视化,有助于直观地了解国内人口实情,后续还将对其做进一步的完善。

猜你喜欢

人口数性别比出生率
确定代表名额按户籍人口数还是常住人口数
No.5 2020年出生率创新低
出生率创新低,都是压力惹的祸吗?
基于BP神经网络的吉林省GDP预测研究
房价上涨抑制英国出生率:每年少生7000多名婴儿
中国出生人口性别比“七连降”
韩国女性公民社会组织参与出生性别比治理的经验与启示
2015年我国60岁以上老年人将达到2.16亿
中外人口之趣
为什么要维护男女性别比的自然平衡?