合格献血者的人口学特征“可视化”应用初探
2021-04-09钟炽辉梁自领陈少彬叶群弟何子毅郭鹏豪陈庆恺
钟炽辉 梁自领 陈少彬 叶群弟 何子毅 郭鹏豪 陈庆恺
【摘要】 目的 通过挖掘某市献血者的基本信息,转化为“可视化”的人口学特征,为制订个性化的献血者招募策略提供参考依据。方法 整理2018年1月至2020年6月共125 459名血液检测合格的献血者信息,将不同年龄、性别、职业、献血次数和献血地点等数据转化为“可视化”的图表加以分析。结果 125 459名合格的献血者中,男性与女性献血者在年龄分布上不同(P<0.01),重复献血者在34~42岁年龄段的比例最高;不同职业的献血者以普通员工的比例最高,且“80后”的普通员工最多;该市各行政区域的献血人数不同,其中水乡片区最少,献血者主要分布在滨海片区、城区片区、东南部片区及松山湖片区,献血1次的普通员工最多。结论 “可视化”图表分析可直观明了概括该市献血人群的基本特点,通过对献血者不同特征指标分析,为挖掘“潜在献血者”和制订个性化精准招募对策提供直观的参考依据。
【关键词】 献血者;可视化;人口学特征;热力图
中图分类号:R193.3 文献标志码:A DOI:10.3969/j.issn.1003-1383.2021.02.008
【Abstract】 Objective To provide reference for the development of personalized blood donor recruitment strategy by mining the basic information of blood donors in a city and transforming it into visualized demographic characteristics. Methods From January 2018 to June 2020, the information of 125 459 blood donors who passed the blood test were collected, and the data of different ages, genders, occupations, blood donation times and blood donation locations were transformed into visualized charts for analysis. Results Among 125 459 qualified blood donors, male and female donors were different in age distribution (P < 0.05). Repeated donors had the highest proportion in the age group from 34 to 42 years. Ordinary employees had the highest proportion in the donors of different occupations, and most of them were the post-80s. The number of blood donations were different among different administrative areas in this city. Among them, blood donors in Shuixiang area was the least. Donors were mainly distributed in coastal area, urban area, southeast area, and Songshan Lake area, and ordinary employees who donated blood once were the most. Conclusion Visualized chart analysis can intuitively summarize the basic characteristics of donors in this city. Through the analysis of different characteristic indicators of blood donors, it can provides an intuitive reference for mining potential blood donors and formulating personalized and precise recruitment strategies.
【Key words】 blood donors; visualization; demographic characteristics; thermodynamic diagrams
“可視化”在现代化的大数据信息技术转化成果中应用广泛[1]。近年来,综合分析采供血过程中形成的大量数据并进行整理,从中找出有意义的指标,转化为“可视化”的图形或指标已成为大型血站数据分析和应用的发展趋势。本站利用大数据分析等手段在制订献血者精准招募策略方面有一定基础,但应用效果还需加强。为了掌握不同类型献血者的基本特征,提高献血者的招募效率,解决季节性、结构性和紧急性的供血紧张问题,利用数据分析和图表制作技术分析了2018年以来血液检测合格的献血者在年龄、性别、职业、献血次数及献血地点等方面的特征,直观地显示分析结果,为制订个性化的招募策略提供参考,现将结果报道如下。
1 对象与方法
研究对象 选取本站2018年1月至2020年6月血液检测结果为“合格”的献血者125 459名,其中男性78 939人, 平均年龄(35.81±9.15)岁,女性46 520人,平均年龄(33.88±9.27)岁。
1.2 资料来源 通过“现代血站信息管理系统 SHINOW 9.0”查询该部分献血者的基本数据信息,包括年龄、性别、职业、献血次数和献血地点等。
1.3 方法 采用SPSS 19.0软件统计描述性分析不同年龄、性别、职业、献血次数和献血地点等数据特征;可视化图表(热力图)制作采用Microsoft Office Excel软件的色阶进行制作(红色表示献血人数最大值,黄色表示50%中间值,绿色表示献血人数最小值);不同组间分布的比较采用Kolmogorov-Smirnov秩和检验,检验水准:α=0.05,双侧检验。
2 结 果2.1 2018~2020年献血者的年龄及性别特征 125 459名合格献血者(其中初次献血者64 087人,重复献血者61 372人)性别和年龄的分布情况不同(Z=0.590,P<0.01),分别在22~24岁和31~42岁年龄段出现了峰值,见图1;初次献血者年龄峰值出现在21~24岁年龄段,见图2;而重复献血者的年龄峰值则出现34~42岁年龄段,见图3。
2.2 不同性别、年龄、职业、献血地点和不同献血次数的热力图分布 按不同职业和年龄段分布显示,男、女性献血者主要以“80后”的普通员工为主(红色部分),“90后”的普通员工次之;在学生群体中,“90后”的献血者居多;不同性别献血者在不同职业的分布差异无统计学意义(Z=0.300,P=0.759),见图4;不同职业的献血者在不同献血地点的分布仍然以普通员工为主(红色部分),但不同性别献血者在献血地点的分布差异无统计学意义(Z=0.500,P=0.474),见图5;按职业和性别分类,不同职业的初次和重复献血者人数分布不同,但均以普通员工的人数最多(红色部分),不同性别的献血者,其献血次数的分布差异无统计学意义(Z=0.429,P=0.153),见图6。
3 讨 论
采供血作为无偿献血主要业务工作,在工作中产生大量的原始数据或资料。这些数据资料包括了献血者与血站业务相关的各类信息,这些数据的结构复杂、信息量大、产生和叠加速度快,具有一定的潜在利用价值,但目前国内尚未大规模地进行针对性的研究和利用,也没有建立一种标准的数据模型。国内血站的信息管理系统多种多样,造成数据结构和类型的复杂化,使得全国血站的大数据分析应用较难铺开。可视化分析是近年来兴起的利用人类视觉感知能力,交互式探索的方式来分析数据的一种手段,可以在大规模、高维度且信息密度稀疏的数据分析过程中融入人的认知能力[2]。它通过一定的算法或模型进行聚类分析、数据挖掘和结果输出图形的呈现,为决策者提供直接的参考依据[3~4]。因此,如何通过数据可视化技术对献血者的信息进行分析和应用,是开展无偿献血者精准招募的一种应用趋势,具有很好的研究价值。本研究尝试利用一段时间内的无偿献血者的人口学信息,进行数据的分类和比较,制作简单的柱状图和热力图,直观地呈现出献血者的基本特征,为本地区制订无偿献血者的精准招募策略提供参考信息。有研究表明,热力图可视化分析方法能实时对监测数据进行分析,得到对应数据的实时分布情况,能更形象、快速、直观地展示宏观的变化趋势[5]。
从图1、图2、图3的数据结构及分布趋势来看,不同性别和年龄的献血者分布情况不同,图1包括了本研究所选择的所有献血者年龄及性别的特征信息,在22~24岁和31~42岁年龄段出现了两个峰值;图2、图3则显示初次献血者和重复献血者的年龄峰值则分别出现在21~24岁和34~42岁,说明了初次献血者以年轻人为主,而重复献血者以青壮年为主,出现了年龄结构化不平衡的现象,提示了在年轻的重复献血者招募方面存在较大的提升空间,需要格外重视,要充分挖掘年轻献血者的潜力,特别是注意新增献血者队伍特征的分析[6],以促进重复献血者队伍的年轻化和不断壮大。图4显示:不同性别、职业和年龄段分布的献血者,以“80后”的普通员工为主,“90后”的普通员工次之;在学生献血者群体中,以“90后”为主。随着近年来无偿献血进企业、进高校、进社区工作的稳步推进,企业员工及高校学生已成为我市无偿献血的主力军,每年的献血人数占全市献血总人数50%以上,是需要高度重视的两个群体。从图5、6可以看出,本地区的重复献血者比例(48.92%)略低于初次献血者比例(51.08%),不同献血区域和不同职业的分布也有所不同,在本市各行政区域内,水乡片区的献血者人数最少,献血者主要分布在滨海片区、城区片区、东南部片区及松山湖片区,献血1次的普通员工最多,初次献血者和重复献血者均以普通员工为主,说明了我市在献血者招募方面存在区域发展不平衡的情况,这可能与本地区的经济发展和社会人口结构因素有关[7]。
因此,不同的年龄段、不同职业、不同行政区域均是目前本地区献血者构成差异的重要因素,这提示我们,在无偿献血工作中,应当创新宣传模式,拓宽宣传途径,营造良好的社会氛围,根据不同职业、不同的群体特点制订针对性的招募策略,为献血者提供优质服务,除了巩固发展好滨海片区、城区片区、东南部片区及松山湖片区献血者队伍的以外,还可以针对性的为水乡片区制订适宜的招募方式,并把全市“90后”及“00后”年轻献血者作为提升重復献血率的重点招募的对象,最大限度减少献血者流失,保留献血者[8]。
综上,初步探讨大数据分析和可视化方法在无偿献血者招募中的应用,通过“可视化”图表分析可直观明了概括本市合格献血人群的基本特点及存在的问题,通过对献血者不同特征指标分析,可以为挖掘“潜在献血者”和制订个性化精准招募对策提供直观的参考依据。不足之处是仅分析了血液检测合格的献血者人群,有待今后对全部献血者进行可视化研究。
参 考 文 献
[1]姜赵,谢晓伟.基于Python的数据可视化应用与研究[J].科学技术创新,2020(30):88-89.
[2] 张雨薇.基于学生行为的成绩变化可视化分析与研究[D].成都:电子科技大学,2020.
[3] 刘立斌.大数据的研究及其应用[J].江苏通信,2017,33(4):63-65.
[4] 蔡江辉,杨雨晴.大数据分析及处理综述[J].太原科技大学学报,2020,41(6):417-424.
[5] 詹显军,裴涛涛,周济兵.基于热力图的地铁车站变形可视化分析[J].现代隧道技术,2020,57(1):65-69.
[6] 林彩霞,孔福仙,冯晴,等.新增成分献血人群献血行为特征分析及有效保留[J].中国输血杂志,2018,31(7):782-784.
[7] 杜志威,李郇.基于人口变化的东莞城镇增长与收缩特征和机制研究[J].地理科学,2018,38(11):1837-1846.
[8] 褚晓凌.福州地区献血者重复献血行为特性研究[J].中国输血杂志,2020,33(9):956-959.
(收稿日期:2020-11-18 修回日期:2021-01-31)
(编辑:梁明佩)