APP下载

基于多种预测模型的阿片药物分布研究

2019-06-27彭巧娟周毅刘娟

现代计算机 2019年13期
关键词:阿片肯塔基州海洛因

彭巧娟,周毅,刘娟

(1.南华大学计算机学院,衡阳421000;2.南华大学资源环境与安全工程学院,衡阳421000;3.南华大学化学化工学院,衡阳421000)

0 引言

(1)问题背景

阿片类药物[1]就是指从罂粟中提取的树脂渗出物,加上人工半合成的麻醉、镇痛性药物,具有一定的成瘾性。它是癌症患者和其他重症患者遭受极度痛苦时为缓解疼痛采用的手段,本应当被严格限制使用,如今在美国却唾手可得,由此引发出一场关于使用阿片类药物的全国性危机。考虑到药物的传播具有速度快、范围广等特点,同时阿片类药物的滥用存在多个方面的原因,如何正确估算和预测阿片类药物随时间的传播和特点以及分析阿片类药物的使用如何达到目前的水平,将为药物管理部门监控和管理阿片类药物和缉毒署推进禁毒情报工作等提供理论依据。

(2)已有的研究

2011 年4 月,白宫提出国家处方药滥用预防计划[2],通过宣传教育和大数据追踪监控试图改善阿片类药物滥用的现况。2016 年3 月,美国医学会杂志(JAMA)发布了CDC[3]最新版阿片类药物治疗慢性疼痛使用指南,对药物利弊等作了详细说明,一定程度上能提高病人的用药风险意识[4]。但阿片类药物滥用问题的控制并非一朝一夕,在各方利益博弈中,阿片类药物滥用问题的解决之路依旧困难重重。

(3)研究目标

①目标一

建立一个数学模型,描述五个州(俄亥俄州、肯塔基州、西弗吉尼亚州、弗吉尼亚州、宾夕法尼亚州)及其县之间报告的合成阿片和海洛因事件(案例)随时间的传播和特点。使用该模型,确定五个州中每一个州可能已经开始使用特定阿片类药物的任何可能位置。

②目标二

关于阿片类药物的使用如何达到目前的水平,是谁在使用/滥用它,以及为什么阿片类药物的使用尽管存在已知的危险,但仍然持续存在,使用或趋势是否与美国人口普查提供的任何社会经济数据有某种关联?

③目标三

找出一个应对阿片危机的可能策略。

1 符号与名词解释

表1

2 模型的建立与求解

2.1 目标一:模型的建立与求解

(1)各州合成类阿片随时间变化的趋势

①变化趋势

为了研究五个州中每一个州合成类阿片类使用量的变化,我们将2010-2017 年各州合成类药物的使用量筛选出来,进行散点分析,得到它们的变化趋势图,如图1 所示:(数据来源于https://www.cdc.gov/features/confrontingopioids/index.html)。

图1 2010-2017年各州合成阿片类药物的综合计数

②图像分析

我们可以发现俄亥俄州的阿片药物总使用量随时间呈上升趋势,宾夕法尼亚州的阿片药物总使用量随时间呈稳步下降趋势,肯塔基州和西弗吉尼亚州的药物使用量趋势相对稳定,弗吉尼亚州的药物使用量随时间呈上下波动趋势,我们对各州药物总量随时间的变化进行GM(1,1)模型预测,得到各州的药物总量的变化规律。

以俄亥俄州为例。

对原始数据x(0)作一次累加,得:

x(1)=(70999,142881,227696,321443,422866,532016,647292,766641)

构造数据矩阵B 及数据向量Y,有:

计算:

于是得到â=0,b̂=1.0e+0.4*6.9626

建立模型:

求解,得:

③变化趋势方程

最终得到各州的合成类阿片总量随时间的变化规律(其中,为了保证预测模型的准确,我们舍弃了弗吉尼亚州2013 年的突增点):

俄亥俄州(OH):xt=723614.0e0.0831486t-661916.0

肯塔基州(KY):xt=1532144-1503188e-0.0169621t

西弗吉尼亚州(WV):xt=67156.8-59390.8e-0.164836t

弗吉尼亚州(VA):xt=5114977-5075811e-0.00625324t

宾夕法尼亚州(PA):

xt=1512155-1434277e-0.0499548t

(2)形成变化趋势的分析

我们研究这五个州的地理位置发现,这五个州以靠近水源的俄亥俄州为起点,向四周发散。其中,俄亥俄州是两大交通动脉70 号和75 号公路交汇枢纽,是墨西哥毒枭分销毒品和禁药最理想的地点,同时也是阿片类药物流通的极佳地点。宾夕法尼亚州同样作为一个靠近水源的州,它拥有十分发达的交通运输系统,该州阿片类药物的使用量相对较高。肯塔基州、西弗吉尼亚州和弗吉尼亚州由于地处山区,交通相对来说不太便利,因此,这三个州阿片类药物的使用量相对较低。

图2 五个州的地理分布

(3)各州及其县之间海洛因随时间的传播和特点。

①模型的建立与求解

以肯塔基州海洛因的使用量为例。我们先对肯塔基州每个县的海洛因总数和对应县的阿片类药物总量进行标准化处理:

我们对标准化后的数据与县代码进行处理,以县代码为x 轴,以标准化数据为y 轴,得到海洛因在每个县内的波动情况如图3。

图3 某县(用县代码表示)海洛因的比例

通过图像我们可以发现肯塔基州的前125 个县内海洛因所占比重波动特别明显,后面100 多个县虽然也存在这种情况,但波动很小,我们可以猜测海洛因主要存在于编号为75-125 的县内,并以此为中心,向四周扩散。

我们将年份、县代码、县海洛因物质总量建立出一个数据集,对肯塔基州各县的数据用一个矩阵进行存储,当我们需要进行预测时,只需输入该县的县代码,即可得到该县近几年海洛因数据的预测值。

记 原 始 时 间 序 列 为 aFt(t=2010,2011,…,2017),对于时间序列样本aF2010,aF2011,…,aF2017,记aFi的秩为Ri=R(aFi),考虑变量对(t,Rt),t=1,2,…,8 的Spearman 相关系数qs,有:

为了构造平稳序列,对序列aFt(t=2010,2011,…,2017)作一阶差分运算bFt=aF(t+1)-aFt,得到序列bFt(t=2010,2011,…,2017)。从时间序列bFt的散点图,我们可以对每个县建立其预测模型:

F:表示县编号,t:表示时间,cF1,cF2:各县的待定参数,εFt:各县的随机扰动项。

我们随机选取两个县进行预测,可以得到的预测值如表2(以肯塔基州047 号县为例)。

表2 肯塔基州047 号县的时间序列预测值

②结论和分析

预测可知,肯塔基州中Laurel 等县可能已经开始使用特定阿片类药物,美国政府应该对这几个县加大监察力度。同理,我们也将俄亥俄州、西弗吉尼亚州、弗吉尼亚州和宾夕法尼亚州的相关数据全部存入一个矩阵中,当我们需要预测任何地点、任何时间的海洛因总量,只需要输入该县的县代码和预测年份,即可得到该县所需年份对应的数据预测值。

图4 肯塔基州各县的位置图

图中红色圆圈里的这些县都是肯塔基州阿片类药物使用量偏高的位置,这些县都有一个共同的特点,就是交通十分便利,有的是交通枢纽,有的是靠近水源。阿片类药物有以这些县为中心,向其他县扩散的趋势。因此,对于各大交通枢纽及临河城市,美国相关部门应该加大监察力度,从源头控制非法阿片类药物的扩散。

③模型的进一步验证

为了增加预测的准确性,我们对筛选出的数据采用灰色预测,对各州各县的海洛因总量进行预测,我们得到已知年份对应数据的预测值,通过与原始数据进行比对,我们可以得到表3。

表3 肯塔基州047 号县的灰色预测值

上面的结果是对前面结果的预测,同时也是一个升华,使得预测的数据更加精确。

(4)药物识别阈值水平

①问题分析

通过对背景分析,我们可以得知每个州的犯罪实验室提供的合成类阿片和海洛因的药物识别计数的数据并不一定是该州的真实记录,当样本中没有提供确定的位置数据时,该位置数据由市/县/州调查执法机构的位置数据代替。

为了降低由各州药物识别计数数据水平差异引起的误差,我们根据给定的每个县的合成类阿片和海洛因的药物识别计数的数据,对县阿片类药物总量和州阿片类药物总量进行标准化处理,得到二者之间的比值,通过下列流程图的方法,对其进行处理,得到一个比例阈值,低于该阈值时,则认为该县的阿片是由于没有提供位置数据导致的,高于该阈值时,则认为该县的阿片类药物是由于已经开始使用导致的。

图5 确定阈值的流程图

②阈值的确定

我们将初始阈值定为0.001,每次以0.001 的幅度递增,用各县标准化处理后的值与试探阈值进行比较,当该县所有年份的值都大于试探阈值、都小于试探阈值、其中某一年份的值大于且该年份之后的值也大于试探阈值这三种情况发生时,则认为可以判断该阈值正确的频数增加一个,当频数与县的总数之比大于0.98 时,我们最终得到符合要求的阈值为0.08。

2.2 目标二:模型的建立与求解

(1)模型的建立与求解

为了测得每个县的阿片类药物的总使用量和这23种因素的相关性强度,我们拟采用灰色关联分析法[5]来进行求解,将每个县的阿片类药物总使用量存入数组,将我们分类完的23 种人口因素存入数组,我们采用下面的公式分别对每一种因素与阿片类药物总使用量进行Pearson 相关性分析。

通过计算,得到每年县阿片类药物鉴定总数和美国人口普查提供的社会经济数据之间的相关性表格,分析结果如柱状图所示。

图6 2016年阿片类药物与美国人口普查的社会经济数据的相关性

(2)评价结论

由数据分析结果以及表4 可知,阿片类药物的使用和趋势与多种社会经济数据都有极强的相关性,如教育程度、生育力等,其中,与教育程度的关联度最大。

表4 不同值范围变量的相关性强度

(3)阿片类药物的使用对象

分析可知,和祖父母一同生活的未成年人是使用或滥用阿片类药物的主要群体,当然,青年和中年人群滥用阿片类药物的现况同样也让人担忧。

(4)阿片类药物的使用和成瘾增长的原因

阿片类药物的滥用和成瘾问题已经成为社会讨论的焦点,执法机构和戒毒团体经常将滥用和成瘾的原因归结为药企盲目扩张市场以及药品监管部门的不作为,但深入分析不同滥用行为和滥用程度的人群,其滥用原因也不尽相同。

以和祖父母一同生活的未成年人为例,他们的判断力明显弱于成年人,同时在成长的过程中,往往得不到正确的引导,因此,缺乏基本常识的非治疗性娱乐用药,是他们对阿片类药物成瘾的重要原因。

而对于大多数成年人来说,他们往往十分清楚服用这类药物的潜大在危害,却依旧选择使用这些药物,原因来自两个方面。一方面,本着“免除疼痛是全人类的权力”的原则,他们选择服用医生开出的大剂量阿片类药物来缓解身体上的疼痛。另一方面,现代人面临的工作压力十分大,为了逃避生活的不如意,他们只要谎称身体上有疼痛,就能轻而易举的得到这些药物。

(5)对第一部分模型的修改

我们筛选出相关性最强的三个因素,与县阿片类药物总量进行BP 神经网络预测,采用下式分别对样本的输入、输出数据进行规格化处理:

K 为规格化前的变量;kmax和kmin分别为k 的最大和最小值;k͂为规格化后的变量。

通过MATLAB 执行算法:

通过上式,我们对2016 的数据进行预测处理,得到部分县相对误差值如表5 所示。

表5 神经网络预测值表

2.3 目标三:应对阿片危机的策略

翻阅以往的文献,我们发现,遏制阿片类药物滥用的干预措施多集中用于患者,但缺少对不同滥用行为和滥用程度的人群的滥用原因的深入分析以及对不同程度滥用者药物来源的差异性研究。结合我们前面建立的模型和得出的结论,我们提出了一个方案:

第一步,根据每个州每年提交的合成类阿片和海洛因的药物识别计数数据,利用我们第1 问的模型确定每个州及其县可能已经开始使用特定阿片类药物的时间和位置。

第二步,根据美国人口普查局提供的社会经济数据,划分出不同年龄阶段、不同职业的人群,用第2 问的Pearson 分析确定最有可能滥用阿片类药物的人群类别,结合PDMPs 记录的每个患者开具处方和配药信息的数据,对涉嫌滥用或转移处方的人群类别的相关信息进行监控。

最后,结合调取数据的程序反馈出来的信息,筛选出各州各县涉嫌滥用阿片类药物的人群类别,对这些人群的特点进行分析,找到他们滥用阿片类药物的原因,对症下药,加大对这些人群的教育宣传力度,控制和酌情减少他们阿片类药物的使用量。

3 模型的评价与推广

3.1 模型的评价

(1)优点

①能够很好地通过县代码把该县的有关数据提取出来,从而能够对该县的数据单独进行分析预测,使之不受州的阿片类药物使用水平限制;

②剔除了突变过大或者过小的量,在一定程度上减少了由于未提供位置数据造成的影响;

③通过对程序多次循环试探得出了一个合适的阈值,可信度达98%;

④利用多种预测模型进行对比分析,增大了分析结果的准确度;

⑤通过对数据的标准化处理,不同州的所有的数据都可以在同一水平进行讨论。

(2)缺点

①处理的方法有些采用人工合作处理,数值的精确性有待加强;

②由于存在未提供位置数据的情况以及部分数据缺失严重,从而导致部分县内的数据变化并不是特别规律,以致结果存在一定的误差。

3.2 模型的应用与推广

(1)应用

可用于预测每个县的阿片药物总量和各州的药物总量,并判断其是否已经开始使用特定阿片类药物,为各州/市/县针对阿片危机政策起指示作用,能够针对性地采取措施,减少了不必要的花费。

(2)推广

该模型同理可以应用于预测人口的增长趋势和其他的受地区影响程度较大的数据模型,如各国内的经济增长、商品的进出口等方面问题。

猜你喜欢

阿片肯塔基州海洛因
风袭
艾灸治疗阿片相关性便秘的效果评价
阿片类药物使用及扩散特征的分析
阿片类药物使用及扩散特征的分析
毒品现场快速检测方法的应用
海洛因是怎样从药品变成毒品的
阿片王国之侧景
疯狂的海洛因
海洛因是谁发明的