APP下载

多巴胺、奖赏系统与毒品成瘾*

2022-01-01贾东明钟祝涛王珏姜祖桢

中国药物滥用防治杂志 2022年11期
关键词:多巴胺毒品神经元

贾东明,钟祝涛,王珏,姜祖桢

(1.浙江警官职业学院,浙江 杭州 310018;2.云南省第六强制隔离戒毒所,云南 德宏 678400;3.中央司法警官学院,河北 保定 071000)

多巴胺(Dopamine,DA)属于儿茶酚胺类神经递质,主要由神经元或肾上腺细胞合成。DA 是人体重要的维持生理活动的神经递质,例如调节运动活动、情绪、进食、记忆、学习、睡眠、强化和动机。此外,DA 还有调节心血管、胃肠道、肾脏和免疫系统的外周作用[1]。DA 也是研究最广泛深入的涉及奖赏系统(Reward System,RS)的生理和病理状态的关键神经递质之一[2]。关于DA参与成瘾过程的研究已有近50 年的历史[3]。早期的解剖学、神经化学、功能和行为证据发现DA在成瘾过程中起着重要作用[4],近10 年的研究则进一步证实,DA 系统在成瘾的初始、维持、戒断和复发阶段均至关重要[5]。本文对DA、RS 在成瘾(常见毒品成瘾)研究领域中的作用机制和理论假设进行了总结和综述,并简要讨论毒品成瘾临床治疗的现状。

1 多巴胺系统

多巴胺系统主要涉及DA 神经元、活性和神经元间的调节三部分。大脑内DA 神经元位于中脑的三个区:A8 红核后区、A9 黑质致密部(substantia nigra pars compacta,SNc) 和A10 腹侧被盖区(ventral tegmental area,VTA)。来自黑质纹状体系统SNc 和红核后区的DA 神经元向背侧纹状体(dorsal striatum,DSt)投射;来自VTA 的DA 神经元向中脑-纹状体系统的伏隔核(nucleus accumbens,NAc)以及其他前脑区投射,例如中脑-皮质系统的前额叶皮层[6]。以往研究认为[7],黑质纹状体通路主要参与运动控制,而中脑-皮质-纹状体通路主要参与奖励学习和动机,实际上DA 系统的功能是不同脑区DA 重叠神经元的内外侧梯度共同决定的。

DA 神经元主要有两种活性状态:放电(自发活动)或非放电(沉默)。当DA 神经元放电时,它们可以以不规则形式(紧张性活动)或动作电位爆发(时相性活动)放电。其中,紧张性活动的DA 神经元维持突触外的基线电位水平,时相性活动是由离子型谷氨酸受体和电压门控离子通道之间的瞬时作用触发,约半数的处于紧张性活动状态的DA 神经元可以产生动作电位爆发放电[8]。DA 神经元感受到刺激后快速释放DA 进入突触间隙,同时激活突触后神经元受体,DA 转运体(DA transporter,DAT)又迅速将DA 从突触中清除,信号终止。这种大量但短暂的DA 释放可以通过连续安培法或快速扫描循环伏安法在行为动物实验中测量,但不能通过微透析或经典伏安法等技术测量[9]。DA 神经元从不规则形式放电到爆发相放电的变化已被证明与强化学习有关,DA 神经元放电编码了奖赏预测错误的信号,即奖赏预测和实际收到的奖赏之间的差异[10]。

VTA 中的DA 神经元放电受不同的抑制性和兴奋性输入调节,紧张性活动放电涉及终纹床核(bed nucleus of stria terminalis,BST)和腹侧苍白球,而时相性活动放电的控制涉及桥脑被盖区(pedunculopontine tegmentum,PPTg)和外背侧被盖区(laterodorsal tegmentum,LTDg)。另外,DA 神经元的活动也受外侧缰核(lateral habenula,LHb)的调节[11]。DA 神经元放电的抑制作用被认为是受多突触调控,LHb 向DA 神经元进行谷氨酸能投射,可以减少中脑DA 神经元的放电;吻内侧被盖区(rostromedial tegmental nucleus,RMTg)可以接收LHb 诱导,进行γ-氨基丁酸能投射,抑制DA 神经元活性[12]。RMTg 接收来自皮质、中脑导水管周围灰质、LDTg 和PPTg 等大脑区信号的传入,这表明RMTg 可能整合多种信息,可以调节VTA 和SNc 的活动[13]。来自NAc外壳部分的投射影响VTA 中的DA 神经元,后者反过来投射到NAc 的核心部分,该核心部分向SNc 提供投射,SNc 将其投射发送到DSt,这被认为是从目标导向(自愿)毒品使用到刺激-反应(习惯)成瘾的解剖学基础[14]。

2 多巴胺受体

基因克隆程序发现五种不同的DA 受体,均属于G 蛋白偶联受体。DA 受体分为D1 样(D1Rs)和D2 样(D2Rs)两个亚家族:D1Rs 包括D1 和D5 受体,具有高度序列同源性并刺激腺苷酸环化酶(AC)途径;D2Rs 包括D2、D3 和D4 受体,主要抑制AC 途径[15]。

D1 受体(D1R)是表达水平最高的DA 受体。通mRNA 检测发现,在纹状体、NAc 和嗅结节等区域,强啡肽、GABA 能神经元D1R 蛋白表达程度较高,在PFC、下丘脑和丘脑中表达程度较低。然而,在某些脑区,仅检测到D1R 蛋白,未能检测到D1R mRNA[16]。D2 受体(D2R)基因可编辑长和短两种剪接变体的外显子,分别称为D2L 和D2S,其中D2Lw 纹状体中,由脑啡肽和GABA能神经元共同表达。同时,D2R 也存在于SNc 和VTA 中,由多巴胺能神经元表达[17]。

D3 受体(D3R)受关注较多,主要存在于边缘区域,例如NAc、嗅结节和Calleja 岛,而在DSt 中的表达水平较低。在基底神经节中发现低水平的D4 受体(D4R)表达,而在额叶皮层(frontal cortex,FCs)、髓质、杏仁核(amygdaloid,Amyg)、下丘脑和中脑表达水平相对较高。D5受体(D5R)的表达很弱,似乎仅限于海马体(Hippocampus,Hipp)、乳头外侧核和丘脑束旁核[18]。另外,D1R 和D2R 在同一神经元内的共定位问题,即D1/D2 协同作用,纹状体中等棘神经元(MSN)能表达D1R/D3R/D4R 或D2R/D5R,D1/D2 的不平衡可能导致成瘾[19]。另有研究表明[20],外周血淋巴细胞能表达酪氨酸羟化酶并产生DA,神经胶质细胞也可以表达功能性DA 受体,并进行DA代谢,提示DA 可能在神经免疫系统中发挥重要作用。

3 多巴胺与奖赏系统

Olds J 等[21]在1954 年发现,DA 在啮齿动物特定大脑区域会产生有益的刺激,并且存在一个参与强化的特殊回路。Wise RA 等[22]首次阐明这种奖赏回路(Reward Circuitry,RC)的核心是由突触连接的三个串联神经元链路组成:①从内侧前脑束的前床核(anterior bed nuclei of the medial forebrain bundle,ABN)延伸到腹侧被盖区(VTA)链路;②从VTA 到伏隔核(NAc)的上行链路;③从NAc 到腹侧苍白球(ventral pallidum)的进一步上行链路。奖赏回路的神经元串联链路能够接收其他神经突触信号传递并进行功能调节,包括胆碱能、内啡肽能、5-羟色胺能、GABA 能、谷氨酸能、脑啡肽能、强啡肽能和含P 物质的神经元[23]。在生物进化的进程中,大脑奖赏回路的基本生物学功能是维持正常(自然)奖赏行为,如进食、饮酒、性行为、抚育行为以及社会交往等,通过强化正常奖励可以巩固生物基本记忆(例如,动物觅食或狩猎范围内的食物和水源位置)。大脑奖赏回路的激活程度与主观兴奋程度密切相关。直到毒品出现,大脑奖励回路被“劫持”,比自然奖励更强烈,吸毒者因此抛弃了生活中正常的快乐和回报,转向追求毒品引起的快乐。

RC 是RS 的主要组成部分,奖赏系统还包括其他涉及所有成瘾过程的神经元簇[24]。在生理条件下,RS 调节生命繁衍相关的行为和动机,如哺乳或繁殖,以及寻求奖励和奖励诱导学习的基本行为。DA 是激活大脑奖赏系统的关键神经递质,几乎所有毒品(不包括LSD 和麦司卡林类迷幻剂)都是直接或间接DA 激动剂,特别是奖赏回路“第二阶段”中与NAc 链接的VTA 部位,脑成像研究也证实了DA 系统在非药物奖励中的作用。构成RS 的大脑区域主要包括VTA、NAc、FCs、DSt、Amyg 和Hipp[25]。在生理/病理条件下,各区域激活都会引起行为反应或唤起过程。VTA是奖赏系统中DA 的主要来源,VTA 具有不同的神经递质活性,包括DA(60%~65%),GABA(30%~35%),谷氨酸(2%~3%)。在生理条件下,VTA 细胞释放DA 进一步传导激活NAc、Amyg、FCx、DSt 和Hipp。NAc 在动机和奖励价值中发挥核心作用,Amyg 有助于情绪学习和巩固记忆,FCx 参与规划和决策,DSt 是强化习惯形成的基础,Hipp 则对与药物线索相关的学习至关重要。

不同类别的毒品分子作用于奖赏回路的不同部位,以激活该回路并诱导增强作用:阿片类、巴比妥类、苯二氮䓬类、大麻素作用于VTA;苯丙胺类、可卡因、阿片类、大麻素和解离性麻醉剂(如氯胺酮和苯环利定)作用于NAc,因此产生吸毒行为、寻药行为、渴求和复吸的位点。例如, 阿片类作用于Mu 受体,产生局部抑制性中间神经元超极化,VTA 区DA 神经元的去抑制作用;苯丙胺类作用于DAT,阻断DAT,抑制DA 再摄取,竞争性增加细胞外DA 水平,同时抑制囊泡单胺转运蛋白2,促进DA 外流;可卡因能够与DAT结合,阻断DA 的再摄取,增加细胞外DA;大麻素类作用于CB1 受体,逆向抑制VTA 区 DA 神经元激活;咖啡因作用于腺苷A1 受体,在DA 神经元突触前水平,非选择性竞争阻断A1R 腺苷A1受体,促进DA 释放。

4 多巴胺系统与毒品成瘾过程

脑内DA 的活动受到精细的调节且DA 数量没有上限,长期超量会诱发病理行为,可能威胁到个体生存。成瘾与大脑RS 内的低多巴胺能功能障碍状态有关[26]。毒品作用于RS,在缺乏正常调节机制的情况下,成瘾就会出现[27]。DA 的释放有两种机制:一种是神经介导直接释放,另一种是通过诱导细胞因子分泌,间接增加DA 的释放。毒品成瘾的过程具有阶段性特点:从初始偶尔的奖励驱动娱乐性使用,发展为持续冲动性滥用,再发展为后期强迫性使用,这些行为进展与多巴胺释放以及奖赏系统的神经解剖学结构和功能改变相关[28]。

4.1 成瘾的易感因素

医学研究发现[29],10%~30%的人偶尔尝试毒品后会随着时间的推移最终成瘾,成瘾的风险不尽相同。成瘾易感性是由遗传、毒品种类和环境因素之间的复杂相互作用造成的。个体对毒品成瘾的易感性存在基因变异,但压力和社会失败等环境因素也会以某种方式改变大脑奖赏机制,促使人容易上瘾。事实上,具有遗传倾向的人如果暴露在积极(降低成瘾风险)的环境中不一定会成瘾,相反,对毒品具有遗传抵抗力的人如果暴露在消极(增加成瘾风险)的环境中可能会成瘾。简而言之,“生物-心理-社会”病因学模型对成瘾非常适用。

4.1.1 遗传因素

确定毒品成瘾的行为表型是相对容易的,人类双胞胎研究表明,遗传对成瘾的发展有重大影响,遗传风险估计在40%~60%[30]。个体基因的确切作用尚不完全清楚,成瘾的遗传学因素通常被认为是受多个低影响基因共同作用影响[31]。

4.1.2 环境因素

环境因素包括社会经济因素、家庭和同伴关系、生活事件、毒品易接触度等。环境因素参与塑造个体的个性和性格,形成社会文化背景,同时也影响神经元回路和神经适应能力。流行病学数据发现[32],良好的家庭和同伴关系,而且身体(锻炼)和心理(认知)上的支持都会降低成瘾的风险。DA 系统参与了环境因素介导的成瘾易感性改变,已明确确定压力会导致DA 系统发生改变,从而增加药物的增强作用;相反,暴露于富集环境会导致DA 系统突触后神经元变化,成瘾易感性降低[33]。

4.2 奖励驱动娱乐性使用

毒品能够增强(直接或间接,甚至跨突触)NAc 多巴胺能奖赏突触功能,其欣快效应与DA浓度相关。DA 增加发生在成瘾的初始阶段,最初的毒品滥用行为是由奖励驱动的,主要与毒品诱导的奖赏回路中腹侧被盖区(VTA)-伏隔核(NAc)链接的激活有关。奖赏回路功能上较为复杂,不只是对主观快感的强度进行编码,还编码注意力、奖励预期和激励动机。多巴胺的贡献似乎主要是导致“想要”获得享乐的奖励,而不是“喜欢”或学习这些奖励[34]。

4.3 习惯形成

1996 年,Blum K 等[35]提出“奖励缺乏假说”,即成瘾主要由大脑奖励机制的慢性基础功能障碍所驱动,导致主观快感感受降低甚至缺失,吸毒者寻求使用毒品来弥补这种慢性奖赏缺乏。“奖励缺乏假说”试图将毒品成瘾解释成一种具有破坏性和自毁结局的快感自我补偿行为。脑神经成像技术证实成瘾大脑的多巴胺能奖赏回路结构和功能出现异常,例如内侧前脑束多巴胺神经元轴突萎缩,多巴胺D3 受体数量减少,NAc 多巴胺能轴突末端酪氨酸羟化酶的病理缺失,多巴胺释放不足,以及突触后神经元的受体后转导机制(腺苷酸环化酶、环AMP、蛋白激酶A)的病理改变等[36]。

长期使用毒品,大脑对欣快感受的耐受性逐渐增强,吸毒者可能在从日常生活中获取奖励和快乐的能力上存在缺陷,焦虑开始主导奖励回路,吸毒者使用毒品的目的不再是感受快感,而只是为了回到“正常”状态。Schultz W 等[37]通过记录非人类灵长类动物的多巴胺能脑区域的电生理反应,发现DA 神经元对新的或比预期更好的奖励做出反应,但是在反复接触和学习后,DA 神经元不再对奖励本身做出反应,而是对可以预测奖励的刺激做出反应。最新的研究发现[38],部分GABA 神经元也参与了奖励和强化行为。与奖赏有关的任何刺激或场景、线索都能引起多巴胺释放,例如地点、物品、人物,甚至是身体的感觉等。被激活的多巴胺能神经元鼓励个体采取行动,或坚持任何可能带来奖赏的行为。

长期使用毒品还会导致大脑奖赏回路DA 传输功能障碍,产生条件学习效应,称为适应不良成瘾行为[39]。随着时间的推移,中等多棘神经元中的D2Rs 表达减少,DA 紧张性活动状态降低,导致对自然奖励的敏感性降低,继续摄入毒品也难以发生动作电位爆发放电。此时,出现与毒品相关的提示后摄入毒品,则获得联想学习,该过程称为正向奖励预测误差;然而,若未能摄入毒品,DA 释放减少,则导致负奖励预测误差[40]。

随着时间的推移,滥用药物寻求和吸毒行为成为由单纯奖励驱动转变为习惯驱动,主要涉及NAc 反向投射到VTA,以及NAc 向黑质和背外侧新纹状体投射的神经回路[41]。NAc 中的DA 对使用毒品和成瘾发展是必不可少的,吸毒行为由NAc 多巴胺水平调节,并将多巴胺保持在病理升高范围内,以维持所需的快感水平。NAc 中的多巴胺连接组成突触中转站,位于携带着刺激的强度、持续时间和质量信号的感官通路的分支连接处,这些感官信号被翻译成“奖赏”,即所体验到的快乐、愉悦或超级快感[42]。大量的电生理学、神经化学和行为神经科学研究已经明确表明,NAc 奖赏神经元不仅仅是对奖赏的编码接收,它们还可以表现为编码奖励期望、奖励延迟、奖励延迟折现和奖励预测误差,调节药物寻求行为的动机,以及促进突触神经结构可塑性[43]。条件反应和习惯行为形成时,DSt 区域活动最为活跃。阻断DSt 中DA 受体可防止可卡因寻求和长期戒断后的复发[44]。NAc 和DSt 都与条件反射和习惯形成有关,这是成瘾行为的核心特征[45]。

4.4 戒断、渴求和复吸

如前所述,成瘾早期,毒品的确会增强大脑的奖赏作用,然而突然戒断毒品,大脑的奖励被抑制,会对个体造成严重影响。由毒品诱导的神经结构可塑性适应可能会改变多巴胺能系统内的通信,并且可能是导致戒断症状、渴求和复吸的高风险因素。“结构可塑性”是指大脑回路中突触连接的重组[46]。比如神经元树突棘结构的形态可以迅速变化以调节神经元之间的突触接触[47]。毒品戒断期间,DA 神经元和纹状体神经元连接中树突棘的改变,这些改变可能参与戒断症状和表征,造成负面影响状态。

关于毒品成瘾真正需要解决的临床问题是持续的渴求和复吸。毒品渴求/复吸的三个经典触发因素:①再次接触毒品;②压力;③再次接触与吸毒行为有关的环境线索。复吸主要涉及伏隔核和神经递质多巴胺。压力应激引发的复吸涉及杏仁核中央核、终纹床核,以及神经递质促肾上腺皮质激素释放因子和去甲肾上腺素。线索触发的复吸涉及杏仁核基底外侧核、Hipp 和神经递质谷氨酸[48]。

5 DA 和毒品成瘾的药物治疗

鉴于DA 在毒品成瘾中的关键作用,针对DA代谢机制以及奖赏回路的成瘾药物治疗研究也较多。长期效果还需要进一步验证。

5.1 多巴胺能拮抗剂

通过药理学阻断毒品的对奖赏回路和脑内位点的增强作用,从而减少成瘾相关行为。然而,越来越多的证据表明多巴胺能拮抗剂对治疗毒品成瘾无效,尤其是对鸦片类、尼古丁、酒精和大麻[49]。事实上,对动物和人体的研究表明[50],在大多数情况下,阻断DA受体反而会增加毒品滥用,吸毒者通过增加毒品剂量来抵消DA 阻断的影响。选择性阻断D2R 受体的药物还会加剧负性情绪状态并增加负性强化,导致对治疗药物依从性降低,停止治疗并最终复发[51]。其他改进阻断D2R 和对其他靶标(如血清素5-HT2 受体)的药物在治疗成瘾方面的有效性也非常有限,但选择性D1R、D3R拮抗剂为毒品成瘾的药物治疗提供了新的选择。

5.2 多巴胺能激动剂

多巴胺能激动剂可用于治疗兴奋类毒品成瘾,并且阿片类药物和尼古丁成瘾有效,例如阿片类激动剂美沙酮和丁丙诺啡的替代治疗和尼古丁替代疗法[52]。多巴胺受体的直接激动剂效果并不明显,更多的是对作用于DAT 的间接DA 激动剂的研究。其中,莫达非尼、安非他酮、哌醋甲酯以及甲基苯丙胺的缓释制剂,用于人体治疗其他精神疾病,总体疗效有限[53]。目前正在开发只与转运蛋白结合,而不产生精神方面强化作用的新的DAT 阻断剂[54]。其他间接提高多巴胺能活性的策略,例如通过单胺氧化酶(MAO)拮抗剂司来吉兰减少新陈代谢或增加DA 前体,但效果有限。

5.3 大脑奖赏回路调节

另外,作用于大脑奖赏回路的药物也很有前景。伏隔核GABA 能中型多棘神经元的抑制构成毒品诱导奖励的最终共同途径,GABA-β 受体激动剂巴氯芬可以抑制酒精、可卡因、吗啡和海洛因的滥用,目前正在对人类酒精成瘾治疗进行研究[55]。同样,还有针对可卡因成瘾的间接GABA激动剂γ-乙烯基氨基丁酸以及针对大麻成瘾的大麻素CB1 受体拮抗剂治疗[56]。谷氨酸回路介导寻药行为,促肾上腺皮质激素释放因子(CRF)能够触发压力下复吸行为,作用于谷氨酸回路和抗CRF 药物的开发也值得期待[57]。

5.4 神经系统免疫调节

参与中枢神经系统(Central Nervous System,CNS)免疫反应的主要是小胶质细胞,小胶质细胞具有产生细胞因子和趋化因子、吞噬作用、降解和免疫细胞募集的能力,免疫反应和多巴胺能作用之间存在相关关系。既往研究表明[58],阻断TOLL 样受体(TLR4)可以减少吗啡获取行为。磷酸二酯酶抑制剂(AV411,Ibudilast)可降低TLR4 的表达,抑制促炎反应激活,减少NAC 中DA 释放,能够降低苯丙胺类和鸦片类滥用和寻药行为[59]。

6 总结

DA 是在成瘾领域研究最多的神经递质。在探究毒品成瘾的过程中,对大脑DA 和奖赏系统的认知可以帮助更好地揭示大脑功能,理解神经传导障碍和精神疾病,对成瘾疾病的治疗效果做出预测。值得注意的是,毒品成瘾是一种涉及不同脑区和递质且具有阶段性特征的复杂疾病,考虑到不同种类的毒品可能与不同的成瘾行为相关,因此有效建立成瘾动物模型以及开发新的治疗药物的工作将十分艰巨,需要耗费大量的时间和精力才能产生有意义的临床结果。

猜你喜欢

多巴胺毒品神经元
销毁毒品
贪婪的多巴胺
多巴胺不敏感型帕金森综合征诊断及治疗的研究进展
抵制毒品侵害珍惜美好年华
AI讲座:神经网络的空间对应
How music changes your life
跟踪导练(四)(4)
火烧毒品
仿生芯片可再现生物神经元行为
这个神经元负责改变我们的习惯