基于CONSORT与TIDieR-Placebo评价安慰针刺治疗偏头痛随机对照试验的文献报告质量＊

2023-09-01王林嘉李铁林王渝涵

世界科学技术-中医药现代化 2023年5期

王林嘉，李铁林，徐韬，王渝涵，荣婧，赵凌

（成都中医药大学针灸推拿学院成都 610075）

自Beecher 教授[1]于1955 年在The Journal of the American Medical Association（JAMA）杂志发表题为“The powerful placebo”的经典论文后，安慰剂成为医学、心理学研究者们持续关注与讨论的话题。安慰剂是设计外观、色泽、气味、制剂以及用法和用药途径与试验药物组一致，但没有药效的一种制剂[2]，是一种衡量积极干预措施是否有效的标准。目前，安慰剂作为一种对照方式常被应用于各种临床研究中，但近年的一项研究却表明即使发表在顶级期刊中的论文对安慰剂的描述都不甚详细[3]。而对安慰剂对照描述的不充分，将影响对积极干预有效性的解释，并且使试验难以重复。因此，Howick等[4]在干预措施清单和报告规范（Template for Intervention Description and Replication，TIDieR）的基础上研制了安慰措施描述规范清单（Template for Intervention Description and Replication-Placebo，TIDieR-Placebo），该清单于2020年发表在PLoS Medicine杂志上，专门用于指导安慰措施的报告。

安慰剂效应广泛存在于所有医学干预手段中，而针刺作为一种复杂干预方式同样会产生安慰效应[5]。目前国内外对安慰针刺的运用意见不一，缺乏统一的标准[6]，因此在临床试验中对安慰针刺的报告将显得格外重要。对安慰针刺的细节进行严格报告，将促进研究者之间对安慰针刺更加方便与深入地探讨，以增加针刺效应的可信度。偏头痛作为针刺治疗的有效病症近年来在国内外的研究中备受关注，故本研究以“偏头痛”的针刺临床研究作为研究关注点，采用试验报告统一标准（Consolidated Standards for Reporting of Trials，CONSORT）与TIDieR-Placebo，以评价符合要求的针刺治疗偏头痛的随机对照试验（Randomized controlled trials，RCT）的报告质量。同时通过评价的结果讨论目前安慰针刺的运用现状，并为今后安慰针刺的试验设计提供参考。

1 资料与方法

1.1 文献来源

采用计算机检索形式对国内外重要数据库进行检索。中文数据库包括：中国期刊全文数据库（CNKI）、维普数据库（VIP）、万方数据资源系统（WF）、中国生物医学文献数据库（SinoMed）；外文数据库包括：PubMed、Embase、Web of Science（WOS）。

1.2 文献纳入排除标准

1.2.1 纳入标准

①针刺治疗偏头痛的临床RCT 研究或评价了临床结局指标的机制RCT 研究；②试验组采用单纯针刺（不使用电针、耳针、干针、温针等），穴位、治疗周期等不限；③对照组采用安慰针刺，穴位、治疗周期等不限；④疾病亚型、样本量及患者年龄、人种、性别等不限；⑤国内外正式期刊上发表的论文、硕博论文。

1.2.2 排除标准

①未评价临床结局指标的针刺治疗偏头痛的机制RCT 研究；②试验组采用电针、干针、耳针、温针等其他针刺干预方式的研究；③试验组/对照组除单纯针刺/安慰针刺外还使用其他干预方式的研究（如针刺配合中药）；④动物实验；⑤会议论文、论著等；⑥综述、系统评价等；⑦无法获取的文献；⑧重复发表的文献。

1.3 检索策略

参考Cochrane 协作网工作手册中的检索指南[7]，采用以下主题词，或结合自由词进行检索：①“针刺”、“针灸”、“安慰针刺”等；②“偏头痛”、“脑风”等；③“随机”、“对照”、“RCT”等；④“推拿”、“穴位注射”、“灸”等。检索时间点为2021年7月20日，检索时限为2011年7 月20 日-2021 年7 月20 日，文献语言限制为中英文。具体检索策略以CNKI 及PubMed 为例，见表1和表2。

表1 CNKI检索策略

表2 PubMed检索策略

1.4 文献筛选及评价

1.4.1 文献筛选及录入

一位研究者（李铁林）依照既定的检索式对文献进行检索，随后将检索好的文献导入NoteExpressV.3.2.0.进行查重。查重后由两位研究者（王林嘉、李铁林）按照纳入、排除标准阅读文献标题、摘要进行初筛，之后阅读全文进行进一步的筛选。研究的基本资料由两位研究者（李铁林、王渝涵）采用Microsoft Excel 2016表格进行独立提取。

1.4.2 文献评价

参考既往发表的关于CONSORT、TIDieR-Placebo清单的使用说明[4,8]，两位研究者（王林嘉、李铁林）对符合要求的文献逐条、单独地进行评价。评价指标为CONSORT 2010 声明及TIDieR-Placebo 清单，每一条目根据作者是否报告，做出“是”或“否”的回答。文献的筛选、提取、评价意见不统一时报告第三位研究者（赵凌），由第三位研究者进行仲裁。

1.5 统计学方法

采用Microsoft Excel 2016 表格对数据进行统计及绘图，使用百分数（%）表示纳入文献各评价条目的报告率。

2 结果

2.1 文献检索结果

共检索出文献2432篇，剔除重复文献及排除不符合文献2373篇，最终本研究共纳入59篇文献[9-67]，文献检索流程见图1。

图1 文献筛选流程及结果

2.2 文献基本特征

本研究纳入的59 篇文献[9-67]中，英文11 篇[9-19]，中文48 篇[20-67]，其中期刊论文40 篇，硕博论文19 篇。发表数量达到高峰的年份是2017 年，共发表10篇[11-13,37-43]，纳入文献随时间分布情况见图2。样本量介于20-196例之间，试验组和对照组的分配比例多按照1∶1分配。

图2 纳入文献发表时间分布图

干预措施方面，试验组均采用单纯针刺进行治疗，针具多采用华佗牌针灸针，选穴以局部选穴（风池、率谷等）配合远端选穴（合谷、足三里等）为主。而对照组选择的安慰方式主要是“假穴假刺”、“假穴真刺”、“假穴浅刺”及“非治疗穴位真刺”4 种，除1 项研究[15]使用了两种安慰方式外，其余研究均只使用4 种方式中的一种，其中以“假穴真刺”作为对照方式的文章数量最多，高达40 篇（见图3）。对照组在针具选择方面比较多样，其中包括Streitberger needles、Seirin needles、华佗牌针灸针等。在穴位选取方面，则多选用干预组穴位旁开0.5-2 寸的非穴点进行对照。值得注意的是，其中一项研究[17]采用了针对偏头痛没有治疗效果的穴位作为安慰对照。纳入文献详细的信息见表3。

图3 对照组安慰措施统计图

表3 纳入文献的基本信息

2.3 CONSORT评价结果

根据CONSORT 2010 对59 篇针刺VS 安慰针刺的RCT 的文献报告质量进行评价，结果显示：在共计37 项子条目中，报告率达到100%的条目有4 条，分别为条目1b、5、17a、22。而报告率为0%的条目则有5 条，分别是条目3b、6b、14b、17b、18。另外，报告率低于10% 的条目还有条目11b（1.69%）、条目12b（1.69%）、条目16（5.08%）、条目24（5.08%）。详细评价结果见表4。

表4 纳入文献的CONSORT报告质量评价结果

2.4 TIDieR-Placebo评价结果

根据TIDieR-Placebo 对59 篇纳入文献中安慰措施的报告质量进行评价。结果显示：在13 项条目中，仅有一条条目（条目1）达到100%报告率。低于10%报告率的条目多达5 条，分别为条目6（0%）、条目7（1.69%）、条目9（3.39%）、条目10（0%）及条目13（8.47%）。具体见表5。

表5 纳入文献的TIDieR-Placebo报告质量评价结果

3 讨论

通过CONSORT 的评价结果，我们发现安慰针刺治疗偏头痛的RCT 文献目前还存在以下问题：①试验设计更改（条目3b）和结局指标更改（条目6b）方面的报告率均为0%，可能由于研究者并未在试验实施过程中更改试验方案。一般而言，临床试验的实施应严格按照计划书执行，但某些研究（如探索性试验）在开始后可能会因出现各种试验内外部的问题而偏离之前的方案设定[8]，此种行为可能会影响试验的可信度。因此，如果研究者在试验实施阶段更改了试验设计或结局指标，应对此两项条目的进行详细报告才能够厘清试验设计或结局指标更改而带来的偏倚。②在附加分析方法（条目12b，报告率1.69%）和辅助分析结果（条目18，报告率0%）方面，研究者几乎未考虑对研究的结果进行亚组分析或校正分析等。有报道指出[68]，当临床试验的结局呈现阳性结果时，还应进一步考虑一些问题，其中之一就是“研究结论是否在重要的亚组之间保持一致？”。亚组分析能够为研究的结论提供支持性证据，或为进一步的研究提供思路。当然，并不是所有结果都需要做亚组分析，研究者应该结合自己的研究结果谨慎地选择附加分析方法，若这些分析方法并不适用，也应在统计学方法部分做出相应的报告。③在试验中断或停止（条目14b，报告率0%）方面，如果研究者在结果获益的情况下提前中止试验，用较少的病例数报告了较好的治疗效果，将会使研究结果并不真实可靠[8]。因此，如果试验提前中断，对试验中断或停止的原因进行阐述很有必要。④在结局与估计值（条目17b，报告率0%）方面，绝对效应指的是危险差（Risk difference，RD），而相对效应主要是指相对危险度（Relative risk，RR）和比值比（Odds ratio，OR）[69]。研究者若仅使用RR 对二分类变量进行计算，可能会使非研究人员高估疗效[70]，因此同时报告绝对效应和相对效应才能降低此类风险。⑤此外，如果在方法中报告干预措施与对照措施（特别是安慰对照）的相似之处（条目11b，报告率1.69%），能够增加自身试验盲法实施成功的可信度。针对数据集采用不同的分析方法（如全分析、符合方案分析、意向治疗分析等），可能会得到不同的试验结果（条目16，报告率5.08%）。而报告试验方案的获取方式（条目24，报告率5.08%），能够便于一些对该研究感兴趣的科研人员或临床工作者进一步得到想要的信息，公开研究方案也能限制选择性报告的发生。

对于TIDieR-Placebo 评价结果，13 项条目中有5 条未达到10%的报告率。究其原因，可能与本研究纳入的文献为过去10 年所发表，而该清单在2020 年才面世有关。过去缺少一项详尽的标准来规范安慰剂使用的报告流程，因此文献的报告率并没有达到较高水平。目前，对于安慰剂使用的报告存在以下问题：①在描述操作方法（条目6，报告率0%）方面，由于针刺这一干预措施的特殊性，需要由研究者与受试者面对面进行，因此几乎所有的研究都没有对这一条目进行描述。然而，描述每次单独干预一名受试者还是同时对多个受试者进行干预却很有必要，甚至在某些情况下还应报告干预措施发起人或发起方式（如是否采用互动模式或全程无交流），这些可能会减少影响结果的递送因素[71]。②在实施地点（条目7，报告率1.69%）方面，纳入的绝大部分研究对病人的招募场地有所描述（见CONSORT 条目4b），但却忽略了描述进行干预的实施地。有研究表明[72]不同的治疗环境对某些疾病的治疗效果有明显差异，而治疗环境对针刺安慰措施的影响将会更加明显，比如两组患者处于同一环境，而研究者采用不同的穴位或使用不同的针具进行处理，那么患者的心理因素可能会影响到试验的结果。③在个性化方案（条目9，报告率3.39%）方面，由于针刺的临床选穴是基于中医理论，因此无论是辨证还是辨经，对待不同的患者总会有穴位方面的选择差异。当研究者遇到需要改变干预方式的情况时，则需要作出详细的报告，以便为结果的解释提供依据。④方案的修改（条目10，报告率0%）与前文讨论的CONSORT 条目3b 和6b 一样，若在试验实施过程中对方案进行了修改，则需进行详细报告。⑤对于盲法评估（条目13，报告率8.47%），在之前的TIDieR 清单版本中并没有提到这一条目。安慰剂是指可以帮助个体改变心理/生理反应的物质或程序[73]，而其重要的一个特征就是能够“以假乱真”[74]。因此，将安慰剂作为对照的试验，应尽可能评判两组致盲的成功率，遗憾的是目前大部分研究并未重视该项报告。

总体看来，目前国内比较安慰针刺治疗偏头痛的RCT 研究报告质量不尽如人意。针对此现象，作者认为可以从以下3 个方面进行改进：①在试验设计与实施环节，文献报道充分的首要前提是要有良好的试验设计并做好试验相关记录，因此对试验进行注册以及在正式试验开始前开展预试验可以较好发现和解决试验设计与实施过程中的问题和不足。②在作者撰写文章环节，应该严格按照CONSORT 等清单进行报道，最好在文中表明是按照何种清单进行报告。③杂志社作为论文录用刊发的关键一环，需要担负起论文报告质量审查的任务，尽量不录用报告质量较差的论文，具体措施可让投稿作者在投稿时提供自己文章的CONSORT评价报告等。

本研究纳入的59篇文献中，在对照组安慰措施的设计上，主要分成4种。其中大部分研究选择了“假穴真刺”与“假穴浅刺”的安慰对照方式，占总研究数的89%。这样的安慰方式设计可能与之前的德国针灸试验（German acupuncture trials，GERAC）项目[75-78]和针灸随机试验（Acupuncture Randomized Trials，ART）项目[79-82]有关。该两组项目在进行了试验后得出“针刺有效，但没有经络理论指导的针刺仍然有效”的结论，这一结论质疑了关于穴位效应特异性的传统针灸理论[83]。因此国内随后开展的安慰剂对照试验在选用对照组时，多半选用与GERAC 和ART 项目同样或类似的安慰措施，即“假穴真刺”或“假穴浅刺”。然而这一设计方式（包括“非治疗穴真刺”）受到了著名针灸学者Birch的质疑。该学者认为该种安慰针刺仍然是一种活跃的针刺方式，并非真正的安慰剂治疗[84]。随即针灸试验合作委员会（Acupuncture Trialists' Collaboration）在2014年提出了“任何刺入皮肤的针刺不能设为假针刺”的观点[85]。因此除了探索经穴特异性的RCT 研究以外[86]，将来研究者在选择安慰针刺方式时最好选择不刺破皮肤的方式。另外一种安慰针刺方式是“假穴假刺”，该种方式是基于“针刺疗效由‘针刺+穴位’共同影响”而设计，规避了针刺、穴位单独以及交互作用对疗效的影响，在验证针刺有效性方面可能是目前较为理想的对照形式。但临床研究中若选择此种对照方式，则需要注意在对两组进行干预时，尽量避免两组患者的接触和交流。并且此种安慰形式需对受试者设立更高的纳入标准，即尽量招募既往没有针刺过的受试者。此外，虽没有研究者选择“真穴假刺”这一安慰针刺方式，但此种方式运用于安慰针刺试验如何？按照传统针灸理论，穴位是影响疗效的关键因素之一。若我们选择了“真穴”进行安慰针具的假刺激，即使不破皮，依然可能会收获疗效，如九针中“员针”、“鍉针”等不破皮针具的运用，以及后来的指压疗法等[6]。因此“真穴假刺”的安慰针刺方式可能无法绝对胜任“安慰剂”一职，这可能是众多针灸研究者所考虑到而不选用它的原因。

那么我们是否可以设计一种不破皮的针具，并且在操作期间不对穴位造成刺激（或不接触皮肤），但依然可能让患者感受到针刺进皮肤？未来不可知，但答案在目前看来是否定的，冯硕等[87]认为现实情况中能够不产生生理刺激，同时兼具蒙蔽效果的针刺模拟装置几乎不存在，因而其建议在双盲安慰剂对照的针刺临床试验疗效评价中，应以“病-证”为切入点综合评价，即针对不同的疾病或证型，考虑采用不同的安慰对照措施，甚至不考虑设计安慰对照。此建议或许为未来针刺甚至是更加复杂干预手段的安慰对照设计提供了思路。

此外，若单纯为了验证针刺是否存在安慰效应或观察安慰效应大小，则可以借鉴“目标疾病导向的安慰对照（Target disease-guided placebo-controlled，TIGER）”试验设计[88]。该设计基于“针刺的整体疗效由真实疗效（特异性疗效）与安慰剂疗效组成，安慰剂疗效主要由患者心理因素造成”的假说而形成。在TIGER 设计的试验中会招募同时患有目标疾病（根据研究目的选择的疾病）与假目标疾病（另外一种疾病，针对目标疾病治疗时不应对假目标疾病产生影响）的患者，将其随机分为两组，对两组患者均提供相同的针刺干预，不同的是，治疗组患者被告知治疗的是目标疾病，而对照组患者被告知治疗的是假目标疾病，以引起两组患者不同的心理反应。研究者认为治疗组的结果将显示针刺的真实疗效及安慰效应，而对照组将仅显示出针刺的真实效应。因此可以确定针刺对目标疾病的真实效应大小及安慰效应大小。该设计优点是不仅具有达到真正双盲（盲患者、针刺操作者）的效果，还可使两组患者均可“得气”，但不足之处也显而易见，如何招募足够数量的合格受试者比较困难，且结果的外推性不足、可行性还需测试。

综上，基于CONSORT 与TIDieR-Placebo 评价的安慰针刺治疗偏头痛RCT 的文献报告质量总体不高，研究者未来应重视使用此两项清单对研究进行规范报告。大部分研究的安慰针刺设计方式尚缺合理性，在开发出更加合理的安慰针具之前，亟需国内外在安慰针刺的设计和选择方面形成共识，以推动针灸临床研究的规范化。