统计实操道德规范
2017-01-20美国统计学会职业道德委员会2016年5月
(美国统计学会职业道德委员会,2016年5月)
陈平雁(南方医科大学生物统计学系)翻译
·其他·
统计实操道德规范
(美国统计学会职业道德委员会,2016年5月)
陈平雁(南方医科大学生物统计学系)翻译
[编者按] 译者获美国统计学会授权,将美国统计学会职业道德委员会2016年5月发布的《统计实操道德规范》译成中文,以飨读者。该规范是1999年版本的升级版,顺应了统计学应用在近20年发展和变化的要求。目前我国统计学界尚未有此类规范的制定与发布,美国同行的制度建设以及所提出的统计职业道德标准,值得我们学习和借鉴。
规范的目的
美国统计学会制定的《统计实操道德规范》(Ethical Guidelines for Statistical Practice,http://www.amstat.org/ASA/Your-Career/ Ethical- Guidelines-for-Statistical-Practice.aspx)旨在帮助统计从业者基于道德规范做出决策,通过告知从业人员应遵循的统计分析标准以提升其责任心。统计学将观察力与收集证据和决策的能力联系起来,为建设一个更为知情的业态奠定了基础。因为专业领域有赖于统计方法支持的知情判断,所以,所有统计从业者,无论受训背景、职业或职衔如何,均有义务以专业的、合格的且道德的方式工作,同时劝阻任何非专业的和科学不端的行为(具体见讨论1)。
良好的统计实操建立在透明的假设、可重现的结果与合理的解释的基础之上。在某些情况下,本规范的条文之间可能会有矛盾,需要我们根据具体内容确定条文间的优先顺序。然而,在任何情况下,利益相关者都有义务以诚为本,以符合本规范的方式行事,并鼓励他人也如此行事。更为重要的是,统计实操的专业精神所追求的是既要掌握先进知识,又要避免产生负面影响;利用统计手段追求不正当目的本质上是不道德的(具体见讨论2)。
本规范既适用于统计专业人员,也适用于使用统计方法的非统计专业人员。因此,无论职衔和学历背景如何,贯穿本规范的“统计从业者”(statisticians)一词系指所有统计学和量化科学的从业人员,包括各级统计专业人员和其他专业领域的统计应用人员。
A.职业诚信与责任心
道德的统计从业者应不带偏好或偏见地使用相关且恰当的方法和数据,以获取真实的、可解释的和可重现的结果(具体见讨论3)。作为道德的统计从业者,不会故意接受力所不能及的工作,会诚实地告知客户任何专业方面的不足,遇到问题时会向其他统计从业者请教。
道德的统计从业者应做到:
1.识别和减少任何由研究者或数据提供者可能事先确定或影响分析结果所带来的倾向性(具体见讨论4)。
2.针对特定问题选择恰当和有效的抽样及分析方法,使之在合理假设下,以最小误差将分析结果由样本外推于相应的总体(具体见讨论5)。
3.承认并尊重他人的贡献和知识产权。
4.在确定壁报、论文或其他学术作品的作者排序时,如果排名基于学术贡献以外的考虑,须充分说明其依据(具体见讨论6)。
5.须披露任何利益、财务或其他方面的冲突,并根据既定的行业/区域/当地的法规进行管理或控制(具体见讨论7)。
6.对自身的专业行为承担全部责任,仅提供其本人愿意接受同行评议的专家证词、书面文件和口头报告。
B.数据和方法的完整性
道德的统计从业者应坦诚对待数据中任何已知或可疑的局限、缺陷或者偏倚,它们可能会影响统计分析的完整性或可靠性。在分析中认识数据的可靠性和完整性的程度,才能对结果做出客观和有效的解释(具体见讨论8)。
道德的统计从业者应做到:
1.应说明数据的分析与解释所基于的统计假设和专业假设。在报告所采用数据的真实性时,说明数据的整理过程,包括缺失数据的填补方法和缺失机制。
2.报告统计推断的局限性和可能的误差来源(具体见讨论9)。
3.在出版物、报告或证词中,须列明负责统计工作的人员。
4.报告数据的来源及其合理性。应说明研究中考虑的所有数据和实际所用到的数据。
5.清楚地报告为保证数据完整性和真实结果所采取的全部措施。
6.必要时应强调研究中尚未考虑的潜在混杂因素。
7.在出版物和报告中,以诚实和有效的方式向用户或读者表达研究发现,包括表格、模型和图形。
8.在出版物或证词中,明确阐述研究经费的资助者、研究目的和研究结果的预期用途。
9.对源于志愿者数据或其他可能不具有目标总体代表性的数据,报告分析结果时,应包括适当的免责声明。如果使用了恰当的加权方法,也应予以报告。
10.为了协助同行评议和复核,只要可能或允许,应尽可能共享分析中使用的数据,但要谨慎行事,以保护专有和机密数据,包括可能会不恰当地泄露研究对象身份的所有数据。
11.力求及时纠正在最终研究报告或已发表的报告中发现的任何错误,并根据情况将错误更正信息公开发布或知会依赖该研究结果的他人。
C.对科学/公众/资助者/委托人的责任
道德的统计从业者应支持推断的真实性、透明性和科学性,并有意维护公众、资助者、委托人或客户(以及同行、患者、公众和科学界)的利益(具体见讨论10)。
道德的统计从业者应做到:
1.在可能的范围内,向客户或雇主提供可选择的有效的统计方法,这些方法可能因研究范围、成本或精度而有所不同。
2.努力解释若不遵守既定的抽样或分析计划可能导致的任何不良后果。
3.科学地应用统计抽样和分析程序,而不预设结果。
4.应不限于自己的应用领域,努力在更广的领域传播新统计知识,造福社会(具体见讨论11)。
5.在法规要求范围内,理解并恪守数据收集、发布和传播的保密要求和数据提供者的限制性约定,相应地保障数据的使用和披露,以及保护雇主、客户或资助者的专属信息。
D.对研究对象的责任
道德的统计从业者应在研究的全过程中保护并尊重人类受试者和实验动物的权益,包括人口普查或抽样调查的受访者,数据管理系统可提取的研究对象,以及生理或心理干预研究的对象。
道德的统计从业者应做到:
1.为保护人或动物为研究对象的权益,应熟悉和遵守相关的规定、许可和操作规范(具体见讨论12)。
2.明确告知所推荐的样本量,避免样本量过高或不足。应根据健康状况、福利、隐私和自身数据所有权等综合情况确定样本量,避免研究对象承担超额的风险(具体见讨论13)。
3.无论数据直接来源于研究对象,还是来源与他人的数据或现存记录,都需保护研究对象及其相关数据的隐私和机密。在得到研究对象同意后,其数据及其相关数据集的二次使用和间接使用需提前请求获得准许,同行评议和分析结果的独立复核也应通过恰当的渠道获得批准。
4.了解法规在保障隐私权和保密性方面的限制,当上述法规可能不适用时,不宜过度承诺或预设对合法隐私和机密的保护。
5.对于涉及人类或组织的研究,在研究对象纳入之前,或在分析该研究数据之前;在评阅公开或内部使用的文稿的时候,应考虑是否获得有关研究对象的许可。在评估数据来源是否适宜时,统计从业者需考虑其如何对待研究对象(如保密协议、预期的隐私权、知情同意权等)(具体见讨论14)。
6.在考虑是否参与一个特殊来源数据的分析时,如果参与将被信息提供者合理地认为是侵权行为的话,则需果断拒绝。
7.应认识到任何关于某群体的统计描述可能造成贬损该群体的风险,需以谨慎和敏锐的态度使形成的信息不给弱势群体带来伤害。
E.对研究团队成员的责任
科学和统计实操常由有着不同专业标准的各行专业人员组成的团队执行,统计从业者须知如何在这种环境下符合道德地工作。
道德的统计从业者应做到:
1.应认识到不同学科有不同的研究实操方法和标准,不同领域的专业人员有其自己的标准和责任,统计从业者没有义务遵守与本规范相矛盾的其他专业标准。
2.确保所有的讨论、统计设计与分析的报告都符合本规范要求。
3.不能为求便利或一己私利而损害科学真实性(具体见讨论15)。
4.努力提高研究设计、实施过程和所有分析报告或报道的透明度。
F.对其他统计学家或统计从业者的责任
对于所观察到的现象,统计实操需考虑全部可能的解释。出色的研究者会利用自己独到的经验对不同解释的合理性形成潜在的有别于他人的判断。即使观点相左,统计从业者以相互尊重的态度,专注于科学原理、方法论和数据本质的解释,才是使讨论获得成功的最佳方式。
出于对统计从业者的尊重,道德的统计从业者应做到:
1.在保证数据质量的前提下,应尽可能地促进数据和方法的共享,使数据文件满足于复核分析、meta分析及其他合格研究者所开展研究的要求。
2.通过适当的同行评议以提高他人工作的质量。在同行评议中,应尊重不同意见和评估方法,及时、彻底、深思熟虑地完成所接受的评议任务。
3.使学生们和非统计专业人员逐步认识到他们正在学习或使用的概念和方法的实用价值。
4.应以专业水平和贡献大小作为统计从业者的任用奖惩依据,包括雇用、解聘、晋升、工作分配、发表文章、演讲、职位和奖项的候选人资格、资助或研究准许等,以及其他专业事项。
5.不骚扰或歧视任何人。
G.对指控不端行为的责任
道德的统计从业者需清楚有科学瑕疵与误导性操作之间的区别,并避免上述两种情况的发生;如发生,应清楚如何应对。
道德的统计从业者应做到:
1.不包庇任何不专业、不道德的统计分析。
2.应认识到意见分歧和诚实的错误并不构成不端行为,它们需要通过讨论予以解决,而不是指责。
3.应了解不端行为的定义和处理程序,如遇不端行为调查,应遵循既定的处理程序。
4.在调查过程中严格保密,并在调查结果确认后,及时向适当对象及利益相关方披露。
5.对不端行为调查之后,支持各有关方为纠正错误所做的努力,对那些提供了可能有科学错误的报告人或具有不端行为的人,帮助他们以尽可能正确的态度继续其职业生涯。
6.应避免和阻止通过恶意曝光他人可能存在的科学错误或不端行为,损害他人就业能力的做法。
H.雇主 (包括组织、个人、律师或其他客户等) 雇用统计从业者的责任
雇主聘请任何人士分析数据无疑是看中其恪守客观原则的专业声誉,这就要求雇主一方有责任理解和尊重统计从业者的客观性。
统计从业者的雇主应做到:
1.应认识到本道德规范是为了同等程度地保护和支持统计从业者及其服务对象而制定的。
2.应认识到真实可靠的研究结果是在专业和道德的环境中产生的。雇主、资助者或统计分析授权人有义务充分信赖合格的统计从业者对数据分析所做的专业判断,这一点对涉及身体、财务或精神方面影响的统计分析尤为重要(具体见讨论17)。
3.应认识到真实可靠的统计研究结果无法保证与研究者或统计从业者的期望一致。
4.应认识到只报告或采纳那些符合预期的结果,不明确公开与之相背的结果,也不交代所报告、使用和/或引用的结果的选择依据,是有悖于本规范的(具体见讨论18)。
5.应认识到欲将参与统计工作的专业人士列为作者、或项目及出版物的贡献者时,需事先征得他们的同意,因为这样做意味着他们对该项目或出版物进行了背书。
6.应支持真实可靠的统计分析,并揭露不合格的或舞弊的统计行为。
7.对恪守本规范的统计从业者,应尽力维护其学术自由和专业职责(具体见讨论19)。
讨 论
1.在医学诊断和生物医学研究领域,统计的应用可能会对个体的生命和健康,甚至医学科学进步产生影响。例如,职业、环境或交通安全方面的统计分析可能对生命与健康至关重要;新发或复发传染病的早期监测与控制有赖于可靠的流行病统计;统计分析在心理学和社会学中的应用,对精神健康和社会健康也可能具有重要作用。
经济的有效运行取决于是否可靠、及时和合理地解释经济数据;个别公司的盈利能力在一定程度上取决于其质量控制和市场研究,而这两者都应有赖于统计方法;农业生产力很大程度上得益于研究和产出报告中的统计学正确应用;政府关于公共卫生、刑法、社会公平、教育、环境、国防和安全的决策也相当程度地依赖于真实可靠的统计。
2.不端行为不限于剽窃和捏造或伪造数据的情况,更广泛地讲,它包括所有职业不端行为,例如,收取回扣或玩忽职守,在专业活动场合对他人的不敬与伤害,未经授权使用他人的无形和有形产权,无正当理由地诋毁他人的声誉等。
3.一般而言,对研究对象和统计方案的充分理解是每项研究的基础。统计分析计划是在研究的不同阶段(探索阶段、中期阶段、结束阶段)在接触到相应的研究数据之前制定的,它明确定义了不同阶段的技术标准,以阐明与研究的关联性及数据集的使用。
4.在同一阶段对同一数据集进行多重检验时,获得至少一个不当结果的机会将会增加。从平行的多重检验中选择某一个“显著性”结果可招致错误结论的巨大风险。上述情形下,若不能阐明所有的分析结果,很可能产生误导作用。
5.例如,在观察性研究中需要强调多个潜在的混杂因素,而且在因果推断中需格外谨慎。事实上,某一个程序并不能保证其正确性或适用性,应充分理解每一项研究中的理论、数据和所使用的统计方法。
6.值得提倡的是,在统计出版物中作者的排序应以对研究和文稿的学术贡献为依据,这一做法在一定程度上是切实可行的。当采用其他的作者排序规则时,应以脚注或尾注形式标注。在按贡献进行作者排序与招聘、晋升或职位有关的情况下,若采用了其他排序规则却又不公开告知的话,可能会影响到相关人员的职业生涯。
7.与个人利益相冲突时,有时需要采取回避或退出的方式。利益冲突可能会引发某些问题,例如,基金评审,其他同行评议,奖学金和个人或家庭经济利益之间的紧张关系等。
8.对一般公众而言,需告知研究的范围、关联关系以及结论,而不掺杂技术干扰的成分。对于专业文献,则力求解答同行可能会遇到的问题。
9.例如,应披露所有严重违背既定的抽样或分析方法的事件,并解释其可能带来的不良后果。应阐明所采用分析方法的适用性和相关研究假设的合理性,并交代实现分析方法所用的计算机程序。
10.鼓励统计从业者在专业活动中,为国家乃至世界的社会进步和统计学术水平的提升做出贡献。众所周知,做公益工作的能力可能受限于就业条件和个人情况,但统计从业者本人应争取公益工作的机会,如服务于当地社区或国际组织的机会,同时也鼓励统计从业者为专业协会(包括ASA总会、分会和地方学会)等提供公益服务。
11.统计方法可广泛适用于多种类型的问题或应用。统计创新者理应以其作品、软件或研究成果而获得奖金或其他奖励。
12.应制定周密的计划,以支持研究的应用价值、预期结果的有效性和提供保障的能力,还应考虑所有其他有关的道德问题。
13.这些建议可能是基于前瞻的检验效能分析、研究终点的预设精度或其他方法,以确保样本量不仅适于频率方法,亦适用于贝叶斯方法。样本量的确定也应考虑到获取研究对象和相应数据的可行性。
14.知情同意不一定由研究对象本人做出,也可以由其知情的父母或法定监护人做出。对于未成年人或丧失知情同意行为的成人,其知情同意可由其法定监护人执行。在动物研究中,统计从业者应要求纳入实验动物的所有者或机构出具知情同意书。
在所有情况下,应避免或尽量减少隐瞒现象。需重点强调,利用心理学、社会学和其他研究的经验,在研究方案确定前进行独立的伦理审查,并对研究进行全程监查是非常必要的。在某些随机临床试验中,有些研究参数对研究对象或其他研究人员是保持盲态的,但通常需告知这些盲态信息的性质和理由。对于盲态问题,也应确保研究方案的独立伦理审查和对研究的持续监查。
15.所有研究都会受到资源的限制,包括可用的资金、时间和人力。如果这些都能满足的话,研究可以达到理想中的最高标准。但是,统计从业者应该充分利用已有资源力求达到最有效的结果,同时避免研究可能产生的误导或无意义的结果。
16.本规范所提供的安全保障,将会降低我们在参加研究之后才意识到道德问题的风险。
17.在发生利益冲突时,统计从业者与其雇主应私下解决所涉及的道德问题;如果私下无法解决,统计从业者有道德上的责任在对研究对象或全社会造成危害之前揭露这些不当或有违道德的做法。
18.为确保某一特定结果而采取的任何措施都会降低分析结果的真实可靠性。迫使统计从业者背离本规范,不仅会动摇研究结果的真实可靠性,亦会损毁从业者的专业信誉。
19.在普遍使用统计方法的机构和职业中,具有较高声望、权力或地位的统计从业者有责任捍卫学术自由,有义务督促更多的下属遵守本规范。
(致谢:感谢Wasserstein教授代表美国统计学会授权同意翻译本规范。感谢南方医科大学生物统计学系2014级本科生吴研鹏、韩妍妍、荆典、田雨晨、王掣、杨乐等为翻译本规范所做的贡献。)
(责任编辑:郭海强)