统计模型应用的学术规范研究
2016-02-12范超
范 超
(1.国家统计局 国际统计信息中心,北京 100826; 2.中国人民大学 统计学院,北京 100872)
统计模型应用的学术规范研究
范超1,2
(1.国家统计局 国际统计信息中心,北京 100826; 2.中国人民大学 统计学院,北京 100872)
在中国社会科学领域研究中,统计模型泛化过程中的误用、滥用现象日益严重,模型应用中的种种失范行为违背了学术精神。统计模型应遵守的学术规范包括:模型的建立和调整要有理论依据,合理的模型是主观与客观的统一;实证分析中应重视数据质量以免错用滥用统计数据,建模中要避免命题不可证伪,陷入“数字游戏”误区等。通过学术规范彰显的学术精神应体现在对模型方法做出有价值有意义的创新或是根据模型结果论证新的命题。当前,中国应制定有关统计学的学术规范,并完善期刊的审稿制度来解决统计模型的学术失范问题。
统计模型;学术规范;学术精神
一、引 言
近年来,统计模型在中国社会科学领域的应用日益广泛,在研究事物的数量特征方面,它无疑是一种有用的工具,但在模型泛化过程中也出现了大量误用、滥用现象,受到学术界种种质疑和批评,例如在研究中牵强使用模型、用模型点缀论文、将简单问题复杂化等[1]。这些现象呈现的是中国学者种种学术失范行为,不仅使统计模型失去了应有的作用和意义,更是对“独立之精神,自由之思想”学术精神的亵渎,违背了科学求真精神,不利于开展学术对话。
本文主要根据统计模型的内容,以建模过程为主线,从模型建立、假设条件、数据质量、模型结果、模型调整等方面,结合学术创新与学术精神,分析当前中国社科领域研究中在应用统计模型方面常见的失范行为,研究应遵守的学术规范,提出规范模型使用的政策建议。
二、文献综述
目前,学术界关于统计模型学术规范的综合性研究相对较少。国外一些专业学会针对本学科统计模型的使用做出了具体规定,最具代表性的是美国心理协会(APA)的学术规范著作《美国心理学会出版发表手册》*国内将该手册的第六版译为《APA格式》。,从公式、统计内容表述、符号等方面对统计方法的使用做出了明确规定[2]。如果说该手册是侧重于形式上的规范,那么APA的科学事务委员会1999年专门发文,进一步从内容上指导统计模型的使用。该文从方法、度量、结果、分析及讨论等五个方面阐述了统计模型应遵守的原则[3],但APA的规范仅是针对心理学领域中常用的模型,“不是对研究方法的总体评论,而在一个领域适用的原则可能在另一领域并不适用”[2]。此外,亦有学者针对某个具体问题来分析因模型使用不当所带来的问题,如Paul所阐述的由于参数的稳健性所带来的“变色龙”效应[4]。
国内与此相关联的研究主要有两类:一类是讨论在经济学研究中是否应大量使用模型,例如赵凌云认为当代经济学广泛使用模型工具有利于提高经济学的工作效率,但如果过于数学化也会使经济学失去社会科学的应有特征[5];李金华进一步分析了经济学论文模型泛化的表现及成因,认为模型的滥用和错用不在于模型本身,而在于模型的应用者或设计者[1]。这类研究主要是从宏观层面上讨论,其结论普遍认为在研究中关键是要能够正确合理使用模型,但并没有具体论述如何合理使用模型。另一类研究是从微观技术层面讨论模型在使用中的一些注意事项,如于晓华从数据、模型和参数三个角度出发,具体讨论了数据来源、变量外生性、伪回归等计量经济模型中需要注意的问题[6]。孙秋碧等从数量分析方法中的多解现象展开研究,分析了多解存在的原因:结论的语境、随机成分和错误的模型, 并针对数量分析方法误用展开进一步讨论[7]。这类研究对于某些模型的具体使用具有指导性,但讨论的内容相对零碎,过于细节化,缺少明确的主线。
虽然国内对统计模型这一专业领域的学术规范研究较少,但对一般意义上的学术规范早有讨论,其中有两点值得注意:一是学术规范不仅包括诸如引文、格式等形式上的规范,也包括内容上的规范,如陈学飞认为学术规范可分为技术、内容和道德三个层次[8];二是学术规范与学术创新、学术精神是紧密相连的,如孙利天认为学术规范的内在支撑是学术精神[9];叶继元认为 “学术规范的目的或精髓是要求学术积累和学术创新”[10]。而学术泰斗陈寅恪提出的“独立之精神,自由之思想” 是对学术精神的精辟概括,是学术研究中应恪守的普世原则。
综上所述,当前缺少能够全面具体论述中国社科领域研究中使用模型时应遵守的学术规范;对统计模型学术规范的研究应包含对学术精神与学术创新的讨论。考虑到学术界对论文中有关引文、符号、格式等已有明确的规定,如《APA格式》、《芝加哥手册》、《哈佛格式》等,因此本文对该部分内容不再累述,而是侧重于研究统计模型内容方面的规范,并且结合建模中应彰显的学术精神进行讨论。
三、统计模型应用的学术规范及失范表现
学术界尚未对统计模型的学术规范做出统一明确的规定。在应用统计模型的过程中,主要包括根据研究问题选择建立合适的模型,提出必要的假设条件,根据实际数据计算求解模型,对模型进行调整等步骤。建模中,研究者根据问题的需要,也可能对模型做出推广改进等创新。根据上述建模步骤和内容,本文将统计模型应用的学术规范定义为:学术共同体根据学术求真的本质和学术创新的要求,在模型建立、假设条件、数据使用、模型调整等应用统计模型各个环节中应遵守的准则。这些准则应具体包括:模型的建立和调整要有理论依据,避免牵强设计模型;合理的模型是主观与客观的统一,应重视对模型适用条件的讨论与检验;实证分析中不可忽视数据质量问题,以免错用滥用统计数据;建模中要避免命题不可证伪,陷入“数字游戏”误区;通过学术规范彰显的学术精神应体现在对模型方法做出有价值有意义的创新或是根据模型结果论证新的命题等。本文中的模型应用是广义上的应用,不仅包括对现有模型的直接使用,也包括根据实际问题的需要对现有模型的推广与改进等。
模型应用中的种种失范行为存在于上述学术规模定义的各个环节中,因此本文根据建模的各环节步骤对失范行为进行划分归类,即讨论在模型建立、假设条件、数据使用、模型调整等环节中的失范行为。由于学术规范的本质是为了有利于学术创新,因而还需要讨论在创新方面的相关失范行为。考虑到当前失范行为琐碎繁多,受篇幅所限,下文讨论的是一些典型或者带有一定隐蔽性的失范行为,并研究应遵守的规范。
(一)模型的建立和选择缺乏理论依据
在研究事物的客观规律方面,统计模型是一种有用的定量分析工具,但并不是所有研究问题都适合使用模型。有些问题通过描述统计或者简单的统计方法就可以解释清楚,若仍使用复杂的模型,则是一种把简单问题复杂化的失范表现。在决定使用模型后,应充分考虑模型建立选取的依据。在分析问题背景后,首先要依据相应专业理论建立研究问题的概念框架,然后据此来确定模型形式及变量,这样研究对象与所建立的模型之间有较强的对应关系,避免学术界所诟病的牵强设计使用模型。学术界中被广泛认可的模型大多有着坚实的专业理论基础,实质上这些模型是将专业领域的理论用统计模型的语言表示出来。例如,在汇率理论中,国家产品虚拟(CountryProductDummy,CPD)模型是计算购买力平价常用的模型[11]。表面上,该模型是一个仅具有两个截距项的固定效应面板数据模型,实际上,它是将国际贸易理论中“一价定律”*简单地讲,一价定律是指在不存在贸易壁垒及交易成本的条件下,各国可贸易的同质产品的价格水平相同,即“同一商品,同一价格”。的核心内容转化为固定效应模型形式,两个截距项也具有明确的经济学含义*两个截距项分别表示各国的购买力平价及商品的国际平均价格水平。。又如,在生产率分析中,随机前沿分析(StochasticFrontierAnalysis,SFA)模型是一种常用的参数模型[12],形式上它只是在线性回归分析中增加了一个误差项,实际上它是根据微观经济学中的生产理论,在生产函数和距离函数概念的基础上演绎出来的。与之相比,当前中国很多研究中,建立模型时表现为缺乏相应的专业理论依据,通常直接将模型设定为某种形式,即模型形式的确定及变量的选取依据并不充分,这常导致建模时忽视模型的适用条件,没有根据研究对象的特征建立合适的模型,而是为了在研究中能够使用某个特定模型而建模,这种为了建模而建模的行为有用模型来点缀文章之嫌。例如,有的研究通过简单线性回归分析即可解决问题,但研究者将模型直接设定为更为复杂的状态空间模型,且文中未说明隐变量所表示的具体指代,也未给出隐变量服从自回归的依据。在研究现实问题的论文中,模型是作为一种解决问题的工具,它应服从研究问题及专业理论的需要,因此学术求真的精神要求模型的建立和选择要有充足的理论依据,不能作为一种提升论文“含金量”的工具。
(二)缺少对模型适用条件的讨论与检验
任何模型都有适用条件,而模型的基本假设与现实相符的程度是判断模型应用是否恰当的重要标准。若研究对象与模型的前提假定存在较大偏差,那么通过模型得出的结论就可能有误。当前的研究普遍缺乏对模型适用条件的讨论与检验。例如,很多统计模型都要求随机误差项要符合高斯—马尔科夫假设,但当前的研究鲜有文章去深入讨论数据是否符合这些假设条件。又如,诸多通过时间序列数据研究中国经济的论文中,研究者往往在向量自回归(VectorAuto-Regression,VAR)模型的基础上计算脉冲响应函数,以分析误差变动对自身及其他内生变量的影响,但计算脉冲响应必须要保证系统是稳定的,所有外生变量保持不变,如果不满足这些条件,所得到的结果就会失去意义。而中国经济在过去数十年处于快速发展中,即系统并不是稳定的,在这种情况下仍去计算脉冲响应就值得商榷。忽视前提假设也易造成模型使用的过度一般化,产生该模型具有普适性的假象。因此,研究者应重视模型适用条件是否与研究对象相符的分析。在建模中,研究者通常也要提出新的假设,若这些假设仅仅是为了模型建立求解的方便则难以令人信服。例如,贝叶斯分析的难点之一是如何求出后验分布,有的研究者在缺乏对先验信息的考察下,为了计算后验概率分布的方便而直接假定先验分布为共轭先验分布。模型是对客观世界的一种简化和抽象,是研究者根据自身的知识结构等对研究对象的重构和再现,其主观性很大程度上就体现在模型建立和假设条件上。因此,合理的模型与经验事实及专业理论相一致,是主观与客观的统一,这些取决于研究者对问题本质的认识、对模型的理解及对数据的分析。学术求真的精神要求研究对象的主要特征能够与模型的前提假定、适用条件相符。
(三)实证分析中错用滥用统计数据
当模型选定后,数据就决定了模型结果,在某种意义上数据比模型方法更重要。就实际数据本身而言,数据质量是属于数据生产过程中的问题,不是模型应用中产生的问题,但研究者不能忽视数据在生产加工过程中可能存在的问题,否则易造成误用滥用统计数据,导致模型结果产生偏差甚至失去意义。中国的社会经济数据尤其是宏观数据,常在内涵外延、一致性、可比性、调查方法等方面存在问题。有些指标的名称与实际的内涵外延并不一致,不能仅从指标名称来判定是否符合模型要求。例如,一些宏观经济模型中要用到生产法GDP,研究者往往直接使用《中国统计年鉴》中公布的生产法GDP数据,而实际上该指标是根据生产法和收入法混合编制的[13]。数据的一致性和可比性同样是需要重点关注的问题。在使用时间序列数据建模时,有些指标的名称虽未随时间发生变化,但其统计口径已发生了很大变化,在时间维度上不具有一致性,如中国的固定资产投资数据*1992年前,固定资产投资数据的统计范围是全民所有制范围,1993-2003年是国有及其他经济类型单位投资,2004年以后是城镇规模以上投资项目。,如果直接代入时序模型以研究其增速,其结果就混杂了由于统计调查范围的变化所带来的影响。在截面数据中,当模型要用到不同国家的数据时,各国可能对同一指标因定义不同而不具可比性,如国外的工资统计通常会包含实物性收入及虚拟社会缴款,但中国的工资统计未包括这些,亦不可直接代入模型使用。应当指出的是,统计数据在生产加工过程中难免存在各种问题,但不意味着该数据完全不可在模型中使用。例如,有的指标数据在绝对量上可能存在系统偏差,但其同比或环比的相对量可以消除这种偏差,此时建立表示相对量的模型比使用绝对量的模型更适合。通过对数据做适当的转换、调整,或者根据数据质量选择合适的模型,可在某种程度上解决数据质量问题。因此,研究者对数据的分析不仅包括变量分布特征的描述统计,还需要关注数据质量,避免学术界所诟病的“垃圾进,垃圾出”。
(四)模型调整使研究的命题不可证伪,陷入“数字游戏”误区
实证分析中,当模型结果不理想时,如参数未通过显著性检验、结果与预期不符等,研究者通常会调整模型。常见的做法是通过各种技术方法上的尝试,调整出符合要求的模型结果。例如,在结构方程模型中,当模型的拟合效果不甚理想时,研究者直接根据结果中的修正指数来增减变量间的相关性及因果关系,以提高模型的拟合优度。实际上,对于模型使用熟练的研究者,通过技术手段调整出理想的结果并不难,但这种做法会使所研究的命题不可证伪,而科学研究应是既可证实也可证伪[14]59-94。在上例中,如果研究者不能通过新的独立样本来验证调整后的模型,则会使研究不可证伪。通过技术手段直接调整模型的方式也易陷入玩统计“数字游戏”的误区,使得结果失去意义。例如,有的重要解释变量未通过显著性检验,研究者为了使其在数值上显著,不断尝试换取不同时间段的变量,直到检验的P值小于0.05为止。就本例而言,这种做法是混淆了统计推断和探索性分析[15]514,表面上变量通过了统计检验,但该检验已失去了意义。产生这种失范行为的重要原因是研究者在实证前已对模型结果设定了目标。我们可以对实证结果有理论预期,但不能把理论预期等同于模型必须要得到的结果,否则这种研究前就已设定结论的方式使得研究的命题不可证伪,从而使研究失去意义。当需要对模型调整时,如果所研究的命题是根据有关专业理论构建的,那么调整的起点应该从概念框架进行调整,找出支持做这种修改调整的理论依据,重新提出假设,重新建模。模型结果不会总令人满意,但先有结论后进行研究的方式违背了科学研究的原则,学术求真的精神要求客观对待模型结果,保持价值中立,模型调整同样需要理论依据。
(五)将模型应用的简单重复当作研究的创新
通过模型能够论证新的命题是实证分析的创新所在。然而,在一些研究现实问题的论文中,作者认为本文的创新之处是在该问题上根据某模型首次进行了定量分析。实际上,文中所用模型在该问题所属领域早已广泛应用,其“创新”仅是在模型中换了一批数据一个具体问题而已。这种创新是把文章的原创性与论文数据的新颖性混为一谈了。数据或题材的新颖固然是研究中具有新意的表现,但学术精神中的“独立之精神”则要求论文能够提出并论证新的命题,即命题上的创新是文章独创性的体现。如果文章仅止于数据的新颖而未根据模型结果论证新的命题,这只是模型的一般应用而已,其一典型之例是数据包络分析(DEA)的滥用。DEA是一种测度效率的非参数方法,由于它具有适用条件宽松、能够处理多产出等优点,因而研究者常选取该模型测算各个领域的效率。从中国期刊网主题搜索DEA,多达1万余条结果。但诸多文章只是对DEA的一般应用,作者称该文的创新之处是首次在该地区、该行业或该领域使用DEA测算了相应的效率,研究方式几乎都是确定投入产出数据后,代入模型计算出效率值再加以评论。如果该文的目的仅是为了测算出相应的效率值,这种工作是有意义的。但如果从学术精神高度考虑,这只是DEA在实际问题中的不同应用而已。模型是对一般规律的刻画,具有投入产出关系的问题大都可以应用DEA测度效率,真正的创新应该是能够针对投入产出变量的选取或模型结果发现新的问题,从而提出有关效率度量新的观点,弥补现有研究的不足,对效率测度有实质性的推进。此外,有一些实证研究认为其创新之处是使用了学术界中的某个新模型,但在该研究中只是将原有的国外数据换成了中国数据而已。如果这种研究未通过新模型发现出新的问题进而论证新的命题,或者论证的是众所周知的命题,则也是模型的一般应用而已。例如,有的研究通过复杂的二维动力系统来分析科技进步与经济增长间的关系,得出的结论却是常识性的命题:科技进步是经济长期增长的关键因素。因此,无论是使用了新数据或是新模型,如果与已有的研究相比,并未得出新的命题,那么它就不是真正的创新。造成这种模型应用上的简单重复的重要原因是缺乏学术积累,“没有同现存的研究进行任何理论层次的对话”[16]。
(六)模型创新缺少学术意义或实际应用价值
研究者根据问题的需要也常对现有模型做出推广改进或提出新的模型。若参照评判理论优劣的标准[17]22,模型创新可从以下三方面入手:一是扩大原模型的使用范围。新模型是对原模型的推广,或放宽了原有的假设条件,或原模型可看作是新模型的特殊情况,在某种条件下(如新模型中的参数取某值时),新模型可转化为原模型。具体是使用新模型或是原模型,可通过假设检验等方法来确定。模型推广是建模中较为常见的一种创新形式,有助于解决更复杂的问题,发现本质规律。例如,Hansen提出的门限回归模型可看作是线性回归分析在分段回归问题上的推广[18],是否需要使用该模型可通过检验模型中的门限变量来判断。二是改进现有模型的缺陷。与上述模型推广相比,这类创新的特点是提高了模型的解释能力或预测精度,常表现为调整模型的某些条件或改进模型的内部结构,使得改进后的模型与研究对象的特征更吻合,因而更合理更符合实际。例如,在DEA模型家族中,BCC模型对CCR模型的改进就属于这种情况。在测度效率中,CCR模型假定各企业的生产情况是规模报酬不变,但BCC模型将该假设调整为规模报酬可变,通过改变CCR模型中的约束条件得以实现[19]。三是提出了具有实用或学术价值的新模型。这类模型创新的特点是可获得显著的经济社会效益,或是模型中蕴含了新的思想,有益于开辟新的研究领域,发现新的理论、方法。例如,LASSO模型的提出就具有很高的学术价值[20],它成为高维领域中变量选择的经典模型,开辟了新的模型家族,之后诸多统计模型都是在该模型基础上提出的*变量选择模型中的Elastic Net、Group Lasso、Adaptive Lasso、Fused Lasso等模型都是在Lasso模型基础上提出的。,成为近十年来统计学界的热点前沿问题。需要明确的是,创新应是有价值有意义的,不能简单理解为与现有模型有所不同就是创新。有些研究表面上是“创新”出更复杂更一般化的模型,但实际上是对现有模型的机械拼凑、陈旧方法的相互套用,此类“创新”只能看作是对现有模型的模仿复制。有些“创新”后的模型假设条件繁多苛刻,结论却很单薄,这种“创新”只是在做一些数学推导而已,也不符合数学美。模型创新应着重解决学术界共同关注的问题,新的模型也应是对某一类问题都适用,而不是仅能解决个别问题。真正的创新需要研究者在知识的广度和深度上具备较高修养,深谙学术界的前沿热点问题。模型创新失范的直接原因是学术积累不足,更根本的原因是对学术的急功近利,为了体现研究的价值,在不具备模型创新的条件下也要“创新”,这同样是对学术精神的违背。
四、有关统计模型学术规范的两点建议
(一)有关部门应制定统计学的学术规范文本
为了更全面规范学术共同体对统计模型的应用,建议中国教育主管部门组织有关专家制定、出台权威的学术规范文本,并有一定的强制性和约束力。迄今,中国有关部门仅制定了一些各学科通用的学术规范准则,如《高等学校科学技术学术规范指南》、《高校人文社会科学学术规范指南》等。这些规范指南更多地是从形式做出规定,如引文、注释的规范等,而中国的学术界普遍缺乏对专业学科领域的学术规范,作为一级学科的统计学亦不例外。而在国外,除了一般性的学术规范准则,亦有专业学科领域的学术规范,如前文所述的《美国心理学会出版发表手册》等。统计模型是统计学的重要组成部分,考虑到出台学术规范的可行性,首先应该由专家学者通力编制统计学的学术规范准则,不仅在体例规则上,而且能在内容、技术层面对统计学中的统计模型部分做出规范,以使学者有章可循,“尽管规范中难免存在例外,但遇到疑问时也能有所参考”[2]。
(二)完善学术论文的审稿制度
统计模型的规范使用与期刊的审稿用稿导向也有很大关系。当前学者所用的统计模型普遍比较复杂,且种类繁多,因此需要期刊不断完善外审专家库的建设。在用稿方面,期刊对于统计模型的使用原则,应秉承学术的求真本质,看重是否通过模型得出了新的命题或者是否对模型方法做出了有价值的创新,不是单纯以模型的复杂程度评判研究的含金量。在模型应用的其他方面,可关注模型建立及调整的理论依据、假设条件的合理性、数据质量等。此外,为了保证模型结果具有可复制性*即读者在使用相同程序和数据条件下,可以得到与作者相同或相似的结果。,可参照英国皇家统计学会期刊的做法,在期刊官网上可下载论文中的源程序、数据。
五、结 论
本文探讨了统计模型应用的学术规范问题,中国学术界在统计模型上存在的学术失范行为不止上文所列,本文仅是起到抛砖引玉的作用。造成学术失范的原因是多方面的,既有研究者对模型的理解存在误区,也有制度规则上的缺欠,但更根本的原因是学术积累不足,在研究上存在急功近利行为。统计模型学术失范问题的解决也有待于中国学术界整体氛围的净化。在社科领域中,统计模型在探求本源、寻求规律方面是一种有用的分析工具,研究者应不断提高自身的学术修养,在学术规范中彰显“独立之精神,自由之思想”的学术精神。
[1]李金华. 经济学论文模型泛化现象解析与思辨[J]. 经济学动态,2013(3).
[2]AmericanPsychologicalAssociation.PublicationManual[PubManual]oftheAmericanPsychological(Psych)Association[S]. 6thed.WashingtonDC:AmericalPsychologicalAssociation,2010.
[3]TheTaskForceonStatisticalInferenceAPABoardofScientificAffairs.StatisticalMethodsinPsychologyJournals:GuidelinesandExplanations[J].AmericanPsychologist,1999,54(8).
[4]PaulPfleiderer.TheMisuseofTheoreticalModelsinFinanceandEconomics[R/OL].[2014-03-26].http://www.gsb.stanford.edu/sites/default/files/research/documents/Chameleons%20-The%20Misuse%20of%20Theoretical%20Models%20032614.pdf, 2014.
[5]赵凌云. 经济学数学化的是与非[J]. 经济学家,1999(1).
[6]于晓华. 如何正确运用计量经济模型进行实证分析——实证分析中的数据、模型与参数[J]. 农业技术经济,2014(7).
[7]孙秋碧,魏瑾瑞.数量分析方法的选择与应用——来自课程作业和建模竞赛的思考[J].统计与信息论坛,2010,26(10).
[8]陈学飞. 谈学术规范及其必要性[J].中国高等教育,2003(11).
[9]孙利天. 学术规范的内在支撑——学术精神[J]. 吉林大学社会科学学报,2005,45(1).
[10]叶继元. 学术期刊与学术规范[J]. 学术界,2005(4).
[11]DSPrasadaRao.ComputationofBasicHeadingPurchasingPowerParities(PPPs)forComparisonswithinandbetweenRegions[C].Chapter4inMeasuringtheRealSizeoftheWorldEconomy,WorldBank,WashingtonDC, 2013.
[12]AignerDJ,LovellCAK,SchmidtPJ.FormulationandEstimationofStochasticFrontierProductionFunctionModels[J].Econometrics,1977, 6(1).
[13]中华人民共和国国家统计局. 中国主要统计指标诠释[S]. 2版. 北京:中国统计出版社,2013.
[14]查尔莫斯A.F. 科学究竟是什么[M].3版.鲁旭东,译.北京:商务印书馆,2013.
[15]DavidSMoore,WilliamINotz.Statistics:ConceptsandControversies[M]. 7thed.NewYork:W.H.FreemanandCompany,2008.
[16]王笛. 学术规范与学术批评——谈中国问题与西方经验[J]. 开放时代,2001(12).
[17]风笑天. 社会研究方法[M]. 4版. 北京:中国人民大学出版社,2013.
[18]HansenBruceE.ThresholdEffectsinNon-dynamicPanels:Estimation,TestingandInference[J].JournalofEconometrics,1999,93(2).
[19]BankerRD,CharnesA,CooperWW.SomeModelsforEstimatingTechnicalandScaleInefficienciesinDataEnvelopmentAnalysis[J].ManagementScience, 1984,30(9).
[20]TibshiraniR,RegressionShrinkageandSelectionviatheLasso[J].JournaloftheRoyalStatisticalSociety,SeriesB1996, 58(1).
ResearchontheAcademicNormoftheApplicationofStatisticalModels
FANChao1,2
(1.InternationalStatisticalInformationCenter,NationalBureauofStatistics,Beijing100826,China;2.SchoolofStatistics,RenminUniversityofChina,Beijing100872,China)
Inthefieldofthesocialsciences,misusingandabusingstatisticalmodelsaremoreandmoreseriousintheprocessofwidespreadusingmodels.Allkindsofnon-standardbehaviorsviolatethespiritofacademicresearch.Statisticalmodelsshouldcomplywithacademicnorm.Itincludes:Makingandmodifyingmodelsshouldhavetheoreticalbasis;areasonablemodelistheunityofsubjectiveunderstandingandobjectiveworld;empiricalanalysisshouldpayattentiontothequalityofdatainordertoavoidmisusingorabusingstatistics;theprocessofmodelingshouldavoidmakingthesisstatementsunfalsifiableandplaying"numbersgame".Theacademicspiritshouldbereflectedinthemeaningfulinnovationsforthemodelsorproposingnewthesisstatementsbasedonthemodelresultsbyacademicnorm.NowChinashouldmakerelevantstatisticalacademicstandardsandimproveacademicpeerreviewsystemtosolvetheproblemofnon-standardacademicbehaviors.
statisticalmodels;academicnorm;academicspirit
2016-03-28
国家自然基金项目《金融资产配置中面板数据动态因子模型研究》(71271210)
范超,男,北京人,统计师,博士生,研究方向:统计模型,购买力平价,效率测度。
F222.3∶O212.1
A
1007-3116(2016)08-0026-06
(责任编辑:崔国平)
【统计理论与方法】