贝叶斯检验与颠覆性技术评价
2021-01-17袁瑜容蒋兴华
袁瑜容,蒋兴华
(1.中山市华南理工大学现代产业技术研究院,广东 中山 528400;2.华南理工大学 科学技术处,广东 广州 510640)
科学假说或理论由于假设性成分的存在以及超前性,往往是正确与错误的混合体,因此必须对它们加以检验。正如彭加勒所说,每个科学理论都是有待检验的假说。就科学检验而言,可分为两大类:先验检验和经验检验。先验检验主要侧重于逻辑检验,先于经验检验。只有通过先验检验的,才值得诉诸于严格的经验检验,这部分主要依赖于观察和实验来检验,即科学检验的一个方面就是理论与经验的相符程度;而由于背景知识的影响作用,科学假说的检验无法绕开的另一个方面就是理论间的相互支持程度。如今科学技术发展日新月异,对于科学理论的评价以及技术发展方向的抉择,已成为日益突出的问题,尤其是在“颠覆性技术”领域。“颠覆性技术”早在1995年由美国哈佛大学商学院教授克莱顿·克里斯滕森提出,是一种具有整体或根本性替代现有主流技术的全新技术或者某一领域技术的跨界创新应用。但是,“技术”的“颠覆性”却是一种基于后置效果的定性,例如当前信息技术即处于极易产生颠覆性效果的领域,我们可以通过相关标准预判诸如信息技术这样的领域可能产生颠覆性技术,但却难以预测哪些技术就是颠覆性技术。那么,如何设定支持领域、提出项目指南、选拔科研项目承担者,寻求一种适用于发展颠覆性技术的评价方式就具有了一定的必要性。
一、贝叶斯方法论——从科学检验的角度看
英国数学家托马斯·贝叶斯的论文《论机会学说中的一个问题》对归纳问题具有重要意义,奠定了贝叶斯方法的基础。贝叶斯方法主要用于评价假说,也可用于我们现在所指的科学评价,其归纳推理的工具是贝叶斯定理:设一个互斥的且穷举集合{h1,h2,…,hn}是互相竞争的假说集合,然后根据其逻辑语言形式或研究者自己的知识(包括研究者自己的思考或思想实验)背景对每一个假说赋予验前概率(prior probability)/先验概率P(H),这是一个理性的主体对一个假说为真的实际的置信度,也是本文主要侧重指出的主观概率。有了各个假说的验前概率和其他相关证据信息之后,就可以运用贝叶斯定理来计算各个假说的验后概率(posterior probability)P(H/e)。可见,贝叶斯定理囊括总体信息、样本信息和经验信息等在内,所以得到的贝叶斯概率是复杂事件的条件概率,贝叶斯方法因此也就能获得相对可靠、安全的结果。故此,目前基于复杂假设的贝叶斯检验开辟了对复杂假设进行检验的新途径,自然也就具有了应用于科学检验问题的可行性和价值。
由于“观察渗透理论”普遍存在于科学观察和实验中,而科学理论和假说的提出与发展、完善以及检验都离不开观察实验,所以,科学检验不存在绝对证实。因此,贝叶斯主义者走了另一条道路:把概率(或然性程度)赋予假说,寻求一条局部合理性道路。
1.贝叶斯定理
贝叶斯定理描述了两个条件概率之间的关系,比如P(A/H)和P(H/A),利用计算条件概率的公式来解决这样一类问题:假设H1,H2…互斥且构成一个完全事件,已知它们的概率P(Hi),i=1,2,…,现观察到某事件A与H1,H2…相伴随而出现,且已知条件概率P(A/Hi),求P(Hi/A)。由概率的乘法公式:P(A∧H)=P(A)*P(H/A)=P(H)*P(A/H),可以导出:P(A/H)=P(H/A)*P(A)/P(H)。如上公式也可变形为:P(H/A)=P(A/H)*P(H)/P(A)。再利用全概率公式:P(A)=P(A/H1)*P(H1)P(A/H2)*P(H2)…P(A/Hn)*P(Hn),可以得到逆概率公式:P(Hi/A)=P(Hi)P(A/Hi)/[P(H1)P(A/H1)+P(H2)P(A/H2)+…+P(Hn)P(A/Hn)],这就是著名的“贝叶斯定理”。其中,我们把P(Hi)称为验前概率,P(Hi/A)称为验后概率。
2.贝叶斯检验的可行性
贝叶斯公式可用于观察到事件发生时,去求导致该事件发生的原因之可能性大小。所以,在一个推理过程中,要由“结果”来推断“原因”,即所谓的“逆概率问题”,就可以利用贝叶斯公式来解决。在经典统计中是把总体分布参数看作是常数,然后根据“小概率在一次试验中基本上不可能发生”的统计推断原理。这种方法的决策法则是假设检验根据原假设所计算出来的观测样本的概率P,当P值大于给定的显著性水平α时接受原假设,反之拒绝原假设。这种方法中原假设和备择假设若调换位置,P值的计算就会变得相对复杂甚至计算不出来。而贝叶斯统计是把总体分布参数看作随机变量,其决策法则是后验概率P值与显著性水平α的比较抉择,当P值大于给定的显著性水平α时接受原假设,反之拒绝。这种方法的原假设和备择假设都是根据后验分布(假设的后验分布是基于先验信息和特定样本信息来获得的)直接计算出后验概率,所以,贝叶斯检验中就算原假设和备择假设的位置调换也不会影响其检验结果。
此外,贝叶斯公式还有一个修正机制,即在搜集信息之前,研究者先根据自身的经验判断给予假说一个验前概率,等搜集到有用信息,则对公式赋予条件概率数据,从而得到一个新的验后概率,对原有判断进行修正。可见,贝叶斯检验是一种将验前信息和验后信息相结合的灵活、直观的统计方法。
3.贝叶斯定理与科学检验
观察过程、认知过程虽有主体理论经验的参与,但是贝叶斯理论中的“意见收敛定理”①[1]对科学的客观性是有保障的,避免了科学非理性和相对主义。把贝叶斯定理用于观察到事件发生时,去求导致该事件发生的原因之可能性大小的功能应用到科学检验中,就可以变成衡量证据对于理论的认证程度。
我们在认识事物的过程中,需要一个假说,但事实上可能有不止一种假说能满足目前的观察,为了求真,我们需要对互相竞争的这些假说进行检验,对比它们之间的可能性大小,然后得出较为可靠的假说。即需先通过计算竞争假说的验后概率,然后通过模型进行比较。但要承认一个前提,就是我们的观察具有渗透性,会存在一定的观测误差,所以当我们用“e”代表观察证据,用“H”代表假说,贝叶斯公式是:P(Hi/e)=P(Hi)P(e/Hi)/[P(H1)P(e/H1)+P(H2)P(e/H2)+…+P(Hn)P(e/Hn)],则预测度、解释力P(e/Hi)大,并不代表假说Hi就更好,因为还要比较假说的验前置信度P(Hi)。在这个公式中,“验前概率”P(H)既基于对理论的内部和外部一致性的评价,也基于部分价值因素,甚至宗教因素。但总会存在共有价值,只不过给予不同验前概率的人是以不同的方式应用共有价值罢了,这是受科学家的个性和经历等特征所影响。故“验前概率”又可称为“主观概率”。要注意的是,这是一种并非纯信念的主观的概率,而是兼具了经验、知识及主体对客观情况的认知而综合评价设定的,不同于主观臆测,且在一定的条件下还可以使用贝叶斯公式加以修正。于是,“验后概率”P(H/e)就是得到信息之后,再重新加以修正的概率。即贝叶斯认证逻辑采用“正相关标准”:[2](P133-141)如果P(H/e)>P(H),那么,e认证H;如果P(H/e)
二、颠覆性技术评价现状
颠覆性技术在科技和产业变革中发挥了巨大的作用,推动新产业、新业态、新模式加速发展甚至是新旧发展模式的替代。颠覆性技术比渐进性技术更能冲击甚至破坏现有的产业格局。如二十年前出现的数码相机产业取代了有着一百多年历史的胶卷相机产业;而具有拍照功能的智能手机产业,又颠覆了卡片式数码相机产业。又如,近年热门的半导体制造产业,光刻可以说是它的先锋,而“浸润式光刻”技术取代主流的“干式光刻”技术,可谓之颠覆性,改变了全球半导体产业的生态。可见,及时跟进、主动适应甚至积极研发颠覆性技术,是当今技术发展的必然选择。但是,与发达国家相比,我国颠覆性技术发展的条件和机制尚不成熟。这是因为:我国技术研发多集中于单一的技术角度,与颠覆性技术的系统化要求存在差距。我国技术研发的试错机会较少,与颠覆性技术创新要求的容错环境不相符。我国尚未形成常态化的颠覆性技术研究机制以及专门的研究机构,无法及时有效的甄别颠覆性技术,也不存在这一领域的专项资金对其进行投入。
颠覆性技术创新既需要在思想理念上有所突破,还要有科学手段的突破,并且要有评价体系的突破。那么,如何积极预测和支持未来的颠覆性技术发展,建立一个具有前瞻性的科技评价体系是必要的。
目前,较为常见的科研评审方式是量表客观评审和专家主观评审两种。前者是根据设计好的常规科学评价指标体系来进行计分分级筛选,是一种结构化的非包容性的客观评价方式。而后者则是基于评审专家个人知识与经验的一种判断评价,具有较强的主观性。除此之外,还有采取客观评审与主观评审相结合的模式,如国家自然科学基金评审采用了在充分客观信息条件下的专家评审方式。但是,颠覆性技术等具有变革性技术的评价通常难以在事前实现,而多为一种事后验证。评价体系的根本难点就在于对潜在的颠覆性创新进行事前评审。因为作为一个全新的假说或者一个跨领域猜想,都是不存在既有客观证据或现成评价指标量表的,也就不能进行客观评审;而主观评审的方法也不可行,因为颠覆式创新与现阶段科学研究不相容,现在的科学共同体对颠覆式技术没有一个共有的认知范式,评审专家自然无法得出让人信服的评价结论。所以,在现有评价体系无法对颠覆式技术做出科学评价的情况下,探索既具有前瞻性评价又符合财政支持标准的评价方法,是科学评价方法论的题中之义。
三、贝叶斯检验的优势及其对颠覆性技术评价的启示
1.贝叶斯检验的优势
贝叶斯方案是在概率归纳逻辑的框架中试图为归纳法的合理性提供辩护,属于概率的辩护。当我们把逻辑有效性赋予给定归纳前提之后的归纳推理,那么,可以把验前概率给予归纳前提,而把贝叶斯概率逻辑看作归纳推理的逻辑,则可以应用遵守数学概率规则的主观主义的贝叶斯理论,来解释假说与证据之间相容的可能性,用验后概率来表示经验证据对理论假设的认证度,也体现于贝叶斯方法的“意见收敛定理”之中。可见,贝叶斯定理作为科学检验的逻辑工具是合理的,也是可应用于重建传统的方法的。
再者,科学检验过程及结果也需要一些模糊性的公认标准来进行评价,科学检验过程也就会摄入主观标准,这一点可体现为贝叶斯主观概率。一个新理论是在反常的海洋中发展壮大起来的,而不是在一开始就被扼杀掉的,贝叶斯主义的主观概率具有实操合理性。何况,贝叶斯理论中已为背景知识留下了重要的位置。至于贝叶斯方法中的验后概率,当证据对检验假说具有一定认证度,②不但取决于其验前概率,而且取决于证据对其竞争假说的意外度。③这样的方法论克服了实证主义和证伪主义的片面性,而统一了两者的方法论合理性。
综上,贝叶斯方法的优越性在于:主观性与客观性的统一,私人性与公共性的统一。无论从贝叶斯理论的内在生命力还是外部影响来看,它都具有一定的理论优越性。
2.颠覆性技术评价的要求
颠覆性技术的“颠覆”特征,就在于其衍生出的新产业/新业态等足以改变现有的产业游戏规则,是在单个领域内无法达到的前沿技术,或者是对科学原理的创新性应用,或者是跨学科、跨领域的集成创新。由于它们具有变革性、不确定性的特点,对其通常难以在事前做出评价,多为一种事后验证。而基于评价指导实践的原则,对潜在的颠覆性创新进行事前评审却是至关重要的。真正颠覆性技术对于现有产业的创新性,足以对未来产生影响,因此对评价体系就提出了更高要求,其中的特殊之处在于要有“宽容原则”。
但是,当前主要的评价体系中,客观评价是在科学数据和充分证据支撑之上的指标体系设计来实现的;主观评价则更多的是同行评议,甚至是相关领域加上跨领域专家的共同评价;此外,也有两者相结合的模式。可是这些传统评价方式并不适用于颠覆式技术,因为既没有充分的客观证据基础,也没有在颠覆式技术初期所能形成的科学共同体。因此,现有评审系统不能适应颠覆性创新评审的需求,我们需要“宽容原则”来持续探索突破常规但又能够公正高效地使用国家财政投入的新方法,摸索出一种与人本评审更接近又与客观证据相兼容的评价方式。
3.贝叶斯检验对颠覆性技术评价的启示
贝叶斯检验的验前概率(主观概率),与主观臆测不同,是根据经验、各种背景知识以及对客观情况的了解进行分析、推理、综合判断而设定的,且在一定的条件下还可以使用贝叶斯公式加以修正。这体现为“验后概率”P(H/e),即得到信息之后,再重新加以修正的概率。那么,颠覆性技术评价所需要的“宽容原则”则体现在贝叶斯公式P(Hi/e)=P(Hi)P(e/Hi)/[P(H1)P(e/H1)+P(H2)P(e/H2)+…+P(Hn)P(e/Hn)]中,就是验前置信度P(Hi)>0,首先赋予它一定的预测度和解释力,然后再通过实践证据来看它的创新性、可行性。当P(H/e)>P(H),那么,e认证H,就足以正向支持该颠覆性技术评价。当我们宁取一种有趣、大胆、信息丰富的理论,而不取一种平庸的理论,就是给予潜在性颠覆式技术存活发展的机会,就是“宽容原则”的体现。然后再根据证据加以修正我们的评价,这种修正过程可以不断地进行下去,在科学检验的过程中得到最接近恰当的科学评价。因此,颠覆式技术评价过程包含着非共识评价、创新度/颠覆性评价以及交叉式评价等与当前的科研评审系统相区别的部分。
我国要提升原始创新能力,要万众创业、大众创新,就要把“宽容原则”放到科学评价中,形成支持颠覆性创新的制度和文化。颠覆性技术评价可以从贝叶斯检验中得到启示:
(1)选取逻辑上更有力的理论或更有解释力和预测力的理论,先结合相关背景知识和人本原则赋予一种大胆假设的技术以一定的验前概率,即P(Hi)>0,然后在科学实践中小心求证,通过收集科学数据等各种证据,修正事前评价,形成下一步推进与否以及如何推进的决策。
(2)政府部门与尽可能多领域的技术领域专家共同进行颠覆性技术评价,开展综合研究与评估,正视其经济影响与社会影响以及人文科技伦理等影响,根据研究的性质和我们对结论准确性所持的要求合理设定显著性水平α的数值,制定相应措施以应对其可能存在的潜在负面效应。
(3)如果两个理论具有相似的解释力度,那么就会优先选择那个更简单的。实践中,就是P(H1/A)约等于P(H2/A)并且都大于α时,社会效益评价趋同时,优先选择更简单的理论和技术方案,达到经济效益更大化。
(4)对颠覆性技术进行长效跟踪研究。设立颠覆性技术的专门服务机构,长期对国内外前沿技术发展情况及趋势进行跟踪研究,以期对我国颠覆性技术发展趋势进行预测,规划设定相关技术发展支持领域、提出项目指南、选拔科研项目承担者,同时设立专项资金,对通过颠覆性技术评价的技术项目,加强支持力度,完善其创新及产业化环境。
注释:
①无论对于A在n次试验中出现r次这一结果赋予怎样的验前概率,随着试验次数n的增加,下一次实验结果出现A的验后概率越来越接近于证据e中A出现的频率r/n。由于这是独立重复试验,下一次试验出现A的概率也就是每一次试验出现A的概率即P(A)或P。
②H相对于e的认证度等于P(H/e)与P(H)的差值,值域是[-1,1]。当认证度为正值,H被e认证;为负值,则H被e证伪;若为0,则两者无关。
③e对H2的意外度等于P(e/H1)与P(e/H2)的差值,值域是[-1,1]。当意外度为正值,e对H2具有正意外度;为负值,则e对H2具有负意外度;若为0,则e对H2不具有意外度。