微积分求导问题考辩与新解(下)
——一种不需要极限与无穷小概念的微积分理论诠释
2018-01-28
(西北工业大学前逻辑与人工智能研究所,西安 710072)
六、 微积分理论新解:变量除法的本质与牛顿、莱布尼兹求导法(第一代微积分)可以成立的理由及贝克莱悖论的彻底消除——极限法求导(第二代微积分)不再需要且有错
变量(函数)除法的本质,是分子(被除式)、分母(除式)消去共同的变量因子,使分母上可以以“1”代之。而“1”在数值(也仅在数值意义上)当然可以不写。这就是所谓“消去”的意义。在物理上,速度就是单位时段走的路。而所谓“单位”,当然就是“1”,如一小时、一分钟等等,而且通常在分母上。一小时走一公里,和两小时走两公里,只是在数值上相等,但含义(信息)并不完全相同。有人可能提出在数值上既然1/1=2/2=3/3……,为什么不能Δx→2?如果非要如此,当然可以。但不管等于多少,唯独不允许也得不到Δx→0。要想得到1或2/2=3/3…等,也都要求分母不能等于或趋于0。
通常微积分导数所涉及的分母上的变量是一次的,因此只讨论这个情况即可。举例:如果有(△x)2/△x,则做了“除法”消去分母上的自变量△x后有△x·1/1=△x,而不是简单地令该式中所有的△x=1得1/1。而对比非变量的3÷2也就是3/2,则可看成是1.5×2/2=1.5×1/1=1.5。即其中2/2折合成1/1。这里之所以用“折合成”这个词而不用“等于”,是所谓除法不是把1/1“折合成”2/2,尽管二者在数值上是相等的。即绝对没有人因为1.5/1=3/2,而反过来认为1.5/1作了“除法”后的结果是3/2的,尽管二者在数值上相等。而1除以△x,则可看成是(1/△x)·△x/△x=(1/△x)·1/1=1/△x。而对自函数△x/△x本身,表面看是直接令其中的△x=1而得之,但实际上严格讲仍是令△x/△x=1/1而得之。这其实是有本质区别的,从前述二次函数情况可以知道。只不过在此时二者的区别被掩盖了。实际上,这里更严格地应该是(1×△x)/△x=1×1/1=1。等式最左边的那个“1”,此时是该特殊的线性函数的系数,只不过此时它为常量1而已。我们之所以如此繁琐地讨论这个问题,是想要看清除法消去分母的本质。总之,所谓变量的除法、分子分母消去自变量△x、消去分母中的自变量等等说法,其实质就是令从变量比值函数中所提取出来的△x/△x=1/1或→1/1(此极限不同于传统标准分析的不可达极限,这里这个极限是可达的。因此其实没必要单独提出)。
下面我们讨论所熟悉的二次函数的增量函数,见公式5。注意,由于此式表示的是二次曲线上的两个点间的“增量”函数,因此,也完全可以看成是过这两个点的直线也就是该二次曲线函数的过该两点的“割线”的增量函数(方程)。此时割线方程中的(2x+△x),实际是该“线性”方程的系数,尽管是含有自变量△x的系数也罢。这一点在下面的论述中十分重要,而且竟然为以往所忽视。现在我们将二次函数的增量函数除以其自变量△x,就是所谓的“增量比值函数”,即文献2的1式。注意,该式可是作了除法“消去”了分母上的△x的。按前述变量除法的本质,它实际上是(2x+△x)·1/1,即文献2中的5式或本文中的6式。此时该式应该只能看成是连接二次曲线上二点的割线方程与其自变量△x之比的“增量比值函数”在自变量的增量△x等于1(注意,此时该方程系数K中的自变量△x并不是该线性方程本身的自变量,因为显然线性方程中的自变量只能是一次的)并且在系数(2x+△x)中的与二次曲线的交点直接相关的那个自变量△x变化时(最终趋于、等于0)始终等于1时的“增量比值函数”【特别强调,此时的△x=1点,不必也不可能总是是割线与曲线交点。而且1/1原则上也可以是2/2、3/3等等,甚至是“无穷小/无穷小”。只要不是0/0即可。它们最终都可化成1/1。因此“不失一般性”,我们完全可以用1/1代表所有的非0/0数。同时,我们看到这样处理后的也就是先用除法消去分母上的自变量△x后的方程,不能再看成是二次曲线方程,因为二次曲线方程中的△x是不能分开处理的,必须有一致的数值,比如当△x=1时,它会得到2x+1(即使我们有△x=ε,其中ε为无穷小,我们也只是能得到2x+ε而不是精确的导数值即切线斜率2x),而不像线性方程可以将公式中出现在不同位置的△x分别看成方程本身的△x和方程的系数中的△x】,此时这个线性函数的系数为(2x+△x),它也是自变量△x的函数,而且如所周知一个线性函数的系数就是这条直线的“斜率”,因此,当一个曲线的割线的系数中与交点有关的自变量△x等于0时,也就是曲线与其割线的二交点重合为一点时,自然就是该曲线的切线。其斜率为2x,也就是导数。这里根本不需要极限。就算有,也是可达极限(即在该点不但函数值与极限值都有,而且数值相同)。同时我们也可以这么理解:就算(2x+△x)·△x/△x中的△x/△x可以不令其为1/1,在这个线性方程与其自变量的比值函数的系数K=2x+△x中的△x=0时,得到2x·(△x/△x),此时无论△x等于什么,只要不等于0,我们也可看出这里的2x是该线性方程(这里已经是切线)的斜率,也就是导数了。
总之,简要地说,对二次函数的增量△y=(x+△x)2=2x△x+△x2而言,其涉及二次曲线上的两个点,而过这两个点的直线是该二次曲线的割线。因此这个△y我们同样可以看成是这个割线的增量。也就是同一个△y,同一个式子,可有两种解释,一曲一直。这里既然解释成直线,前式可更明确地写成通常线性方程的形式:
△y=(2x+△x)·△x
(5)
这里(2x+△x)可看成线性函数的系数也就是“斜率”,习惯上可写成K。但这里由于它还是 △x的函数,因此可写成K(△x)。
5式除以自变量△x,就是该二次曲线的割线的斜率K(△x)。见6式:
K(△x) =△y/△x= K·△x/△x=(2x+△x)·△x/△x=(2x+△x)·1/1=△y’/1=2x+△x
(6)
6式最右边的那个△x,作为割线方程系数中的一部分,为这个割线在二次曲线上的两个交点的横坐标(自变量数值)之差。显然,当这个△x=0时(没有不可达极限),二交点合一,变成一个交点,此时显然割线变成了切线。其斜率也就是切线斜率,即导数,数值为2x。这里特别要注意的是,6式左边的△y/△x中的△x的取值,是线性方程本身(不包括系数中的△x)的自变量,因此与该线性方程的系数中的那个△x的取值无关。而如果看成是二次曲线的自变量,则方程中的所有△x显然都要统一取值。正是由于以往论者都没有看出这二者的区别,才会产生所谓贝克莱悖论的疑难。注意:6式中的△y/△x=△y’/1,△y与△y’, 显然是不同的。由于△y/△x中分母上的△x与分子上的一个△x已经被除法“消去”了(即我们一再强调的△x/△x=1/1),因此系数K=2x+△x中的△x与它们再无关系了。也许,文献2公式3、4、5把二者用不同符号分别标记的写法更明确一些。
允许我们可以这么理解和操作的数学、几何基础,是二次曲线乃至任何曲线上的两个点,当然只能在这个曲线上;但过这个曲线的割线上的两个点,不但可以是其与此曲线的两个交点,也可是该割线上的任何两点,而不必拘泥于始终在曲线上。如此,才有对割线方程与自变量的比值做除法,消去分子分母中各一个、也仅仅各一个的自变量△x,即△x/△x=1/1=1,实际上就是此割线方程的系数K(△x)中的自变量△x(割线与曲线的两个交点间的“距离”)→0也就是斜率变化、割线变切线的整个过程中,该方程本身(不涉及系数K)的自变量△x始终等于1,也就是它涉及的直线上的另外两个点的间距是始终不变的。
在上面对二次函数的讨论基础上,自函数的增量比值函数△x/△x的求导问题,就很好理解了。先前,如果我们只局限于一次求极限过程,那么就有△x→0与实际求出导数为1的△x→1间的矛盾。而如果是二次求极限,则是第一次的△x→1求出新函数1后再对这个特殊的函数1求△x→0的极限,这当然还是1。但这样的解释在细节上是不够严谨的。实际上,仿照二次函数的情况,我们可以把自函数的增量比值函数写成(而且严格讲它实际上也就是):1·△x/△x,这里的“1”是线性函数的系数K,不过此时它是常数1而已(原先由于是1,省略不写了)。如此,当第一次所求极限(这里完全可以就是函数值)△x→1(或者就是△x=1)时,1·△x/△x=1·(1/1),而第二次令△x→0(或就是△x=0)时,此时求的是系数K=1的极限(或函数值),而不是变量的比值(1/1=1)的那个“1”的极限(或函数值)。这就与前面二次函数求导过程完全一致了。
当然,严格而言我们也可以有另一种解释,就是在△x/△x分子分母相除得到1/1=1后,在其后的“第二次令△x→0(或就是△x=0)时”,此时对应的不是系数“1”,而就是分子分母相除中自变量的比值1/1本身,此时其解释是:当自变量△x≠0也不趋于0的前提下,分子分母相除或可以相除消去各自的△x,也就是各自的△x=1或趋于1得1/1(可看成就是1)这一特性,在△x→0时始终保持着。注意,这里“自变量△x≠0、同时也不趋于0的前提下”是在先的,是前提,因此绝对不是原函数△x/△x直接在△x→0时的情况。由于此时函数的系数为1,这两种情况不好区分。但在二次函数时,这种情况对应于令分子分母中所有的△x(而不仅仅是△x/△x)都等于1。此时对应于2x+1而不是2x。
七、总结
至此,我们可以总结如下:
1.文献2中的2、5式(即本文6式),就是所谓“第一代微积分”的牛顿、莱布尼茨求导方法的细化,也就是其本来应该有的面目。只不过牛顿、莱布尼茨没有意识到在这里除法究竟意味着什么,因此才会产生所谓贝克莱悖论。其实质是:由于前文已述,所谓二次曲线方程(当然这里是以此为例,绝不限于此),还可以表示该过该曲线上任意两个点的割线方程,“一式二义”。由此之故,这既是贝克莱悖论产生的缘由,也是正确求导基础。一切取决于正确理解。具体说,传统上的求导公式等式左边未做除法,分母上的自变量Δx未被消去,因此整个比式中的所有Δx必然同值,这里实际是二次曲线函数的增量与自变量的增量之比,它如果等于0,在分子上的△y中的所有Δx都要等于进而导致△y也等于0,即不能不有0/0;而等式右边做了除法,分子中只有一个作为因子的Δx被与分母中的Δx相除而等于1/1也就是“消去”,这意味着整个比式中实际也就是分子中的两个Δx不会同值了,这是对一次函数也就是线性函数的比值函数中的自变量的“相消”,是线性方程的特性,它分子中其它没有被消去而保留的Δx,就可看成是线性方程系数中的,也就是只与此线性方程的斜率有关。以往贝克莱悖论的产生,现在彻底清楚了:就是等式左边由于未做除法保留了分母上的自变量Δx,因此所描述的是曲线方程与其自变量之比,在0点当然会有0/0;而等式右边实际作了除法,等于是实际上消去了分母上的自变量Δx以及分子上的一个自变量Δx,实质是令二者都等于1了,即得到1/1。此时实际上求的是直线的斜率。不一致了。由此产生了所谓的贝克莱悖论。因此,公式6的最左边的斜率K(Δx)的表示,还是完全必要的,因为斜率只是与线性函数有关,也就是在曲线与其割线两种可能的表示之间,明确指明了这里的△y/Δx不是曲线与自变量之比,而是割线增量与自变量增量之比。如此,自然也就没有了贝克莱悖论。牛顿、莱布尼兹在求导过程中,其实并没有做错什么,只不过没有了解和阐明他们所做的实质是什么。他们其实是拘泥于用曲线增量与自变量的增量之比来解释,而非看成割线增量与自变量增量之比,尽管实际完全可以这么看。但在实际操作上,他们无意中在等式右边作了除法,实际消去也仅仅消去了分子分母中一次的那个Δx,也就是进行了运算Δx/Δx=1/1,但保留了系数也就是分子中的Δx,这显然是线性而非曲线函数的操作。因此,斜率或导数是求出来了,但如按曲线而非割线理解就解释不了。也就是为什么等式左边会有那个0/0出现以及如何才能彻底消除它(贝克莱悖论,现在终于可以放心地叫贝克莱佯谬了)。在本文及笔者一系列文章的揭示下,贝克莱悖论被彻底、干净地消除,因此第一代微积分中的矛盾不再存在,其原理被清晰表述清楚,它对微积分而言,首先是“充分”的;
2.由于第一点,因此所谓“第二代微积分”的极限法根本就没有必要了;
3.由本文及笔者一系列论文的论述,这个极限不仅不必要,而且根本就不存在。因此极限法求导也就是所谓“第二代微积分”根本就是错的;
4.在笔者解释下,第一代微积分可以是充分的。但并非“必要”。原因是导数的定义不同导致。既然导数就是曲线的切线斜率,不再附加任何趋近、无穷小等条件,那么,完全可以从其它途径来求得它,比如在文献4中笔者提出的“解方程法”,直接求出切线方程的系数,也就是斜率、导数;
5.导数的定义,其实就是(而不仅仅数值上是):曲线上某点的切线斜率。原先理解意义下(严格的在曲线上)的一次无穷小或极限在此定义下不仅不必要,而且是不存在的。其本质是:在一个曲线线段上,无论其多么的小,也不可能有直线才有的属性。当然,在割线乃至切线上,我们自然可以定义一次无穷小或极限(还是可达极限),但它对导数定义而言不是必须的。说明白些,导数中的△x根本就不必写成dx。它就可以是一个宏观量。也用不着极限lim的表述。在积分上,增量就是长度也就是测度,不用另行定义,很自然,做到了导数、微分与积分的统一描述。更进一步,还可以统一微分法和变分法,解决二者孰优、孰基本的长期争论。此外,极限法在积分上也会产生问题:不能对一个不可达极限集合去积分或相加,只能对线段、距离、长度去累加也就是积分,哪怕这个线段是无穷小的。这个意义上,非标准分析比标准分析更明确、甚至诚实些:先定义无穷小,再没有任何理由地在公理、规则之下粗暴地舍弃它。
6.至此,微积分理论不但矛盾消除,而且会大为简化。微分定义中的dx=△x的问题也不再存在。考虑到新的解释中导数的定义要与第一代微积分不同,由此产生笔者在前期论文中提出的“增量分析”的现实,因此,把它看成有别于现有理论的新理论也并不为过;
7.马克思对微积分素有研究。他当年在其《数学手稿》中明确地说,导数就是0点之值,“数学家们的什么永远接近又不可达到之类根本就是昏话”。据说上世纪五、六十年代曾有人认为马克思《数学手稿》落伍了,有损马克思形象不该出版。但由笔者工作可知,马克思实际上比这些人有远见的多。此外,马克思强调要用辩证法来看待微积分求导问题,笔者认为,这就涉及一个点的两种“角色”:它即是曲线上的一个点,又是曲线在该点的切线上点。而我们所求,正是该切线的斜率。这又涉及切线上的两个点,而且明确说这两个点的距离完全可以是宏观量,不必是无穷小,更不是所谓不可达极限。这里,这个角度看是曲线,那个角度看是直线;这个角度看是一点,那个角度看又是两点,完全具有辩证法的意味。篇幅所限,这里不详述。
8.对于非标准分析,篇幅所限,无法详论。但正如斯图尔特所说:“非标准分析……不用在各种借口的掩盖下,把额外的△x去掉,而是很清楚地把它删除。非标准分析的教程好像是在展示(柯朗和罗宾花了很多篇幅想让我们避免的)错误。”(《数学是什么》,P544)。非标准分析实质上是在一些艰涩名词、理论的掩饰下,又重新回到了牛顿的直接舍弃所谓“高阶无穷小”(只是用了所谓“取标准实数”这个新说法),它比极限法的所谓标准分析唯一的好处,就是少了些似是而非的兜圈子。但不得不说,比起牛顿,后者更直截了当。既然很多论者都说标准、非标准分析是等价的,那么,前者碰到的问题它也都回避不了。正如威廉姆森所言(大意):极限法与无穷小法的非标准分析的区别,只是前者在“计算结束前”一直保留“高阶消去项”,直到最后才去掉;而后者是一开始就去掉(徐利治《论无穷》P71)。因此,一些人想用它来取代标准分析作为微积分的改革,不会成功。这基本上已为实践所证实。
最后再简要地讨论下“罗比塔法则”的问题。表面上看,它可以求0/0类型的“不定式极限”,但这是涉及计算层面,而不能作为导数的定义。因为显然,微积分标准分析对导数的定义是函数的增量比值函数在自变量趋于0时的极限值,因此如果现在又说这个极限等于分子上的函数的导数与分母上的函数的导数之比,这当然是循环定义。也就是,罗比塔法则可以用于相应函数的导数的计算,而不能用于定义。