微积分和函数的关系是如何体现函数性质的?

本文讲微积分是个什么东西,顺便讲讲数学思想。我会用通俗的方式来讲微积分是什么,我保证,你看完本文以后,会对微积分的理解上升一个高度。而且,不管你数学基础怎样,本文的绝大多数内容,你是一定能看懂的。微积分的实质,可以理解为宏观世界和微观世界两种世界的连接、转换以及它们之间的桥梁。当然,还有别的理解方式。微积分微积分是什么?微积分就是拿照相机拍下你往前跑步的过程,看这个照相机的慢放,就是微分;把所有照相机慢放的片段合起来看,就是积分。微分和积分什么意思呢?想象一下,你跑步的动作忽快忽慢,你用照相机照下你跑步的过程。如果你看慢放,比如看第1秒到3秒的镜头,把它慢放到20秒。这时候,你跑步的速度变得“平缓”了,你的速度变得“均匀”了。继续放慢:把慢放后的20秒中的前2秒取出来,再慢放为20秒:速度变得更加“均匀”了。这个过程可以一直进行,直到,你看到的速度几乎变成了匀速……现在我们看完了慢镜头,我们逐渐拉回到正常的镜头:那个最慢的镜头,你加快10倍播放,然后继续加快10倍,继续加快……随着镜头播放的越来越快,你的速度变得越来越“不均匀”了,直到,你看到了最开始那个正常播放的镜头。刚才是从微分的角度来说的。我们再从积分的角度来说:我们反过来说:假设你在参加一场跑步比赛。从起跑开始,你的速度迅速加快,然后接近于匀速向前。第1秒的时候,你离起点2米,第3秒的时候,你离起点5米,第3秒的时候,你离起点6.8米……可想而知,你的速度越快,你在同样的时间就离起点越远。但是,你的速度是随时变化的,你很难告诉我你从0秒到3秒一共经历过哪些速度。但是你可以告诉我,到第3秒的时候,你跑到了哪里。你第3秒的位置,就是0-3秒的速度留下的“累积”。也就是,如果把你从0到3秒经历过的所有速度累加起来,就是你第3秒的时候到起点之间的距离。路程,是速度对时间的积分,速度,是路程对时间的导数(微分)。微分在蜿蜒的道路上绵延向前,留下了一条美丽的弧线,这就是积分;积分在前行的路上洒下了点点斑驳的影子,这就是微分(导数)。刚才,我们从“累积”和“瞬间”的角度了解了微积分,现在,我们从“力量”和“能量”的角度来看微积分:现在你看一个山,山是弯弯曲曲的,山顶的海拔最高。想象一个小球,把它放在山上。它在哪里的时候是能量最大的时候呢?显然是在山顶。因为它从山顶可以一直往下滚,每滚一段距离,它的速度就会变大(它的高度带给它的能量转化为了速度)。这就是重力势能和动能之间的转化。我们知道,它在山顶那个点的时候,能量最大(我们不考虑速度,就考虑把小球静止地放在一个地方的能量)。这个能量取决于什么呢?取决于它的高度。高度是什么?高度就是山坡的所有坡度的累积。在小球从上往下滑的时候,如果山坡非常的缓,那么它滑了很久,高度才下降了一点;如果山坡很抖,那么它滑了一点的时候,高度就下降很多。所以,高度是什么?在同等的距离下,如果山坡的坡度缓,它的(累积)高度就低,如果山坡的坡度抖,它的(累积)高度就高。高度,是坡度的累积,也就是积分,坡度,是高度的变化趋势,也就是微分(导数)。想象你进入了一个太空中的引力旋涡当中,你被引力疯狂地吸入。随着你离引力源越来越近,你的速度越来越大,这是为什么呢?因为引力所带来的能量,在逐渐转化为速度。这就是引力势能转化为动能的过程。什么时候引力势能最大呢?离引力源最远的地方。引力势能,就是引力的积分,引力,是引力势能的微分(导数)。(其实准确来讲应该叫引力势,但我解释势和势能的关系有点麻烦,所以我们没必要引入这个额外的东西)。我写个公式吧,不过看不看得懂无所谓。只是让你回忆一下。F=\frac{GMm}{R^2} E=-\frac{GMm}{R} 后者,就是前者的积分,前者,就是后者的导数(微分)。能量,是力对距离的积分,力,是能量对距离的微分。能量,是一段空间中累积的力;力,是能量在一个点上的变化趋势。想象把一个石头举起来,它停留在某个高度的时候,它有能量;当把它放开的时候,它下坠的那些瞬间,是受到力的作用。力,就是能量下坠的瞬间。对了,下面这个是你学高等数学的时候看到的导数定义。这是个啥玩意?不用管这是个啥玩意。还有个极限定义:这他妈是个啥玩意?现在不用管这是啥玩意。现在,我问你一个问题:如果有一个小孩子问你,什么是微积分?你怎么给他解释?如果是我的话,我不会讲什么是极限,什么是求导,什么是收敛,我会告诉他,我们比赛跑步,这个比赛只有5秒钟,我们就比谁跑的远。我们最后到达的终点位置,就是积分。让你妈妈用照相机镜头拍下我们的比赛过程,把镜头慢放,看我们奔跑的那些瞬间,这些瞬间,就是微分(导数)。或者我会告诉他,你举起一个石头,你把石头举起来的高度,就是积分。你松开石头,看这个石头落下来,越落越快。如果你在它落下来的时候用手去接这个石头,感受这个石头在那个瞬间的下落的感觉(速度),这个瞬间下落的感觉,就是微分(导数)。好的,相信你已经懂了微积分了。我们扯一点抽象的东西吧。微分和积分-微观和宏观我们回到照相机记录跑步过程,看慢镜头那个例子。如果你看整个回放,你看到的是,你的速度忽快忽慢,而如果你看的是极其慢的慢放,你看到的是,匀速。如果我们把这两种图像比作两种世界观,那么,一个世界观是宏观的世界观,它是弯曲的、变化的,一个世界观是微观的世界观(它不是真正的微观,只是把宏观的东西缩小、放慢以后制造的一个“伪的”微观),它是直线的。有个东西,可以把这两个世界观连接在一起,它就是大名鼎鼎的牛顿-莱布尼兹公式:泰勒公式但是,你要知道这里面有个破绽:你仔细去看那个直线,要非常仔细。你会发现那个直线有一点弯曲,对吧。这是因为,它不是真正的直线,只是像一条直线而已。如果它是一条直线的话,那么是下面这个式子:f(x)=f(x0)+f'(x-x0)(x-x0) 但它不是一条直线,它是一条稍微有点弯曲的线。所以我们应该在上面那个式子增加一点点“弯”的东西:f(x)=f(x0)+f'(x-x0)(x-x0)+\frac{1}{2}f''(x-x0)(x-x0)^2 细心的你又发现了,它还不够“弯”,它应该变得更“弯一点”。至于你怎么发现的,就不说了,总之如果你把那个微观世界中的线无限放大,你是一定能发现它不够“弯”的。于是,我们要让它变得更“弯”一点了:f(x)=f(x0)+f'(x-x0)(x-x0)+\frac{1}{2}f''(x-x0)(x-x0)^2+\frac{1}{3!}f'''(x-x0)(x-x0)^2+... 这就是泰勒公式。如果有人问你,什么是泰勒公式?你就告诉他,如果照相机记录了一个人跑步的镜头,这个镜头是宏观过程(宏观世界),但如果你看慢镜头,无限地放慢,你看到的就是一个微观过程(微观世界)。宏观世界,速度是变化的;微观世界,速度是几乎不变的。但是,它只是几乎不变,它还是有那么一点点变化的。怎么衡量那个玄而又玄的“一点点”的?那就增加一点项,一点系数,让它变弯。这就是泰勒公式。现在我们说点别的吧,说说一维到二维的事情。我们已经知道了,导数就是变化率,积分就是累计值。导数就是坡度,积分就是高度。导数就是一个曲线的斜率,积分就是一个曲线的累积高度。导数是力,是能量坠落的瞬间,积分是能量,是力在空间上的累积。二维中的微积分但是,如果是在二维呢?想象一个球(或者山坡),它是朝着四面八方下降的。我们怎么衡量它下降的速度快不快呢?那就是,把它看成是朝着两个方向下降,一个是朝着南北方向下降,一个是朝着东西方向下降。前者,是函数f对自变量y的偏导数,后者,是函数f对自变量x的偏导数。把这两个方向下降的东西叠加在一起,就是它真正的下降的程度。想象把小球放在山坡上,小球会往下滚。它一定会朝着最“陡”的那个方向滚下去。我们要看两个东西:一个是它会以多快的速度滚下去(方向导数)?一个是它会朝着哪个方向滚下去(梯度)?下面这个就是方向导数(它由两个偏导数组成):下面这个是梯度(它由两个偏导数和两个标准化的方向向量组成):那二维中的积分呢?我理解的二维中的积分有两种:第一种,我称之为“环游”:拿山坡举例子,坡度是导数,高度是积分。那么在二维呢?想象你爬山的时候,你沿着山脚走上一圈,回到原点。你也可以翻过这个山,把整个山都爬遍,你会发现这个山坡上上下下,起起伏伏,你从一个端点走到山的对面的时候,你上升/下降的总高度,就是在山坡上上上下下的高度的累积。这个东西是什么呢?是格林公式。左边,是你爬过这个山,走过那些上上下下的坡度,后边,就是你沿着山脚走,感受累积的起伏(当然如果你懂格林公式的话,会发现我这个说法和格林公式不是一一对应的,但是比较类似)。第二种,我称之为“体积”,也就是二重积分:还是拿山举例子,你怎么算一个山的体积呢?想象你拿着山的地图,在这个地图上画成一块一块的:如果你把块画的足够细碎,你会发现,每一块,它对应的高度,几乎就是一个确定的高度(想象一个细长的柱子,就是那样),这是因为,在那么小的水平距离下,它的高度几乎不会变化多少。这个山的体积,就是把那些一块一块的部分加起来。这种算法,积分的微元是dxdy(这个你可以不用理解)。当然,你也可以换种理解方法:在地图上,这些细分的一块一块的东西,构成了行和列,把一行中的所有块都合起来看,我们看到的是,这个山被分成了很多行,每一行都是一条一条的:这个山的体积,就是把这些所有的行的体积加起来。这种方法,你是先对x积分,然后对y积分(这个你不用理解)。或者你可以把一列合起来看:这样的话,山的体积,就是把所有的列加起来。这相当于你先对y积分,然后对x积分。现在,我们有了三种算体积的方法:第一种是把山切成一块一块的,第二种是把山切成一条一条的行,第三种是把山切成一条一条的列。这三种方法,本质上是一样的。第一种的积分微元是dxdy,第二种的积分方式是先对x积分,后对y积分,第三种的积分方式是先对y积分,后对x积分。总结一下:二维中的积分有两种方式,第一种是“环游”:我们绕着山脚走,绕山脚走一圈的高度变化,相当于是翻过这个山经历的高低起伏的变化的总和;第二种是“体积”:我们看这个山的体积,把山切成一块一块的,然后把这些块累加起来。第二种方法,就是我们常见的二重积分。三维中的微积分如果我们看三维中的微积分呢?有三种积分。第一种是环流:想象你放一池子水,把水底的阀门打开,这个水会留下去。在阀门周围的时候,这个水是会旋转着流下去的,也就是旋涡:为什么呢?因为受到地球自转的影响,平直运动的物体,会有个偏移的角度,这个角度,就让水形成了旋涡(这个东西超纲了,你可以不用理解)。可以想象,在旋涡中心的地方,水旋转地非常快,在远离旋涡的时候,水旋转的慢一些。如果我们在用一条线标记流了一圈的地方,那么这个线上水流了一圈的速度就取决于它里面的漩涡的旋转速度对外围的扩散效应。可以想象,如果漩涡旋转的很快,这一圈的旋转速度会比较快。也就是,这一圈的旋转速度,可以理解为圈内的漩涡的旋转速度的累计(这么说比较抽象,你想象一下)。这就是斯托克斯环流公式。离漩涡中心越近的地方,漩涡旋转速度越快,离漩涡中心越远的地方,漩涡的旋转速度越慢。如果把漩涡中的每个点的旋转速度用一个东西来描述,那么这个东西就是,旋度。环流对应的是一个闭合曲线,旋度对应的是一个点。有个类似的例子是通量和散度:想象有一个泉眼,在疯狂地往外冒水。我们用一个表面来圈住一个范围,这个圈住的范围涌出来多少水呢?这就是通量。那个泉眼往外冒水的速度是多块呢?这就是散度。通量对应的是一个曲面,散度对应的是一个点。第二种是曲面:回到山的那个例子。你现在拿着山的地图,看山在地图上面积是多大,根据比例尺,就能算出山的占地面积。但是,这是把山铺平了以后算的面积。如果你要算这个山的山坡的所有面积呢?可以想象,如果山的坡度不太大,把它投影到平面的时候,它的面积几乎不变。但如果山的坡度很大,那么把它投影到平面的时候,它的面积会缩减很多。因为投影的时候,你把坡度去掉了。这个山坡的面积,和它投影到平面的面积,是有一个比例关系的,这个比例关系,就取决于山的坡度(陡峭程度)。山坡的总的面积,就是曲面积分。怎么算山坡的总的面积呢?你把山坡分成一小块一小块的,把这些小块的面积算出来,再加在一起,就是总面积。第三种理解方式是重量:想象一个不规则的球,它是不均匀的,有的地方重,有的地方轻。怎么算这个球的重量呢?把它切开,切碎,然后看那一小块一小块的重量。当你切的很碎的时候,每个小块的密度几乎是均匀的:因为在那么小的块中,密度来来不及变化。你把这些小块的重量累加起来,就是球的重量。刚才我们举过一个类似的例子,就是山的体积。算山的体积的时候,我们是把山切成一小块一小块的,但每一块都是有高度的(也就是我们是沿着X轴和Y轴切碎了它,但并没有沿着Z轴切)。而我们算球的重量的时候,是切成碎块,沿着X轴,Y轴,Z轴都要切。这是为什么呢?因为球的密度是变化的,在不同高度的位置,密度是不一样的,所以要把它沿着Z轴切碎才可以(这段话你理解不了也没关系,不影响整体理解)。总结一下,三维中的积分有三种理解方式:第一种是看一条线,第二种是看一个面,第三种是看一个物体的整体。定积分和不定积分回到用照相机记录一段跑步的例子。假设现在,跑步已经结束了,照相机已经记录下了你跑步的整个过程了。现在我问你,你跑了多长?你应该回答我,不知道。因为,你跑了多长,取决于你跑了多长时间。我没有问你从哪个时间点到哪个时间点算起,所以你是没法告诉我你跑了多长的。如果我问你,从第一秒到第三秒,你跑了多长?那你就可以回答我了。因为我给了你起始时间,给了你终止时间,就可以算了。不定积分,就是给了你录像,但没告诉你从什么时间算起,到什么时间结束。定积分,就是给了你录像,并且告诉你从什么时间算起,到什么时间结束。现在差不多完事了,该讲的东西都讲了。但是还有几个东西我想再补充一下,作为一个扩展。为了让篇幅看起来短一点,扩展的部分就放在文末了,我先讲数学思维是个什么东西。数学思维现在可以言归正传,讲讲为什么你学不好数学了。首先要说一个东西:你具备数学思维吗?你学了一年的微积分,把题都刷会了,你就懂了微积分吗?不一定。如果一个小孩子问你什么是微积分,你可能要给他列一堆晦涩的公式,讲一堆抽象的概念、算法,让他不知所云。然后,你只能感叹,微积分太难了,小孩子根本理解不了。先给一个结论:我觉得很多人学不好数学,是因为不具备数学思维。什么是数学思维?这个问题很抽象,我举个例子来形容吧。假设你是一个建筑师,你要学习设计楼房的整体架构。师傅带你参观了一个豪华的房子,然后告诉你,这里为什么要设计成这个高度,那里为什么要加一个角,那里为什么要加那个空间。然后,师傅给了你一个图纸,图纸上标记了房子的各个楼层、各个区域的比例。你感叹房子的华丽,然后仔细研究图纸,感受这个房子是怎么被构建出来的。现在想象另一个场景:师傅没有带你参观建筑物,只是给了你一个图纸,图纸上记录了房子的各个部件的所有尺寸。师傅告诉你,这个房子特别豪华,特别高档,你仔细研究一下这个图纸,仿照着它,就一定会造出一个豪华的建筑。于是你仔细研究图纸。有人问你,你想造什么样的房子?其实你自己也没见过豪华的房子是什么样的,但是你知道图纸啊,你对那个图纸上的数据已经滚瓜烂熟了。于是你拿出图纸,给他讲述图纸上的各个数字。于是那个人一脸茫然地看着你,表示听不懂那些高深的数字和比例。你摇摇头,说“隔行如隔山”,给外行讲建筑物的样子真是困难。现在把数学理解成这个豪华的建筑。你学到的定义、公式、定理、证明、计算方法,都是图纸。你对图纸上的数字滚瓜烂熟了。你深知那个建筑物有多豪华。但是你可能从未见过这个建筑物的样子。如果有一天,你需要对这个建筑物做一点改造,让它变得更华丽呢?你可能就茫然无错了。因为你只是知道图纸上的数据而已,至于它为什么要这么设计,它好在哪里,你可能一无所知。有的国外的教材会好一些,它会告诉你那些概念是怎么引入的,怎么理解,有什么用。也就是,它会大致带你参观一下建筑物的样子。易于记录和易于理解为什么我们看到的知识大多数都是“图纸”,而不是“外观设计”呢?因为,“图纸”形式的知识相对容易记录。而“外观设计”形式的知识是更容易理解的。也就是,知识的表现形式有两个维度:易理解性和容易记录的程度。这两个维度在一定程度上是相互矛盾的:当一个知识足够容易被理解的时候,它是不好记录的;如果一个知识足够好记录的时候,它是不容易被理解的。想象这么一个场景:一个小孩子举起一块石头,然后让石头落下。他发现这个石头越落越快。他把这个石头斜着摆在一个光滑的斜面上,然后对这个过程进行了记录:在第一秒,石头下滑了1米,在第二秒,石头下滑了3米,在第三秒,石头下滑了5米。他把时间细分:第0.1秒,0.2秒,0.3秒……的时候,石头下滑的距离是……他在纸上列满了数字。然后,他发现把时间分的足够细的时候,石头在那么短的时间内下滑的距离,大概就是它的速度。它发现速度和时间之间是存在某种规律的:v=at 然后,他把石头在一个一个非常短的时间段内经过的距离累加起来,就是它的总距离。s=\int_{0}^{t0}v(t)dt 他发现一段时间内石头下滑的距离和时间也是有个对应关系的:s=\frac{1}{2}at^2 他发现,速度-时间函数和距离-时间函数是有一个一一对应关系的,当你知道了每个时刻速度的时候,就知道了累计距离;当你知道了每个时刻的累计距离的时候,你也知道了速度。也就是,微分(导数)和积分是一一对应的。于是他继续研究他们之间的关系,得出了各种函数的求导公式和积分公式,于是就有了初等函数的求导和积分公式。他发明了一个东西,叫做微积分。他激动地把这些发现告诉同伴们。同伴们发现这真是一个好东西,于是把这些发现记录下来。他们建造了一套严密的数学体系,也就是各种符号、运算规则。但是,后人看到这些东西,觉得非常抽象,非常晦涩,于是纷纷感叹微积分太难了。这就是知识的发明者和知识的表达形式之间的鸿沟:知识的发明者见到了一个华丽的宫殿,他把这个宫殿的比例、尺寸记录下来,也就是图纸。后人看到的知识,就是这个图纸,他们以为对图纸了如指掌,但殊不知他们从未见过那个华丽的宫殿。数学天赋再谈谈数学天赋这个东西吧。有的人从小就数学好,基本上无师自通,这个靠的是什么?一定程度上,就是天赋。这个天赋是智商吗?跟智商有一点关系,但主要不是。我觉得,数学上的天赋更接近一种思维模式:有的人的思维模式比较接近数学那套逻辑,他们根据图纸就能大致想象出那个宫殿的样子,于是在宫殿上进行修改,发现这个宫殿变得更加华丽了,于是他把宫殿的样子记录在图纸上,供后人观赏、学习。为什么我们不善于符号和数字运算我们可以轻而易举地识别老虎、狮子,可以轻而易举地把我们看到过的图像记下来,但是却很难完成100以内的加减乘除。后者明明需要的计算量远远小于前者,但我们为什么不擅长呢?因为我们在长期的生存、进化过程中,需要躲避危险,获取资源,所以我们需要识别老虎、狮子,然后它们来的时候,迅速逃跑。但是,计算100以内的加减乘除,用处没有那么大,所以我们并没有进化快速计算100以内加减乘除的能力。到了近代,科技高度发达,我们要跟各种高科技的东西打交道,经常要进行各种运算来维持生存。但是,进化的速度远远小于科技发展的速度,我们的大脑跟三万年前的人并无大的差异。而三万年前的时候,我们还在草原、洞穴中生存,跟动物们进行搏斗。我们天天要识别老虎、狮子,但却极少进行100以内数字的运算。也就是,我们从大自然而来,从这样的环境中进化而来,我们的大脑天然就对图像、空间、物体更为敏感,而对数字、符号、公式不敏感。这就是你为什么学不好数学:你在用不擅长的能力,干需要干的事情。那为什么有极少数的人能学好数学呢?可能他们的思维方式天生具有某种特点,促使他们频繁地使用他们的那套思维方式来分析问题、解决问题,然后他们把这套思维方式用来学数学,就无师自通了。国际上有那种记忆的比赛,记忆大师们可以轻易记住几十位毫无规律的数字。他们是怎么做的呢?他们要想象出一个房间,比如01代表进入房间的左侧,27代表看到那个空间中摆了一个桌子,52代表那里站着一个美女,等等,类似这样。然后他们想象进入这个房间,看到了每个角落的不同物体。当你在想象中把这个房间摆满的时候,你就记住了所有数字。你在房间中参观一圈,你比较容易记住这个房间的布置,而如果给你一串毫无规律的数字,你是很难记住的。记忆大师,就是把后者,在想象中转化为了前者,所以有了了超强的记忆能力。有这么一个调查,记忆大师在记忆无规律的东西的时候,大脑中的视觉的大量区域会被激活。也就是,他们用视觉的功能,在完成对数字的记忆。如果数学是一个华丽的宫殿,我希望你看到的是它华丽的外观,而不是仅仅看到它的图纸。当你看到了那个华丽的外观的时候,你可能会感叹它的华丽,对它充满了兴趣和惊奇。这,就是数学之美。给你的提问其实我应该写点别的,比如线性代数,概率论,运筹学,深度学习,数字电路,初等数论,排列组合,等等。但是,篇幅有限,所以我只是拿微积分为例,大概讲了一下我理解的数学思维是什么样子的。如果把篇幅搞的太长,让读者读起来也太累了。而且本文篇幅其实已经够长的了,因为下面还有一些扩展内容。现在,我给你几个问题,看你能否回答出来:1,如果一个小孩子问你,什么是微积分,你怎么回答他?2,微分和积分的区别是什么?联系是什么,它们是怎么转化的?3,泰勒公式是什么?它是干什么的?4,二维中的微积分是什么样的?三维中的微积分是什么样的?5,格林公式是什么?斯托克斯公式是什么?通量是什么?散度是什么?旋度是什么?曲面积分是什么?6,不定积分和定积分的区别和联系是什么?7,偏导数是什么?方向导数和梯度是什么?这些是请你回答的问题。没有标准答案。下次,如果有一个小孩子问你什么是微积分,我希望你能给他一个让他能够理解的答案。我是四年前学的微积分。当时我微积分学的还不错,对那些公式、定义、定理、证明都还算比较熟悉。但是,如果你让我解释什么是微积分,我几乎不会给你讲任何的公式,我会给你画一堆图,让你看到我眼中的微积分是长什么样子的。这就是我理解的微积分。全文结束了。现在,请你头脑风暴一下。我问你几个问题,如果这些问题涉及到了你接触过的领域,那么你可以思考一下怎么回答:1,什么是线性代数?什么是矩阵?矩阵和矩阵乘法,它的本质是什么?2,什么是概率论?什么是概率密度转移公式?什么是概率密度?3,什么是信息论?什么是信息熵?信息熵为什么要定义为对数?4,什么是数字电路?与或非门是什么?卡诺图是什么?5,二极管是什么?NMOS和PMOS是什么?它们是怎么组成门电路的?门电路是怎么完成二进制加法运算的?6,什么是排列组合?什么是容斥原理?7,什么是运筹学?什么是单纯形法和单纯形表?它到底是个什么东西?8,什么是神经网络?什么是反向传播?9,什么是数论?什么是RSA加密算法?(我个人认为数论这个领域相对比较抽象,这个比较特殊)10,什么是图论?什么是哥尼斯堡七桥问题?什么是欧拉回路和哈密顿回路?11,什么是相对论?什么是钟慢效应?什么是多普勒红移?什么是量子力学?什么是薛定谔方程?12,什么是引力?什么是引力势?什么是引力势能?13,什么是直角坐标和极坐标?什么是切线?什么是曲率?14,什么是仿射变换?旋转矩阵、平移矩阵、缩放矩阵、投影矩阵怎么解释?15,什么是马尔可夫矩阵和马尔可夫链?什么是稳态?稳态什么时候不存在?16,什么是电压和电势?什么是电势差?什么是电流?什么是串联和并联?15,什么是低秩矩阵?图像压缩的一种算法——奇异值分解(SVD,singular value decomposition)是什么?傅立叶变换是什么?扩展的内容刚才说过,我们有一些扩展的内容。这些扩展的内容,我个人认为也是比较重要的,也涉及到一些重要的数学思想。但是为了控制篇幅,我把它放到文末了。如果你对本文的东西感兴趣,那么你可以继续看看。下面还有全文篇幅1/4的内容。选看:积分的换元法假设你跑了一段距离。我问你:你跑了多远?你告诉我说,你跑了300米。但是你也可以说你跑了0.3公里。你跑的那段距离是确定的,但我们可以用不同的单位来衡量那个距离。单位越大,它对应的数值越小,单位越小,它对应的数值越大。也就是,如果用米这个小单位来描述,它对应的数字就是300这个大数字。于是有了这么个公式:300米=300(米/公里)公里=300 x 1/1000公里=0.3公里这就是积分的换元法:这是一元的换元。我们再仔细看这个式子:300米=300(米/公里)公里它相当于是先除以了公里,又乘了个公里,然后重新加括号:300米=300米 / 公里 X 公里=300(米 / 公里) X 公里。同样的,那个积分换元的公式也可以这么看:先除以了dt,然后乘了个dt,然后重新加括号:\int_{}^{}fdx=\int_{}^{}f\frac{dx}{dt}dt
其实就是这么个东西。如果是二元的换元呢?一个公园的面积是60公顷。我们也可以说它是0.6平方公里。也就是,60公顷=60(公顷/平方公里)平方公里=60 x 1/100平方公里=0.6平方公里这就是二重积分的换元法:它其实就是这么个东西:\int_{}^{}fdxdy=\int_{}^{}f\frac{dxdy}{dudv}dudv
除以了dudv,然后又乘了个dudv,重新加括号。怎么理解这个积分换元呢?我们用来衡量一个尺度,比如衡量一个东西的长度,衡量一个东西的面积,其实它们本来没有数字,是我们为了方便统计和定义,人为地为它们赋予了一个数字。但是这个数字是基于我们定义的单位的,在不同的单位下,它们被赋予的数字就不同。它们的大小、数字,只是我们用来统计的一个东西,既然是统计,就可以有多种定义方式,并且,这些定义方式之间是可以互相转化的。选看:多元微分微分是什么呢?就是自变量有了一个微小的增量的时候,因变量的变化值。多元微分是什么呢?就是多个自变量有了一个微小增量的时候,因变量的变化值。假设现在有一个任务,小李、小张、小王三个人在做。因为他们的工作是紧密相关的,所以他们的总的工作量大致可以看做是他们三个的工作量乘起来的量,也就是:总工作量=小李的工作 X 小张的工作 X 小王的工作。现在领导觉得他们工作进度有点慢,想让他们加班完成任务,这时候老板想知道,每个人都增加一点工作量的时候,总量会增加多少。假设只有小李加班了,那么增加的工作量就是:增加的工作量=小李增加的工作量 X 小张的工作 X 小王的工作。假设只有小王加班了,那么增加的工作量就是:增加的工作量=小李的工作 X 小张的工作 X 小王增加的工作量。现在三个人都加班了,于是增加的工作量就是:增加的工作量=小李增加的工作量 X 小张的工作 X 小王的工作+小李的工作 X 小张增加的工作量 X 小王的工作+小李的工作 X 小张的工作 X 小王增加的工作量。就是下面这样:df=yzdx+xzdy+xydz 现在有个问题:我们是分别看三个人对增加的工作量的影响,然后把这三个分开的影响合起来看。但是,如果他们三个人之间有一些复杂的相互影响,使得总的增加的工作量不是他们三个人增加的工作量的简单相加呢?一般来说,这是不可能的。只要总工作量是一个连续性变化的东西,那么当新增的量非常小的时候,就可以近似地看做是线性相加。这是因为,微观世界是“线性”的:当自变量增加的量足够小的时候,自变量和因变量的关系,就是一个近似的线性关系。当然,有没有可能不是这种线性相加的关系呢?也不是不可能。只是宏观世界中的东西,在看微小增量的时候,一般都是可以这样近似为线性相加的。这就是多元微分:选看:无穷级数无穷级数这个东西跟泰勒公式是密切相关的。回忆一下泰勒公式是什么:假设你有一个关于你跑步的录像,你的速度是随时变化的。如果你看这个录像的慢放,把它慢放到足够慢,你的速度就“变成”了均匀的:它几乎可以用一条直线来表示。就是下面这个图:但是,它只是“几乎”是直的,它还有那么一点点弯的部分。怎么来衡量这个玄而又玄的“一点点”呢?就是增加一些项和系数,让它变得弯曲那么一点。这就是泰勒公式。所以,泰勒公式可以写成:直线+弯曲一点点+弯曲的多一点点+弯曲的再多一点点……f(x)=f(x0)+f'(x-x0)(x-x0)+\frac{1}{2}f''(x-x0)(x-x0)^2+\frac{1}{3!}f'''(x-x0)(x-x0)^2+... 我们发现这种写法有个什么好处呢?就是把一个“复杂”的东西写成了几个“简单”的东西。这个可以类比什么呢?类比光的三原色分解。一个复合光,它的成分是复杂的,我们怎么来描述这个光呢?我们发现,把所有的光分解之后,它只有三种颜色:红黄蓝,这就是三原色。所有的光,都可以写成这三种光的和。所以,我们要描述一个颜色,只需要用一个三元组来表示:红是多少,黄是多少,蓝是多少。这就是颜色的RGB表示法。同样,任意一个函数,它是“复杂”的,那么什么东西是简单的呢?直线是简单的。不那么直但又接近直线的线也是相对简单的。不那么直但又接近不那么直但又接近直线的线也是相对来说相对简单的……什么叫“不那么直但又接近直线”呢?这就是多项式。因为它在几次求导之后会变成直线。所以,我们把任意一个函数可以写成多项式之和。这是泰勒公式。我们发现了泰勒公式的另一种理解方法:把复杂的东西写成简单的东西之和。之前我们只是把它用在微观。我们能不能把它用在宏观呢?其实是可以的。我们先用那个红色的线来拟合,然后用蓝色的线来拟合,然后用绿色的线来拟合。然后,我们还可以用更弯一点的线来拟合。可以看到,离原点越远的时候,拟合效果越差。但是没关系,因为我们还可以继续增加新的线来进行拟合。但是,能不能拟合成功呢?这就要看它拟合不了的那部分(泰勒公式中的余项)能不能变成无穷小。如果能,那么我们这种拟合方法就是可以的。有一个比较经典的图:幂级数是无穷级数的一种。我们刚才讨论的就是幂级数。它的定义是下面这样:选看:极限极限是个什么东西?我们拿照相机记录跑步来举例子。我们说过,把镜头放慢,放的足够慢的时候,速度会变成均匀的,我们会看到一条近似直线的线。但是,如果不是这样呢?如果你把镜头放的足够慢的时候,速度还是快速变化的呢?常识告诉你,不会的,我们跑步的速度不会突变,因为我们有惯性。既然不会突变,当把镜头放的足够慢的时候,必然会变成匀速。我们换一种说法:对一个曲线,用放大镜放大了看,当放大倍数足够大的时候,曲线的局部会变成接近直线。这是因为曲线不会突然拐弯。但是,如果有的东西没有惯性呢?一个著名的例子是“英国海岸线的长度”:英国的海岸线有多长?你拿着放大镜去看那个海岸线,发现不管放大多少倍,海岸线仍然是弯曲的。所以,英国海岸线是没法计算长度的。还有量子尺度的很多东西,也是不满足这个“放大很多倍会变成直线”的规律的。这些情况,就是不可微分(不可导)的情况。有的东西可导,有的东西不可导,所以我们可以定义一个性质,当函数具备了这个性质的时候,它就是可导的,当函数不具备这个性质的时候,它就是不可导的。这个性质是什么呢?是极限存在。所谓极限存在,就是把一个曲线放大了很多倍以后,它会变成接近直线。我们看极限的定义:放大了很多倍以后,它会变成接近直线。什么叫接近直线呢?就是跟直线只差了一点点。怎么形容这个一点点呢?就是“点的不能再点了”。也就是,令 \varepsilon 是直线和近似直线的差,这个 \varepsilon 可以取任意的一个正数,或者说, \varepsilon 可以是任意小的一个正数。什么叫放大了很多倍呢?这个很多,就是存在那么一个倍数,当超过这个倍数的时候,曲线会变成近似直线。也就是,令N是这个放大倍数,那么存在这么一个N。这就是 \varepsilon 和N的意义。前者是“任意”,后者是“存在”。“任意”用来形容“一点点”,“存在”用来形容放大倍数。我们说过,“宏观世界”是弯曲的、变化的,“微观世界”是直线的、均匀的,有一个桥梁,可以把这两个世界连接起来,由宏观计算微观,由微观计算宏观。这个桥梁,就是牛顿-莱布尼兹公式:我们看一下这个桥梁可以连接的两端是什么样子的(下面讲的“桥梁”需要各种判定规则,跟牛顿-莱布尼兹公式需要的积分是否存在的判定不是一一对应的):宏观世界微观世界桥梁跑了一段距离-距离把跑步的录像慢放-速度速度是距离对时间的导数,距离是速度对时间的积分曲线直线曲线在某一点的切线,就是它对应函数在那一点的导数山的体积一个很小的区域的山的体积山的体积,是很小的区域的山的体积累加起来,也就是二重积分绕着山脚走一圈翻过山,经过那些上上下下的坡度格林公式旋涡的一周的长度旋涡中的小区域的旋转速度斯托克斯环流公式跑了一段距离直线+有点弯曲的直线+有点弯曲的有点弯曲的直线……无穷级数(它的分支:幂级数)但是,这个桥梁存在不存在呢?有时候它是不存在的,微观世界和宏观世界之间,不存在这样的桥梁。那么,什么时候存在,什么时候不存在呢?就要看是否存在极限了。也就是要用极限定义(当然上面列举的例子不一定是要用极限定义来判定的,但是判定条件总体上大同小异)来判定它是否存在极限。这就是极限的意义。极限定义是微积分教材一开始的时候就提出的东西,但是我却在最后才讲这个东西。这是因为,从时间顺序来说,极限定义也不是一开始就有的,而是在牛顿-莱布尼兹公式之后出现的。那时候,人们发现“宏观世界”和“微观世界”之间的这个桥梁不一定存在,如果不解释清楚这个问题,会出现各种问题。所以,人们想搞清楚,这个桥梁什么时候存在,什么时候不存在。人们发现,桥梁存不存在,取决于要研究的这个东西,如果这个东西具备了某种良好的性质,那么就存在这个桥梁。这个性质是什么呢?就是“极限存在”。我觉得,如果你先看到了极限的这个定义,你会觉得这个东西毫无作用,不知道它是来干什么的。而先让你认知了宏观世界、微观世界,然后让你看到有这么一个桥梁,可以把它们连接,这时候你才知道,有这么一个东西,是来判断桥梁存在不存在的。这时候,你才知道它的意义是什么。选看:自然常数e学过微积分的人知道,自然常数e是个比较神奇的东西,微积分里面很多好的性质都跟它相关。那么这个e是怎么来的呢?具体我也不知道怎么来的,我就讲讲我理解的来源吧(如果你知道e的更准确的来源,请在评论区给很出):e来源于指数求导:比如你算3的x次方的导数:f'(x)=\lim_{\Delta x \rightarrow 0}{\frac{3^{x+\Delta x}-3^x}{\Delta x}}=\lim_{\Delta x \rightarrow 0}{\frac{3^x(3^{\Delta x}-1)}{\Delta x}} 你算5的x次方的导数:f'(x)=\lim_{\Delta x \rightarrow 0}{\frac{5^{x+\Delta x}-5^x}{\Delta x}}=\lim_{\Delta x \rightarrow 0}{\frac{5^x(5^{\Delta x}-1)}{\Delta x}} 我们发现有个东西似乎比较像,可以把它变成公共的东西:{\frac{5^{\Delta x}-1}{\Delta x}},{\frac{3^{\Delta x}-1}{\Delta x}} 这个东西可以把它抽象为一个表达式:\frac{a^h-1}{h},h\rightarrow0 我们知道,对数运算可以把乘方运算变成乘法,把乘法运算变成加法:log_ab\times log_bc=log_ac log_kab=log_ka+log_kb 而指数运算和对数运算是互逆的。所以,我们可以把上面那个指数运算化为对数运算:令 t=a^h-1 ,则 h=log_a(t+1) , \frac{a^h-1}{h}=\frac{t}{log_a(t+1)} ,然后继续化简它: \frac{a^h-1}{h}=\frac{1}{log_a(1+t)^{\frac{1}{t}}} 我们发现有这么一个可以提取出来的东西(把h换成x): \lim_{x \rightarrow 0}{(1+x)^\frac{1}{x}} 这个东西看起来像是一个常数。这个东西怎么看呢?把它转化一下: \lim_{x \rightarrow\infty}{(1+\frac{1}{x})^x} 这个东西可以跟什么结合起来呢?跟二项式定理结合起来: (a+b)^n=C_{n}^{0}a^0b^n+C_{n}^{1}a^1b^{n-1}+C_{n}^{2}a^2b^{n-2}+...+C_{n}^{n}a^nb^0 二项式定理有个好处,就是可以把一项拆成很多简单的项,然后看这些项。具体推导过程我就不写了,总之我们对比x=n和x=n+1的情况,发现那个式子是单调递增的,并且我们对它进行缩放,发现它小于3。单调递增并且有界的函数一定有极限。说的简单点,就是, \lim_{x \rightarrow\infty}{(1+\frac{1}{x})^x} 这个东西,是一个数字。我们定义,这个东西是e。所以, \frac{a^h-1}{h}=\frac{1}{log_a(1+t)^{\frac{1}{t}}}=\frac{1}{log_ae}=lna
。把这个结论带入到指数求导运算当中:f(x)=3^x,f'(x)=\lim_{\Delta x \rightarrow 0}{\frac{3^{x+\Delta x}-3^x}{\Delta x}}=\lim_{\Delta x \rightarrow 0}{\frac{3^x(3^{\Delta x}-1)}{\Delta x}}=3^xln3 我们发现一个神奇的东西:当指数的底等于e的时候,函数求导以后等于它自身:(e^x)'=e^x 这是一个相当有用的东西。选看:微分、导数、隐函数求导微分和导数是不是一个东西呢?本质上讲,它们不是一个东西。导数是什么?是那个点的切线的斜率,就是上图那样。微分是什么?就是在某个点的附近,因变量的增量和自变量的增量的差。这两个东西是不是完全一样呢?不是,它们还稍微差一点点。图中,dy穿过了虚线对应的y值,往上了那么一点点。也就是:dy=f'(x)dx+o(dx) 但是,这个“一点点”,是无穷小,可以忽略。所以,有这么一个近似的关系:\frac{dy}{dx}\sim f'(x) 所以,导数是一个点的斜率,微分是两个微小的增量的商。它们本质上是不同的。知道这个东西有什么用呢?用处就是:隐函数求导:y1=f(x1)------(1)y0=f(x0)------(2)(2)-(1): y1-y0=f(x1)-f(x0)------>dy=f'(x)dx这个东西跟刚才我们得出的结论没什么区别。但它的形式变了:左边是关于y的式子,右边是关于x的式子。它的意义是什么呢?一个x对应着一个y,当x变化了一点的时候,y也变化了一点。x的变化量对应着y的变化量。上面的式子中,x是有个函数的:f(x),但y没有对应一个函数。我们可以让y也对应着一个函数,我们写作:g(y)。所以有:g(y1)=f(x1)g(y0)=f(x0)g'(y)dy=f'(x)dx把上面的式子变形一下:g(y)-f(x)=0g'(y)dy-f'(x)dx=0这个东西的形式变了。之前,我们是把x视为自变量,y视为因变量,但这里,我们把x和y视为两个地位同等的变量,只是它们之间存在某种数量上的关联。我们把它们的这种关联列出来了而已。注意,这是一个重要的转变:之前,x是自变量,y是因变量,x变化会导致y变化,我们观察x每变化一单位的时候,y变化多少单位,它们之间的比例关系,就是导数/微分。但是现在,x和y没有因果关系,只有数量上的一个对应的关系,我们只是把它们的对应关系列出来而已。把上面的写成下面这个形式:F(x,y)=0,\frac{\partial F}{\partial x}dx+\frac{\partial F}{\partial y}dy=0 这个东西是什么意思呢?它相当于等高线:一个山上,有很多的等高线。你沿着等高线走,你走的时候,你的高度是不会变的。但是你的东西位置和南北位置是有一个微弱的变化的,并且,这个变化,有一个比例关系:这个比例关系是什么呢?根据上面的式子推导一下,就是隐函数求导法则:F(x,y)=0,\frac{\partial F}{\partial x}dx+\frac{\partial F}{\partial y}dy=0\rightarrow \frac{dy}{dx}=-\frac{\frac{\partial F}{\partial x}}{\frac{\partial F}{\partial y}} 你当时学到的隐函数求导法则是下面这样:选看:复合函数求导我们要做两道菜:土豆炒豆芽,和土豆炒豆腐。现在土豆涨价了,涨了1块。请问我们吃到的菜一共涨价了多少?答案是,3.5快。现在,我们想知道土豆涨价一单位对总价格的影响。我们把它拆成两部分看:第一部分是,土豆涨价导致土豆炒豆芽涨价,土豆炒豆芽涨价导致总价格涨价。第二部分是,土豆涨价导致土豆炒豆腐涨价,土豆炒豆腐涨价导致总价格涨价。把这两部分加起来,就是土豆涨价一单位对总价格的影响。所以,什么是复合函数求导?复合函数求导,就是土豆涨价导致土豆炒豆芽和土豆炒豆腐涨价,这两道菜涨价导致总价格涨价。当然,你还可以玩出不同的花样:我们可以有一道菜,是把土豆原原本本地放在餐桌上。等等。下面是你当时学微积分的时候看到的复合函数求导的定义:选看:一个美妙的等式这算是一个彩蛋吧,它是微积分中一个比较美妙的结论。微积分里有个非常美妙的等式: e^{i\pi}=-1 这个等式,把自然常数e(微积分创造的产物)、圆周率 \pi (自然界最“完美”的图形对应的数字)、虚数 i(初等代数创造出来的数)、-1(整数)结合起来。它是这样的:它是泰勒公式推导出来的一个结果:e^{ix}=1+ix-\frac{1}{2}\frac{1}{x^2}+i\frac{1}{3!}\frac{1}{x^3}-\frac{1}{4!}\frac{1}{x^4}+... sinx=x-\frac{1}{3!}x^3+\frac{1}{5!}x^5+... cosx=1-\frac{1}{2}x^2+\frac{1}{4!}x^4+... 所以有:e^{ix}=cosx+isinx 当x= \pi 的时候,有e^{i\pi}=-1数学思想最后说点数学思想吧。相信能看到这里的读者是真的有点耐心的人,所以我把数学思想这种抽象的东西放到这里:因为我相信这是留给有耐心的人看的。本文是以微积分为例的,所以我就先讲微积分涉及到的数学思想。微积分涉及到的数学思想1,世界观:微观和宏观微积分其实是两种世界观,一种是微观的世界观,一种是宏观的世界观。微观的世界观比较“简单”:曲线变成了直线,变化的东西变成了均匀的东西。所以,当宏观的东西比较复杂的时候,可以把它转化为处理微观的东西。宏观的世界观和微观的世界观之间有一个桥梁,这个桥梁有时候不存在,但是在大多数时候是存在的。2,扩展和类比一元中的一些结论可以扩展到二元、三元,它们大多数时候是成立的。这种扩展,涉及到了很多类比的思想。3,“复合”的东西拆解为“简单”一个“复合”的东西,可以拆解为一些“简单”的东西,比如我们可以把一个函数写成很多个多项式的和。4,单位和坐标的转换我们在描述大小、长度、速度这些变量的时候,可以用不同的单位(比如米和厘米)来描述。这些量本身是没有数字的,只是我们为了便于记录,为它们赋予了数字。当我们用不同的单位来衡量的时候,它们是体现为不同的数字的。不同的单位之间可以相互转换。线性代数涉及到的数学思想本文没有讲线性代数,但是讲数学思想的时候,还是应该稍微涉及一下的。线性代数中也涉及到一些重要的数学思想。1,正交化和标准化:我们可以把几个向量进行化简,让它们变成彼此垂直的。这就是正交化。然后再把它们化简为长度为1,这就是标准化。2,线性无关和线性相关:假设我们有n个向量/等式,其中有的是“有用”的,有的是“无用”的。我们想看看这n个向量/等式中有几个是“有用”的:这就是向量组的极大无关组/矩阵的秩。3,提取特征:我们通过对矩阵进行对角化,可以计算出矩阵的特征值和特征向量。然后,可以进一步进行谱分解。}

蓝色字体上两行看不懂,希望大哥大姐解答。。。。。...
蓝色字体上两行看不懂,希望大哥大姐解答。。。。。
展开
首先定积分里面有一个性质:如果两个函数f(x)和g(x)的大小关系在区间[a,b]里面恒有f(x)≤g(x)成立那么在区间[a,b]里面对f(x)的定积分≥在区间[a,b]里面对g(x)的定积分。这里就是依照这个性质推理的。m、n是常数函数,也是函数。所以m≤f(x)≤n在区间[a,b]里面恒成立。那么定积分的大小关系也就可以得出。而常数函数的定积分就是常数乘(b-a),这是可以计算证明出来的。
本回答由提问者推荐已赞过已踩过你对这个回答的评价是?评论
收起m,M为常数则求一个常数的定积分,为常数乘以上限减下限利用定积分单调性质倒数第二行是对倒数第三行积分的,最后一行是积分的结果啊倒数第二行就是式子取a到b的积分
最后一行就是求定积分的啊}

我要回帖

更多关于 微积分和函数的关系 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信