概率论问题,关于两个高斯分布的和的分布?

中所需的概率论 高斯的推导(七)数据分析师

论道正态,的4大数学推导

如本blog内之前所说:凡是涉及到要证明的东西.理论,便一般不是怎么好惹的东西。绝大部分时候,看懂一个东西不难,但证明一个东西则需要点数学功底,进一步,证明一个东西也不是特别难,难的是从零开始发明创造这个东西的时候,则更显艰难(因为任何时代,大部分人的研究所得都不过是基于前人的研究成果,前人所做的是开创性工作,而这往往是最艰难最有价值的,他们被称为真正的先驱。牛顿也曾说过,他不过是站在巨人的肩上。你,我则更是如此)。

     上述第4节已经介绍了的历史由来,但尚未涉及数学推导或证明,下面,参考概率论沉思录,引用“的前世今生”等相关内容,介绍推导正太分布的4种方法,曲径通幽,4条小径,殊途同归,进一步领略的美妙。

    第一条小径是高斯找到的,高斯以如下准则作为小径的出发点

误差分布导出的极大似然估计 = 算术平均值

    设真值为,而次独立测量值,每次测量的误差为,假设误差的密度函数为,则测量值的联合概率为n个误差的联合概率,记为

    由于高斯假设极大似然估计的解就是算术平均,把解带入上式,可以得到

    由于此时有,并且是任意的,由此得到:.再在(6)式中取,并且要求,且,则有,并且

    所以得到而满足上式的唯一的连续函数就是,从而进一步可以求解出

    由于是概率分布函数,把正规化一下就得到密度函数

}

本节书摘来自华章社区《电子元器件的可靠性》一书中的第2章,第2.7节正态分布或高斯分布,作者王守国,更多章节内容可以访问云栖社区“华章社区”公众号查看

2.7 正态分布或高斯分布
2.7.1 正态分布规律
Distribution)最初是由误差理论推导出来的,是概率论中最重要的概率分布之一。它是哈根和高斯从不同假设角度出发,推导出相同的分布函数,故又称高斯分布,其分布密度函数f(t)为f(t)=12πe-(t-μ0)22σ2(2-13)式中,σ、μ0为与时间无关的常数。σ称为标准偏差或方均根误差,μ0称为均值。其失效分布密度函数如图2.13a所示。


从图2.13中可以看出:
1) 曲线关于μ0左右对称,两边的面积正好各占一半,且(μ0-σ)~(μ0+σ)的面积为曲线下总面积的68.3%,(μ0-2σ)~(μ0+2σ)的面积为曲线下总面积的95.4%,(μ0-3σ)~(μ0+3σ)的面积为曲线下总面积的99.7%,而不论σ值的大小如何均是这样,如图2.13b所示。
2) 在相同的σ值下,μ0的大小只影响图形的位置,而不影响形状。也就是说,μ0影响分布函数的平均值。
3) 在相同的μ0值下,σ的大小只影响曲线的平坦程度。σ越大,曲线越平坦,其失效概率分布越分散。
因此,只要确定均值μ0和标准偏差σ,就完全确定正态分布曲线。

2.7.2 失效率的状态分布
正态分布代表了产品的失效时间是以均值μ0为中心的对称分布,其失效率随时间增长而递增。正态分布可用来描述产品在某一时刻后由损耗或退化产生的失效。产品服从正态分布的可靠性特征量分别为:
=2μ02π2∫∞0e-Z22dZ2=2μ0ππ2=μ0  因此,服从正态分布的电子产品的平均寿命是常数,且等于分布函数的均值μ0。显然,σ将表示产品寿命的分散程度,σ小表示分散程度小。
同样,也可以求出正态分布的方差,它等于分布的标准偏差的平方,即正态分布的方差为Dt=∫∞-∞(t-μ0)2f(t)dt=σ2  正态分布在可靠性计算中有两个主要应用:第一是考虑元器件的定量特性与标称值的关系,包括计算电子元器件特性符合性能要求的概率;第二是用于电子元器件描述耗损失效期的失效分布规律,因为耗损失效期的分布规律非常接近于正态分布。
必须指出的是,在威布尔分布与正态分布的分布函数均值和标准偏差相等的条件下,当威布尔分布的形状参数m介于3~4之间时,两种分布的分布密度函救的曲线基本上是重合的。因此,可以将正态分布规律用m=3~4的威布尔分布规律来近似。

2.7.3 正态分布概率纸
正态分布参数μ0、σ可用解析方法计算来确定,也可以根据类似威布尔分布的分析方法构造出正态概率纸,用图解法来求得。
因为累积失效概率函数F(t)=1-R(t)=∫t0f(t)dt=12πσ∫t0e-(t-μ0)22σ2dt若令Z=t-μ0σ,则dZ=1σdt,有F(t)=1-R(t)=∫Z-∞12πe-Z22dZ=Φ(Z)  显然,给出一个Z值,就有函数值Φ(Z)与之对应,正态分布表就是Z值与Φ(Z)值之间的对应关系表,其特殊点的对应关系如图2.14所示。
利用其对应关系可以构造出一种特殊概率纸——正态概率纸。正态概率纸也由两个直角坐标系构成,一个直角坐标系是t~Z直角坐标系,横轴是t轴,纵轴是Z轴,两坐标轴的刻度是线性的,另一个直角坐标系是t~Φ(Z)坐标系,由于F(t)=Φ(Z),也就是t~F(t)坐标系,其横轴还是原来的t轴,刻度不变;纵轴还是原来的纵轴,但纵轴的F(t)=Φ(Z)是按图2.14对应Z值的Φ(Z)值划分刻度的,从而构成正态概率纸,如图2.15所示。


因为Z=t-μ0σ,Z与t呈线性关系,所以,凡产品失效概率遵循正态分布规律时,在t~Z直角坐标系中将描绘出一条直线,而这条直线同样描绘在t~F(t)坐标系中。因此,满足正态分布的分布函数F(t)在t~F(t)坐标系中必将是一条直线,把这样的概率纸称为正态概率纸。
对于正态分布用正态概率纸来处理是十分方便的。下面简述正态概率纸的应用。
1) 同前所述,将试验数据由小到大排列,按t~F(t)作成数据表;
2) 在正态概率纸上描绘出[ti,F(ti)]对应的点;
3) 通过所描出的点按最小二乘法原则或目视法配置回归直线,此直线就是所确定的产品失效分布曲线。
2.正态分布参数的估计
(1) 平均寿命μ0的估计
过F(t)轴上刻度为50%的点引水平线与回归直线相交,过交点引垂线与t轴相交的刻度值即为μ0。
(2) 标准偏差σ的估计
实际上有不少产品,其失效分布并不完全符合正态分布,更符合对数正态分布,如某些半导体器件和引擎材料疲劳试验的裂缝缺陷导致的失效,其分布符合对数正态分布。对数正态分布函数形式和分析方法与正态分布相类似,不同的只是将t用lnt来代替而已,其分布函数为F(t)=Φlnt-μ0σ如令lnt=x,则u=x-μ0σ,有F(t)=Φx-μ0σ=Φ(u)  由于t与x一一对应,u与Φ(u)也一一对应,因此,可以构造出对数正态概率纸。它与正态概率纸的唯一不同之出,只是横轴不按t线性刻度划分,而是按lnt线性刻度划分。同样可得对数正态分布的对数均值估计值为μ0=lnt0.5,以及对数标准偏差的估计值为σ=μ0-lnt0.159或σ=lnt0.841-μ0  这里必须特别指出的,由这种概率纸虽可估计出对数均值μ0和对数标准偏差σ,但不能直接从图上估计出产品的寿命特征值,还必须按下式换算才能得到产品的寿命均值α和标准偏差的估计值β公式,即α=eμ0+0.5σ2

}

  二项分布有两个参数,一个 n 表示试验次数,一个 p 表示一次试验成功概率。现在考虑一列二项分布,其中试验次数 n 无限增加,而 p 是 n 的函数。

  1.如果 np 存在有限极限 λ,则这列二项分布就趋于参数为 λ 的 泊松分布。反之,如果 np 趋于无限大(如 p 是一个定值),则根据德莫佛-拉普拉斯(De'Moivre-Laplace)中心极限定理,这列二项分布将趋近于正态分布。

  2.实际运用中当 n 很大时一般都用正态分布来近似计算二项分布,但是如果同时 np 又比较小(比起 n来说很小),那么用泊松分布近似计算更简单些,毕竟泊松分布跟二项分布一样都是离散型分布。

日常生活中,大量事件是有固定频率的。

  • 某医院平均每小时出生3个婴儿
  • 某公司平均每10分钟接到1个电话
  • 某超市平均每天销售4包xx牌奶粉
  • 某网站平均每分钟有2次访问

它们的特点就是,我们可以预估这些事件的总数,但是没法知道具体的发生时间。已知平均每小时出生3个婴儿,请问下一个小时,会出生几个?

有可能一下子出生6个,也有可能一个都不出生。这是我们没法知道的。

泊松分布就是描述某段时间内,事件具体的发生概率。

       上面就是泊松分布的公式。等号的左边,P 表示概率,N表示某种函数关系,t 表示时间,n 表示数量,1小时内出生3个婴儿的概率,就表示为 P(N(1) = 3) 。等号的右边,λ 表示事件的频率。接下来两个小时,一个婴儿都不出生的概率是0.25%,基本不可能发生。

接下来一个小时,至少出生两个婴儿的概率是80%。

       可以看到,在频率附近,事件的发生概率最高,然后向两边对称下降,即变得越大和越小都不太可能。每小时出生3个婴儿,这是最可能的结果,出生得越多或越少,就越不可能。

      二项分布即重复n次的伯努利试验。在每次试验中只有两种可能的结果,而且是互相对立的,是独立的,与其它各次试验结果无关,结果事件发生的概率在整个系列试验中保持不变,则这一系列试验称为伯努利实验。

distribution),最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。
       正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。

假设随机变量X服从一个位置参数为μ、尺度参数为σ的正态分布,则可以记为:

当μ = 0,σ = 1时的正态分布是标准正态分布。

在python中画正态分布直方图

通过numpy构造正太分布数据,之后画图,可以通过size大小来调节数据的正太分布效果

画直方图与概率分布曲线

}

我要回帖

更多关于 概率论三大分布 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信