帮助求个概率

1995年,关于美国退役棒球明星辛普森杀妻案的世纪大审判开始了。在这场吸引无数人眼球的现场直播中,美国联邦检察院的检察官首先发飙了,说辛普森在案发之前就有非常严重的家庭暴力现象,这个就证明辛普森很有可能就是真正的凶手。这是一个出于人们常识的判断,且看辩方律师怎么脱身,好在辛普森耗尽家财请了当年美国最有名的律师团,号称“梦幻辩护团队”。律师团里有位哈佛的法学教授看到检方的所谓证据,微微一笑,拿出了一组数据。


1995年世纪大审判现场

联邦调查局曾经做过的一个犯罪统计,大约每2500位家暴男中才会出现一个杀害妻子的案例,也就是说,在全美范围内,一个家暴并最终会杀害妻子的男人平均2500个人里才会出现1个而已,概率仅为0.04%。这两个事件可以说根本就是毫不相干的,也就是说家暴与最终杀妻毫无关系。这组数据一出,即使检方以及观众觉得匪夷所思,法官也不得不认为辩方的论据有效。

从常理来看,检方的论据在大多数人心里都是很有分量的,但是为什么根据真实数据分析下来发现这两个事件之间却几乎没有联系呢?这就说明,我们被概率论坑了。。。


家暴和杀妻这两个事件在统计学上没有相关性

18世纪时,欧洲有个叫托马斯·贝叶斯的僧侣,这位僧侣一辈子虔诚信奉上帝,不过业余生活也偶尔研究研究数学知识,留下不少草稿。在他死后,有位朋友整理的他的遗作,然后就发表了一个在概率学上非常有名的定理——贝叶斯定理。


先来看看贝叶斯定理的定义:


左边P(A∣B)是当已经确定B事件发生时求A发生的概率,右边的P(A)是A事件发生的概率,P(B∣A)则是已经确定发生了A事件之后B的发生概率,P(B)是B事件的发生概率。通常情况下,等式右边的三个都是“正概率”,这是经典的古典概率类型,很容易根据实际条件来计算出来,而等式左边的则被称之为“逆概率”,这就不时那么显而易见了。则我们先不去探讨贝叶斯公式的推导过程。先用一个小例子来形象化一下。


问题:有两个框子,第一个框子有10个红球,4个绿球;第二个框子有8个红球,5个绿球;如果现在随手从两个框中捞出一个红球,请问这个红球是来自第一个框的概率是多少?

我们来根据贝叶斯定理的描述来解答这个题目:


通常情况下,这些逆概率都是不太好计算的,然而贝叶斯公式正是给了我们一个很简单的方法由简单正概率来计算求得。

前面那个辛普森杀妻案辩方驳斥了检方用一个微不足道的证据来推论有罪,我们用贝叶斯定理来分析一下。


至少统计学上说,辛普森是无罪的

假如一个已婚男是家暴男记为事件A,假如一个已婚男是杀妻的凶手为事件B,那么此时我们要求出全美所有家暴男占到所有成年男性的概率P(A),同时还要知道已婚男是杀妻凶手的概率P(B),以及一个已婚男如果杀妻了且经常家暴的概率P(A∣B),而这里的P(A∣B)就等于(100%-0.04%)=1。我们估算先来估算P(B),全美杀妻案的凶手的概率应该是微乎其微的,姑且算为0.01%,全美家暴男的概率P(A)估算为10%(实际上这个比例不低)。P(B∣A)=0..1=0.001=0.1%。

当然这里是两个P(A),P(B)都只是根据常识估算出来的,并不十分准确。显然,这里的全美杀妻案凶手是丈夫的概率与丈夫是家暴男的概率越相近,则辛普森是凶手的概率也就越大。而辩方明确得出这个关系概率仅有0.04%,可以说这两个事件之间几乎是没有什么关系的,显然不能作为任何判罚有罪的证据!梦幻辩护团用精准无误的概率论知识瓦解了检方抛出的一大证据!


2020年,中国50岁乳腺癌发病率约在0.8%,且每次检查成阳性的准确性是90%,(假设每次患上乳腺癌并通过X光检查是阳性的准确率是90%),请问,如果一个女性去检查乳房X光,结果成阳性的话,这个味女性患上乳腺癌的概率大概是多少?


中国女性乳腺癌的发病率统计

既然准确率能到90%,那么常理来说,只要检查结果是阳性,患癌的概率就是9成啊。那既然这样,为什么通常这种情况下,医生还是会让你继续做更加详细的检查呢,而不是立刻投入治疗呢?


X光检测是判定乳腺癌的有效手段

问题是出在哪儿呢?问题就出现在那个90%准确率是什么意思。仔细考虑下,这个准确率是建立在已经患癌事件的基础上的,假如并没有真正患癌,那又何来准确率呢?因此,这里的90%准确率意思是,已经患癌,并通过X光乳房检测呈阳性的概率是90%。记住,这是一个很重要的分析。接下来,我们就可以把贝叶斯定理拉进来,算算那个最为让人担心的概率是多少了。


定时体检是一个很好的预防疾病的手段

假定这名女性患癌是A事件,检查结果为阳性是B事件。那么P(A)=0.008,P(B):=0.08(此概率是经过数据推导出,不作详细论述),P(B∣A)=0.9,于是P(A∣B)=0.008*0.9/0.08=0.09,也就是说,在经过50岁的女性在第一次做乳房X光检查呈阳性就患上乳腺癌的可能性仅仅只有9%而已,这个概率看起来是相当的低!完全不用如临大敌的样子。因此你必须进行更加细致的检查,来排除更多误诊的情况,直到检查结果做得相当充分了。才能确诊,并开始治疗流程,这也是为什么一些严重疾病,医院总是要做很多项检查,到最后才开始治疗的根本原因。


遇到呈阳性先不要怕,想一想贝叶斯定理

想想,如果我们在这里不仔细分析那个准确率90%是什么意思,按照常规理解,是不是会一下子就觉得生命如此脆弱,把我们的精神坑得不轻!而贝叶斯定理却将各种条件下的概率分门别类,在什么前提条件的概率是什么计算恰当容易理解,也就容易得到那个最终的答案了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

}

随着机器人技术、智能控制技术、硬件传感器的发展,机器人在工业生产、军事国防以及日常生活等领域得到了广泛的应用。而作为机器人行业的重要研究领域之一,移动机器人行业近年来也到了迅速的发展。移动机器人中的路径规划便是重要的研究方向。移动机器人的路径规划方法主要分为传统的路径规划算法、基于采样的路径规划算法、智能仿生算法。传统的路径规划算法主要有A*算法、Dijkstra算法、D*算法、人工势场法,基于采样的路径规划算法有PRM算法、RRT算法,智能仿生路径规划算法有神经网络算法、蚁群算法、遗传算法等。

1. 传统路径规划算法

Dijkstra算法是Edsger Wybe Dijkstra在1956年提出的一种用来寻找图形中结点之间最短路径的算法。Dijkstra算法的基本思想是贪心思想,主要特点是以起始点为中心向外层层扩展,直到扩展到目标点为止。Dijkstra算法在扩展的过程中,都是取出未访问结点中距离该点距离最小的结点,然后利用该结点去更新其他结点的距离值。

1. 将初始点s放入到集合S中,初始时集合S中只有s;

2. 无自环的初始点s到自己的最短路径为0;

3. For(目标点ei不在集合S中):

4. 计算集合S中以外的所有结点到集合S中结点的最短距离,即从s出发,到达所有结点且只允许通过初始点s的最短路径。如果没有直达的通路,那么就设置为无穷,意味着暂时到达不了的结点。

6. 选出第一次for循环之后在集合V-S中,且相对于集合S的最短路径中距离最短的目标点ej。

7. 将该目标点ej并入到集合S中。

8. 将目标点ej并入集合S之后会对V-S以外的顶点相对于集合S的最短路径长度产生影响。

9. For(更新S中的结点路径)

注:该算法不允许图中存在负权边。

1)如果最优路径存在,那么一定能找到最优路径

1)有权图中可能是负边

2)扩展的结点很多,效率低

A*算法发表于1968年,A*算法是将Dijkstra算法与广度优先搜索算法(BFS)二者结合而成,通过借助启发式函数的作用,能够使该算法能够更快的找到最优路径。A*算法是静态路网中求解最短路径最有效的直接搜索方法。

f(n)表示结点的综合优先级,在选择结点时考虑该结点的综合优先级;

g(n)表示起始点到当前结点的代价值;

h(n)表示当前结点到目标点的代价估计值,启发式函数。

当h(n)趋近于0时,此时算法退化为Dijkstra算法,路径一定能找到,但速度比较慢;当g(n)趋近于0时,算法退化为BFS算法,不能保证一定找到路径,但速度特别快。我们可以通过调节h(n)的大小来调整算法的精度与速度。

a) 遍历开启列表openlist,寻找F值最小的结点,并将其作为当前要处理的结点

b) 将要处理的结点移到关闭列表closelist

c) 对当前结点的8个相邻结点的每个结点:

i. 如果他是不可抵达的或者已经在关闭列表closelist中,忽略;

ii. 如果他不在开启列表openlist中,将其加入openlist,并把当前结点设置为其父节点,记录当前结点的F、G、H值;

iii. 如果他已经在开启列表openlist中,检查这条路径(即经由当前结点到达相邻结点)是否更好,用G值做参考,更小的G值表示这个更好的路径,如果是这样,将其父节点设置为当前结点,并重新计算他的G值和F值,如果开启列表openlist是按F值进行排序,改变后需要重新排序。

i. 终点加入到了开启列表openlist中,此时路径已经找到

ii. 查找重点失败,并且开启列表openlist中是空的,此时没有路径

3. 保存路径,从终点开始,每个结点沿着其父节点移动直到起点。

1)利用启发式函数,搜索范围小,提高了搜索效率

2)如果最优路径存在,那么一定能找到最优路径

1)A*算法不适用于动态环境

2)A*算法不太适合于高维空间,计算量大

3)目标点不可达时会造成大量性能消耗

D*算法是卡耐基梅隆机器人中心的Stentz在1994年提出的主要用于机器人探路,并且美国火星探测器上就是应用的D*路径规划算法。A*算法适用于在静态路网中寻路,在环境变化后,往往需要replan,由于A*不能有效利用上次计算的信息,故计算效率较低。D*算法由于储存了空间中每个点到终点的最短路径信息,故在重规划时效率大大提升。A*是正向搜索,而D特点是反向搜索,即从目标点开始搜索过程。在初次遍历时候,与Dijkstra算法一致,它将每个节点的信息都保存下来。

1. 先用Dijkstra算法从目标节点G向起始节点搜索。储存路网中目标点到各个节点的最短路和该位置到目标点的实际值h,k(k为所有变化h之中最小的值,当前为k=h)原OPEN和CLOSE中节点信息保存。

机器人沿最短路开始移动,在移动的下一节点没有变化时,无需计算,利用上一步Dijkstra计算出的最短路信息从出发点向后追述即可,当在Y点探测到下一节点X状态发生改变,如堵塞。机器人首先调整自己在当前位置Y到目标点G的实际值h(Y),h(Y)=X到Y的新权值C(X,Y)+X的原实际值h(X)。X为下一节点(到目标点方向Y->X->G),Y是当前点。K值取h值变化前后的最小。

用A*或其他算法计算,这里假设用A*算法,遍历Y的子节点,放入CLOSE,调整Y的子节点a的h值,h(a)=h(Y)+Y到子节点a的权重C(Y,a),比较a点是否存在于OPEN和CLOSE中,方法如下:用A*或者其他算法计算,这里假设用A*算法,遍历Y的子节点,放入CLOSE,调整Y的子节点a的h值,h(a)=h(Y)+Y到子节点a的权重C(Y,a),比较a点是否存在于OPEN和CLOSE中,方法如下:

从OPEN表中取k值最小的节点Y;

更新OPEN表中a的h值;k值取最小的h值

有未受影响的最短路径存在

if(a in CLOSE) 比较两个a的h值 //注意是同一个节点的两个不同路径的估价值

更新CLOSE表中a的h值; k值取最小的h值;将a节点放入OPEN表

有未受影响的最短路径存在

将a插入OPEN表中; //还没有排序

OPEN表比较k值大小进行排序;

1)适用于动态环境的路径规划,搜索效率高

1)不适用于高维空间,计算量大

2)不太适用于在距离较远的最短路径上发生变化的场景

人工势场法是由Khatib在1985年提出的一种基于虚拟力场的局部路径规划算法,该算法的基本思想是当机器人在周围环境中运动时,将环境设计成一种抽象的人造引力场,目标点对移动机器人产生“引力”,障碍物对移动机器人产生“斥力”,最后通过二者的合力来控制移动机器人的运动。应用人工势场法规划出来的路径一般是比较平滑并且安全的,但是存在着局部最优的问题。

利用势场函数U来建立人工势场,势场函数是一种可微函数,空间中某点处势场函数值的大小,代表了该点的势场强度。我们采用引力势场函数与斥力势场函数,用U(q)表示二者之和。

e为引力增益,p(q,qgoal)表示当前点到目标点的距离;

n为斥力增益,p(q,qgoal)表示当前点到障碍物的距离,p0表示障碍物作用距离阈值。

1)规划出的路径一般是比较平滑且安全

2)人工势场法是一种反馈控制策略,具有一定的鲁棒性

1)容易陷入局部最优的问题

2)距离目标点较远时,引力特别大,斥力相对较小,可能会发生碰撞

3)当目标点附近有障碍物时,斥力非常大,引力较小,很难到达目标点

2. 基于采样路径规划算法

随机路线图(PRM)算法是一种基于图搜索的算法,可以将连续状态空间转换成离散状态空间,在利用A*等搜索算法在路线图上寻找路径,提高搜索效率。PRM算法是概率完备且不是最优的算法。

1. 初始化,设G(V,E)为一个无向图,其中顶点集V代表无碰撞的状态点,连线集E代表无碰撞的路径。初始状态为空。

2. 状态点采样,在状态空间中采样无碰撞的状态点加入到无碰撞的状态点V中。

3. 邻域计算,定义距离p,对于已经存在于无碰撞的状态点V中的点,如果他与无碰撞的点的距离小于p,则将其称作无碰撞状态点的邻域点。

4. 边线连接,将无碰撞的状态点与其邻域相连,生成连线。

5. 碰撞检测,检测连线是否与障碍物发生碰撞,如果无碰撞,则将其加入到连线集E中。

6. 结束条件,当所有采样点均已完成上述步骤后结束,否则重复2~5。

1)适用于高维空间和复杂约束的路径规划问题

2)搜索效率高,搜索速度快

1)概率完备但不是最优

RRT算法是适用于高维空间,通过对状态空间中的采样点进行碰撞检测,避免了对空间的建模,较好的处理带有非完整约束的路径规划问题,有效的解决了高维空间和复杂约束的路径规划问题。该算法是概率完备但不是最优的算法。

RRT算法以初始点qinit作为根节点,通过随机采样增加叶子节点的方式,生成一个随机扩展树,当目标点位于随机扩展树上时,能够找到一天初始点到目标点的路径。首先,需要从状态空间中随机选择一个采样点qrand,然后从随机树中选择一个距离qrand最近的结点qnearest,从qnearest向qrand扩展一个步长的距离,得到一个新的结点qnew,如果qnew与障碍物发生碰撞,则返回空;否则,将qnew加入到随机树中,重复上述步骤直到qnearest和qgoal距离小于一个阈值。

1)搜索效率比较高,搜索速度比较快

2)适用于高维空间,不会产生维度灾难的问题

3)只需对状态空间采样点进行碰撞检测,避免了对空间的建模

1)规划出的路径质量一般,可能存在棱角、不够光滑

2)RRT算法不太适用于存在狭长空间的环境

3)规划出的路径可能不是最优路径

4)不适用于动态环境的路径规划

随着机器人自主性的不断提高,使其具有环境感知以及环境学习的能力,许多学者提出了深度强化学习算法来解决移动机器人处于动态复杂环境中路径规划的问题。深度强化学习算法充分利用了深度学习的感知能力与强化学习的决策能力,通过机器人与环境的交互过程不断试错,通过环境评价性的反馈,实现系统更加智能的决策控制,帮助移动机器人在某些复杂未知的环境中实现一定程度的自主化与智能化。

路径规划就是一个标准的MDP问题,强化学习可以通过值迭代等方法建立一个表格,用以存储状态s到动作a的映射。但是在复杂环境中会产生维度灾难的问题,因此神经网络可以解决维度灾难的问题。以DQN算法为例,来讲解神经网络算法在路径规划中的应用。DQN算法是Q-Learning算法与卷积神经网络(CNN)二者进行结合。DQN算法是由两个网络结构、初始参数相同的结构组成,一个是估计网络,用来输出估计值函数;另一个是目标网络,用来输出目标值函数。通过强化学习使机器人与环境进行交互得到样本(s,a,r,s’),将所有的样本集放入到经验回放池中。神经网络进行训练时,随机的从经验回放池中抽取batchsz数量的样本,将样本输入进神经网络,利用神经网络的非线性拟合能力,拟合出非线性函数来表达我们的Q值,利用e-greedy策略来进行选择智能体的动作。智能体执行完相应的动作之后,环境会反馈一个状态和奖励值,最后经过神经网络模型的训练和优化得到网络的训练参数,得到相对准确的动作输出。

其中theta表示估计网络的参数,theta-表示目标网络的参数。

1)适合于动态复杂环境

2)适用于高维空间,避免维度灾难的问题

1)对硬件的要求比较高

蚁群算法(Ant Colony Optimization,ACO)是Dorigo在1992年提出的一种用来寻找优化路径的概率型算法,是由一群无智能或有轻微智能的个体通过相互写作而表现出智能行为,为求解复杂问题提供了一个新的可能性。该算法的主要思想是蚂蚁在寻找食物过程中发现路径的行为。该算法具有分布计算、信息正反馈和启发式搜索的特征,本质上是进化算法中的一种启发式全局优化算法。

蚁群算法的基本原理是利用蚂蚁在觅食过程中会释放信息素。

1. 初始时刻,路径没有任何信息素,蚂蚁会以一定的随机性选择任意方向

2. 更新信息素矩阵,当有信息素时,蚂蚁会优先选择信息素浓度高的路径

3. 那么在相同时间内,信息素的浓度与路径长度成反比,越短的路径会有更多的信息素,那么后续的蚂蚁会选择信息素浓度高的路径,最优路径上的信息素浓度会越来越高

4. 随着时间的推移,信息素会自行挥发

5. 最终,能选择出一条最优路径即信息素浓度高的路径

3)以何种方式让蚂蚁选择运动方向,减少盲目性和不必要性

4)给予蚂蚁和环境一定的记忆能力能够帮助减少搜索空间

个体分布越均匀,种群多样性就越好,得到全局最优解的概率就越大,但是寻优时间就越长;个体分布越集中,种群多样性就越差,不利于发挥算法的探索能力。正反馈加快了蚁群算法的收敛速度,却使算法较早地集中于部分候选解,因此正反馈降低了种群的多样性,也不利于提高算法的全局寻优能力。

1)蚁群算法的鲁棒性强

2)采用正反馈机制,能够逼近最优解

3)易与其他算法进行结合

1)盲目的随机搜索,搜索时间较长,搜索速度慢

2)蚁群算法容易陷入局部最优

3)蚁群算法参数的选择依赖于经验或试错

遗传算法(Genetic Algorithm,GA)是由John Holland于20世纪70年代提出,该算法是根据大自然中生物体进化规律而设计提出的,来模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。其本质是一种高效、并行、全局搜索的方法,能在搜索过程中自动获取和积累有关搜索空间的知识,并自适应地控制搜索过程以求得最佳解。

1.评估每条染色体所对应个体的适应度

While(未找到满意的解):

2.遵照适应度越高,选择概率越大的原则,从种群中选择两个个体作为父方和母方

3.抽取父母双方的染色体,进行交叉,产生子代

4.对子代的染色体进行变异

1)遗传算法具有广泛的应用领域

2)遗传算法具有群体搜索的特性

3)遗传算法基于概率规则,搜索更为灵活

4)遗传算法直接以目标函数作为搜索信息,不涉及目标函数值求微分的过程

1)遗传算法效率比较低

2)遗传算法容易过早收敛

3)遗传算法在编码时容易出现不规范不准确的问题

}

关于《经验,知识,百科,个人图书馆,在线图书馆》用户点评二、

前言:此版本的软件安装包附加破解教程我可以给您一份,不过仅供个人使用,切勿传播,希望可以帮助您 (1)软件安装包:点击下载grapher破解版 grapher11破解教程 1、首先在本站下载grapher11破解版压缩包 2、解压之后,点击"setup.exe"进行安装 3、根据计算机选择位数,点击next 4、同意许可协议 5、选择安装目录 6、安装中,等待片刻

前言:此版本的软件安装包附加破解教程我可以给您一份,不过仅供个人使用,切勿传播,希望可以帮助您 (1)软件安装包:点击下载grapher11破解版 grapher11破解教程 1、首先在本站下载grapher11破解版压缩包 2、解压之后,点击"setup.exe"进行安装 3、根据计算机选择位数,点击next 4、同意许可协议

mac grapher里怎么打减号加号等于号。谢各位大神

用键盘就按着上档键(shift)同时也按着加+的那个键,就会出来了,但是输入法要在英文状态哦,如果是五笔状态,直接按-减就会出来了,你看得明白吗?不明白再问我吧,

}

我要回帖

更多关于 求概率的简单方法 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信