第10题怎么解决,希望能看到贝叶斯公式典型例题完整过程?

本文使用 Zhihu On VSCode 创作并发布目录0 前言贝叶斯滤波基于贝叶斯公式,通过上一时刻的状态及当前时刻的输入,对当前时刻的状态作出预测,并通过当前时刻的观测对预测作出更新(也可称为纠正),最终实现对当前时刻状态的估计。贝叶斯滤波思想是卡尔曼滤波、粒子滤波等算法的基础。本文从概率基础概念出发,逐步进行贝叶斯滤波的推导。1 概率基础概念拾遗1.1 随机变量1.1.1 定义定义在样本空间 \Omega 上的实值函数:X = X(\omega), \omega \in \Omega \\被称为随机变量(random variable),如下图所示。\omega 表示样本空间 \Omega 里的随机事件,可能与数量有关(如传感器随机测得的前方障碍物的距离值,随机掷骰子得到的点数),也可能与数量无关(如随机掷硬币的结果可能为正面或反面)。随机变量随机变量表示随机试验各种结果的实值单值函数。随机事件不论与数量是否直接有关,都可以数量化,即都能用数量化的方式表达。“随机变量 X 的取值为 x ”就是满足等式 X(\omega)=x 的一切 \omega 组成的集合,简记为“ X=x”,这是 \Omega 的一个子集,即:“X=x”=\{\omega:X(\omega)=x\} \subset \Omega \\类似地,有:“X\leqslant x”=\{\omega:X(\omega)\leqslant x\} \subset \Omega \\1.1.2 离散型随机变量如果随机变量的函数值是实数轴上孤立的点(有限个或者无限个),则称为离散型随机变量:离散型随机变量1.1.3 连续型随机变量如果随机变量的函数值是实数轴上某个区间上所有的值(也可以是 (-\infty, +\infty) 区间),则称为连续型随机变量:连续型随机变量1.2 累积分布函数设 X 为一个随机变量,对于任意实数 x,称:F(x)=P(X\le x) \\为随机变量 X 的累积分布函数(Cumulative Distribution Function,CDF),又称概率分布函数,简称分布函数。若 X 为离散型随机变量,存在函数 f_X(x),使其分布函数满足:F(x)=P(X\le x)=\sum_{u \le x}f_X(u) \\若 X 为连续型随机变量,存在函数 f_X(x),使其分布函数满足:F(x)=P(X\le x)= \int_{-\infty}^{x}f_X(u)\mathrm{d}u \\分布函数满足单调性、有界性和右连续性:单调性对任意 x_1\le x_2,有 F(x_1)\le F(x_2)有界性对任意 x,有:0\le F(x)\le 1且有:\lim_{x\to -\infty}F(x)=0,\quad \lim_{x\to +\infty}F(x)=1右连续性对任意 x_0,有:\lim_{x\to x_0^+}F(x)=F(x_0)1.3 概率质量函数假设 X 为离散型随机变量,其全部可能取值为 x_1, x_2, x_3, ··· ,其概率分布列可表述为:则称:f_X(x)=\begin{cases}
p(x)=P(X=x), \quad x \in \{x_i\}, i=1, 2, 3, ··· \\
0, \quad 其它\end{cases} \\为离散型随机变量 X 的概率质量函数(Probability Mass Function,PMF)。也可采用如下的表示方法:X\sim p(x) \\读作 X 服从 p(x) 的概率分布。概率质量函数表征了离散型随机变量在各特定取值上的概率,其满足非负性、规范性和可加性:非负性f_X(x_i) \ge 0规范性和可加性\sum_{i=1}^{\infty}f_X(x_i)=1离散型随机变量概率质量函数的叠加得到了离散型随机变量的累积分布函数。1.4 概率密度函数假设 X 为连续型随机变量,存在函数 f_X(x),且满足:非负性f_X(x) \ge 0规范性和可加性\int_{-\infty}^{+\infty}f_X(x)\mathrm{d}x=1则称函数 f_X(x) 为连续型随机变量 X 的概率密度函数(Probability Density Function,PDF),连续型随机变量概率密度函数的积分得到了连续型随机变量的累积分布函数。概率密度函数表征了连续型随机变量的输出值在某个确定的取值点附近的可能性。连续型随机变量的输出值在某个确定的取值点上的概率为0,但并不代表该事件不会发生。1.5 联合概率1.5.1 二维离散型随机变量的联合概率质量函数若二维离散型随机变量 (X,Y) 所有可能的取值为(x_i, y_j), i, j=1, 2, 3, \cdots \\且存在函数 f_{X,Y}(x,y):f_{X,Y}(x,y)=p(x,y)=P(X=x,Y=y), \quad (x,y) \in \{x_i,y_j\}, i,j=1, 2, 3, ···函数 f_{X,Y}(x,y) 满足如下性质(即概率的三大公理):非负性f_{X,Y}(x_i, y_i) \ge 0 \\规范性和可加性\sum_{i=1}^{\infty}\sum_{j=1}^{\infty}f_{X,Y}(x_i, y_i)=1 \\则称函数 f_{X,Y}(x,y) 为 (X,Y) 的联合概率质量函数(Joint Probability Mass Function),又称联合分布列,此定义可以推广到多维离散型随机变量。二维离散型随机变量联合概率质量函数的叠加得到了二维离散型随机变量的联合累积分布函数(Joint Cumulative Distribution Function):F_{X,Y}(x,y)=P(X\le x, Y\le y)=\sum_{u\le x}\sum_{v\le y}f_{X,Y}(u, v) \\1.5.2 二维连续型随机变量的联合概率密度函数若对于二维连续型随机变量 (X,Y),存在二元函数 f_{X,Y}(x,y) 满足:非负性f_{X,Y}(x,y) \ge 0 \\规范性和可加性\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f_{X,Y}(x,y)\mathrm{d}x\mathrm{d}y=1 \\则称函数 f_{X,Y}(x,y) 为 (X,Y) 的联合概率密度函数(Joint Probability Density Function),此定义可以推广到多维连续型随机变量。二维连续型随机变量联合概率密度函数的积分得到了二维连续型随机变量的联合累积分布函数:F_{X,Y}(x,y)=P(X\le x, Y\le y)=\int_{-\infty}^{x}\int_{-\infty}^{y}f_{X,Y}(u,v)\mathrm{d}v\mathrm{d}u \\1.6 边缘概率1.6.1 二维离散型随机变量的边缘概率质量函数若二维离散型随机变量 (X,Y) 所有可能的取值为(x_i, y_j), i, j=1, 2, 3, \cdots \\且联合概率质量函数 f_{X,Y}(x,y) 为:f_{X,Y}(x,y)=p(x,y)=P(X=x,Y=y), \quad (x,y) \in \{x_i,y_j\}, i,j=1, 2, 3, ···对 j 求和所得的函数:f_X(x)=\sum_{j=1}^{\infty}f_{X,Y}(x,y_j)=\sum_{j=1}^{\infty}P(X=x,Y=y_j)=P(X=x), \quad x \in \{x_i\}, i=1, 2, 3, ···称为 X 的边缘概率质量函数(Marginal Probability Mass Function),又称边缘分布列。类似的对 i 求和所得的函数:f_Y(y)=\sum_{i=1}^{\infty}f_{X,Y}(x_i,y)=\sum_{i=1}^{\infty}P(X=x_i,Y=y)=P(Y=y), \quad y \in \{y_j\}, j=1, 2, 3, ···称为 Y 的边缘概率质量函数。二维离散型随机变量边缘概率质量函数的叠加得到了二维离散型随机变量的边缘累积分布函数(Marginal Cumulative Distribution Function):F_X(x)=P(X\le x)=\sum_{u\le x}f_X(u)=\sum_{u\le x}\sum_{j=1}^{\infty}P(X=u,Y=y_j)=\sum_{u\le x}P(X=u) \\
F_Y(y)=P(Y\le y)=\sum_{v\le y}f_Y(v)=\sum_{v\le y}\sum_{i=1}^{\infty}P(Y=v,X=x_i)=\sum_{v\le y}P(Y=v) \\1.6.2 二维连续型随机变量的边缘概率密度函数若二维连续型随机变量 (X,Y) 的联合概率密度函数为 f_{X,Y}(x,y),则:f_X(x)=\int_{-\infty}^{+\infty}f_{X,Y}(x,y)\mathrm{d}y \\称为 X 的边缘概率密度函数(Marginal Probability Density Function)。类似的:f_Y(y)=\int_{-\infty}^{+\infty}f_{X,Y}(x,y)\mathrm{d}x \\称为 Y 的边缘概率密度函数。二维连续型随机变量边缘概率密度函数的积分得到了二维连续型随机变量的边缘累积分布函数:F_X(x)=P(X\le x)=\int_{-\infty}^xf_X(u)\mathrm{d}u=\int_{-\infty}^x\int_{-\infty}^{+\infty}f_{X,Y}(u,y)\mathrm{d}y\mathrm{d}u \\ F_Y(y)=P(Y\le y)=\int_{-\infty}^yf_Y(v)\mathrm{d}v=\int_{-\infty}^y\int_{-\infty}^{+\infty}f_{X,Y}(x,v)\mathrm{d}x\mathrm{d}v \\1.7 条件概率1.7.1 二维离散型随机变量的条件概率质量函数若 (X,Y) 是二维离散型随机变量,对于固定的 j,若 P(Y=y_j) > 0 ,则称:f_{X|Y}(x \
\ y)=P(X=x \
\ Y=y)=\frac{P(X=x, Y=y)}{P(Y=y)}=\frac{f_{X,Y}(x,y)}{f_Y(y)}, \quad (x,y) \in \{x_i,y_j\}, i,j=1, 2, 3, ··· 为 Y=y 条件下离散型随机变量 X 的条件概率质量函数(Conditional Probability Mass Function)。同样的,对于固定的 i,若 P(X=x_i) > 0,则称:f_{Y|X}(y \
\ x)=P(Y=y \
\ X=x)=\frac{P(X=x, Y=y)}{P(X=x)}=\frac{f_{X,Y}(x,y)}{f_X(x)}, \quad (x,y) \in \{x_i,y_j\}, i,j=1, 2, 3, ···为 X=x 条件下离散型随机变量 Y 的条件概率质量函数。简言之,对于二维离散型随机变量:条件概率质量函数=\frac{联合概率质量函数}{边缘概率质量函数} \\二维离散型随机变量条件概率质量函数的叠加得到了二维离散型随机变量的条件累积分布函数(Conditional Cumulative Distribution Function):F_{X|Y}(x \
\ y)=P(X\le x \
\ Y=y)=\sum_{u\le x}f_{X|Y}(u \
\ y)=\sum_{u\le x}\frac{f_{X,Y}(u,y)}{f_Y(y)} \\ F_{Y|X}(y \
\ x)=P(Y\le y \
\ X=x)=\sum_{v\le y}f_{Y|X}(v \
\ x)=\sum_{v\le y}\frac{f_{X,Y}(x,v)}{f_X(x)} \\1.7.2 二维连续型随机变量的条件概率密度函数假设二维连续型随机变量 (X,Y) 的联合概率密度函数为 f_{X,Y}(x,y),若对于固定的 Y=y,有边缘概率密度函数 f_Y(y) > 0,则称函数:f_{X|Y}(x\
\ y)=\frac{f_{X,Y}(x,y)}{f_Y(y)} \\为随机变量 X 在 Y=y 条件下的条件概率密度函数(Conditional Probability Density Function)。若对于固定的 X=x,有边缘概率密度函数 f_X(x) > 0,则称函数:f_{Y|X}(y\
\ x)=\frac{f_{X,Y}(x,y)}{f_X(x)} \\为随机变量 Y 在 X=x 条件下的条件概率密度函数。简言之,对于二维连续型随机变量:条件概率密度函数=\frac{联合概率密度函数}{边缘概密度函数} \\二维连续型随机变量条件概率密度函数的积分得到了二维连续型随机变量的条件累积分布函数:F_{X|Y}(x\
\ y)=P(X \le x \
\ Y=y)=\int_{-\infty}^{x}f_{X|Y}(u\
\ y)\mathrm{d}u=\int_{-\infty}^{x}\frac{f_{X,Y}(u,y)}{f_Y(y)}\mathrm{d}u \\ F_{Y|X}(y\
\ x)=P(Y \le y \
\ X=x)=\int_{-\infty}^{y}f_{Y|X}(v\
\ x)\mathrm{d}v=\int_{-\infty}^{y}\frac{f_{X,Y}(x,v)}{f_X(x)}\mathrm{d}v \\1.8 全概率1.8.1 二维离散型随机变量的全概率公式对于二维离散型随机变量 (X,Y),已知条件概率质量函数:f_{X|Y}(x \
\ y)=\frac{f_{X,Y}(x,y)}{f_Y(y)}, \quad (x,y) \in \{x_i,y_j\}, i,j=1, 2, 3, ··· \\ f_{Y|X}(y \
\ x)=\frac{f_{X,Y}(x,y)}{f_X(x)}, \quad (x,y) \in \{x_i,y_j\}, i,j=1, 2, 3, ··· \\容易得到二维离散型随机变量联合概率质量函数的等价形式:f_{X,Y}(x,y)=f_{X|Y}(x \
\ y)f_Y(y)=f_{Y|X}(y \
\ x)f_X(x) \\由边缘概率质量函数与联合概率质量函数间的数量关系,得到二维离散型随机变量的全概率公式:f_X(x)=\sum_{j=1}^{\infty}f_{X,Y}(x,y_j)=\sum_{j=1}^{\infty}f_{X|Y}(x \
\ y_j)f_Y(y_j) \\ f_Y(y)=\sum_{i=1}^{\infty}f_{X,Y}(x_i,y)=\sum_{i=1}^{\infty}f_{Y|X}(y \
\ x_i)f_X(x_i) \\1.8.2 二维连续型随机变量的全概率公式对于二维连续型随机变量 (X,Y),已知条件概率密度函数:f_{X|Y}(x\
\ y)=\frac{f_{X,Y}(x,y)}{f_Y(y)} \\ f_{Y|X}(y\
\ x)=\frac{f_{X,Y}(x,y)}{f_X(x)} \\容易得到二维连续型随机变量联合概率密度函数的等价形式:f_{X,Y}(x,y)=f_{X|Y}(x \
\ y)f_Y(y)=f_{Y|X}(y \
\ x)f_X(x) \\由边缘概率密度函数与联合概率密度函数间的数量关系,得到二维连续型随机变量的全概率公式:f_X(x)=\int_{-\infty}^{+\infty}f_{X|Y}(x \
\ y)f_Y(y)\mathrm{d}y \\ f_Y(y)=\int_{-\infty}^{+\infty}f_{Y|X}(y \
\ x)f_X(x)\mathrm{d}x \\1.9 随机过程随机过程(Stochastic Process)是定义在 \Omega \times T 上的二元函数 X(\omega, t),简单的定义为一组随机变量的集合,即指定一参数集 T (又称指标集,通常为时间集),其中:对于固定的时间 t,X(\omega, t) 为随机变量,简记为 X(t) 或 X_t;对于固定的 \omega(即固定每一时刻对应的随机变量的取值),X(\omega, t) 为时间 t 的一般函数,称为样本函数(Sample Function)或样本轨道(Sample Path),简记为 x(t)。随机过程也可定义为一组样本函数的集合。注意:随机变量 X(t) 或 X_t 并不是时间 t 的函数,它只表示所有样本函数 x(t) 在 t 时刻的取值。依据随机变量和参数集的连续离散情况,随机过程有以下四种类型:连续型随机过程:随机变量连续,参数连续;离散型随机过程:随机变量离散,参数连续;连续型随机序列:随机变量连续,参数离散;离散型随机序列:随机变量离散,参数离散。不同于确定过程,随机过程中的随机变量彼此间不独立。应该理解,贝叶斯滤波处理的是一个随机过程,而且往往是一个连续型随机过程。2 贝叶斯滤波2.1 贝叶斯公式2.1.1 二维离散型随机变量的贝叶斯公式对于二维离散型随机变量 (X, Y),由其条件概率质量函数与全概率公式,容易得到其贝叶斯公式:f_{X|Y}(x \
\ y)=\frac{f_{X,Y}(x,y)}{f_Y(y)}=\frac{f_{Y|X}(y \
\ x)f_X(x)}{\sum\limits_{i=1}^{\infty}f_{Y|X}(y \
\ x_i)f_X(x_i)}, \quad (x,y) \in \{x_i,y_j\}, i,j=1, 2, 3, ···二维离散型随机变量的贝叶斯公式可通过作图的方式轻松证得。2.1.2 二维连续型随机变量的贝叶斯公式(1) 结论对于二维连续型随机变量 (X, Y),由其条件概率密度函数与全概率公式,容易得到其贝叶斯公式:f_{X|Y}(x \
\ y)=\frac{f_{X,Y}(x,y)}{f_Y(y)}=\frac{f_{Y|X}(y \
\ x)f_X(x)}{\int_{-\infty}^{+\infty}f_{Y|X}(y \
\ x)f_X(x)\mathrm{d}x} \\(2) 推导二维连续型随机变量的贝叶斯公式无法通过作图的方式推得,下面进行公式推导,首先计算二维连续型随机变量的条件累积分布函数:\begin{aligned} F_{X|Y}(x\
\ y) & = P(X \le x \
\ Y=y) \\ & = \sum_{u=-\infty}^xP(X=u \
\ Y=y) \quad \Rightarrow \color{red}{化连续为离散无穷小的累加} \\ & = \sum_{u=-\infty}^x\frac{P(Y=y \
\ X=u)P(X=u)}{P(Y=y)} \quad \Rightarrow \color{red}{二维离散型随机变量的贝叶斯公式} \\ & = \lim_{\epsilon \to 0}\sum_{u=-\infty}^x\frac{P(y \le Y \le y+\epsilon \
\ X=u)P(u \le X \le u+\epsilon)}{P(y \le Y \le y+\epsilon)} \quad \Rightarrow \color{red}{化无穷小为极限形式} \\ & = \lim_{\epsilon \to 0}\sum_{u=-\infty}^x\frac{[F_{Y|X}(y+\epsilon \
\ u)-F_{Y|X}(y \
\ u)][F_X(u+\epsilon)-F_X(u)]}{F_Y(y+\epsilon)-F_Y(y)} \quad \Rightarrow \color{red}{分布函数性质} \\ & = \lim_{\epsilon \to 0}\sum_{u=-\infty}^x\frac{[f_{Y|X}(\xi_1 \
\ u)·\epsilon][f_X(\xi_2)·\epsilon]}{f_Y(\xi_3)·\epsilon} \quad \Rightarrow \color{red}{拉格朗日中值定理,\xi_1, \xi_3 \in (y, y+\epsilon),\xi_2 \in (u, u+\epsilon)} \\ & = \lim_{\epsilon \to 0}\sum_{u=-\infty}^x\frac{f_{Y|X}(y \
\ u)f_X(u)}{f_Y(y)}·\epsilon \quad \Rightarrow \color{red}{\epsilon \to 0 \ 时,\xi_1 \to y,\xi_2 \to u,\xi_3 \to y} \\ & = \int_{-\infty}^x\frac{f_{Y|X}(y \
\ u)f_X(u)}{f_Y(y)}\mathrm{d}u \quad \Rightarrow \color{red}{积分定义} \\ & = \int_{-\infty}^x\frac{f_{Y|X}(y \
\ x)f_X(x)}{f_Y(y)}\mathrm{d}x \quad \Rightarrow \color{red}{替换自变量符号u为x} \end{aligned} \\故,二维连续型随机变量的条件概率密度函数为:f_{X|Y}(x\
\ y)=\frac{\mathrm{d}F_{X|Y}(x\
\ y)}{\mathrm{d}x}=\frac{f_{Y|X}(y \
\ x)f_X(x)}{f_Y(y)} \\代入全概率公式:f_{X|Y}(x\
\ y)=\frac{f_{Y|X}(y \
\ x)f_X(x)}{\int_{-\infty}^{+\infty}f_{Y|X}(y \
\ x)f_X(x)\mathrm{d}x} \\上式即为二维连续型随机变量的贝叶斯公式,推导完毕。2.2 先验概率、似然概率与后验概率在二维连续型随机变量的贝叶斯公式中,有如下定义:f_X(x) 被称为先验概率密度(Prior Probability Density),表示根据以往的经验和分析,在本次试验或采样前便可获得的随机变量 X 的概率密度;f_{Y|X}(y \
\ x) 被称为似然概率密度(Likelihood Probability Density),表示在状态随机变量 X 取值为 x 的条件下,观测随机变量 Y 取值为 y 的概率密度,状态为因,观测为果,即由因推果;f_{X|Y}(x\
\ y) 被成为后验概率密度(Posterior Probability Density),表示在观测随机变量 Y 取值为 y 的条件下,状态随机变量 X 取值为 x 的概率密度,状态为因,观测为果,即由果推因。此外,当 y 为定值时,\eta=\left[\int_{-\infty}^{+\infty}f_{Y|X}(y \
\ x)f_X(x)\mathrm{d}x\right]^{-1} 为一常数,常被称为贝叶斯公式的归一化常数。因此,二维连续型随机变量的贝叶斯公式可表示为:后验概率密度=\eta \times 似然概率密度 \times 先验概率密度 \\2.3 再谈似然概率上文中提到,似然概率密度函数 f_{Y|X}(y \
\ x) 表示在状态随机变量 X 取值为 x 的条件下,观测随机变量 Y 取值为 y 的概率密度。似然概率密度函数表征了传感器检测精度,对于给定的状态条件 X=x,观测结果 Y=y 的概率分布通常有三种模型:(1) 等可能型观测值在状态量真值附近呈均匀分布,此时的似然概率密度函数为常数。(2) 阶梯型观测值在状态量真值附近呈阶梯分布,此时的似然概率密度函数为分段常数。(3) 正态分布型观测值在状态量真值附近呈高斯分布,此时的似然概率密度函数为高斯函数:f_{Y|X}(y \
\ x)=\frac{1}{\sigma \sqrt{2\pi}}e^{-\frac{(y-x)^2}{2\sigma ^2}} \\若假定似然概率密度函数为高斯函数,此时,似然概率密度函数的均值 x 代表状态量真值,\sigma 代表传感器检测精度范围。若同时假定先验概率密度函数为高斯函数,即:f_X(x) \sim \mathcal{N}(\mu_1, \ \sigma_1^2), \quad f_{Y|X}(y \
\ x) \sim \mathcal{N}(\mu_2, \ \sigma_2^2) \\则f_{X|Y}(x \
\ y) \sim \mathcal{N}(\frac{\sigma_2^2}{\sigma_1^2 + \sigma_2^2}\mu_1+\frac{\sigma_1^2}{\sigma_1^2 + \sigma_2^2}\mu_2, \ \frac{\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2}) \\由于\frac{\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2}=\frac{\sigma_1^2}{1+\frac{\sigma_1^2}{\sigma_2^2}} < \sigma_1^2 \\且\frac{\sigma_1^2\sigma_2^2}{\sigma_1^2+\sigma_2^2}=\frac{\sigma_2^2}{1+\frac{\sigma_2^2}{\sigma_1^2}} < \sigma_2^2 \\故,后验概率密度函数方差既小于先验概率密度函数方差,也小于似然概率密度函数方差,系统不确定度降低。若 \sigma_1^2 \gg \sigma_2^2,则近似有:f_{X|Y}(x \
\ y) \sim \mathcal{N}(\mu_2, \ \sigma_2^2) \\此时,后验倾向于观测。若 \sigma_1^2 \ll \sigma_2^2,则近似有:f_{X|Y}(x \
\ y) \sim \mathcal{N}(\mu_1, \ \sigma_1^2) \\此时,后验倾向于先验。2.4 贝叶斯滤波推导2.4.1 问题建模(1) 问题描述对于某状态量随机变量 X,从初始时刻 0 开始,对其进行观测,得到 0 ~ k 时刻的观测值:y_0, y_1, y_2, \cdots , y_k \\求解 k 时刻状态量随机变量 X_k 的最优估计 \hat{x}_k。(2) 求解思路以贝叶斯公式为求解方向,将问题转化为求解状态量随机变量 X_k 后验概率密度函数的期望:\hat{x}_k=E[f_{X_k}^+(x)] \\进而需要求解状态量随机变量 X_k 的先验概率密度函数与似然概率密度函数。我们认为,k 时刻的状态量随机变量 X_k 与且仅与上一时刻的状态量随机变量 X_{k-1} 有关,k 时刻的观测量随机变量 Y_k 与且仅与 k 时刻的状态量随机变量 X_k 有关,其中的数量关系我们分别称之为状态方程与观测方程:\begin{cases} X_k=f(X_{k-1})+Q_k \quad \Rightarrow \color{red}{状态方程} \\ Y_k=h(X_k)+R_k \quad \Rightarrow \color{red}{观测方程} \end{cases} \\f(x) 被称为状态转移函数,h(x) 被称为观测函数。对于 0 时刻的初始状态量随机变量 X_0,认为观测值 y_0 即为其真值,其后验概率密度函数即为其先验概率密度函数。我们可以根据经验知识(建模精度和传感器精度)写出 0 时刻的初始状态量随机变量 X_0 的后验概率密度函数 f_{X_0}^+(x)、k 时刻过程噪声随机变量 Q_k 的概率密度函数 f_{Q_k}(x) 和 k 时刻观测噪声随机变量 R_k 的概率密度函数 f_{R_k}(x)。(3) 符号定义各时刻的状态量随机变量X_0, X_1, X_2, \cdots , X_k \\各时刻的观测量随机变量Y_0, Y_1, Y_2, \cdots , Y_k \\各时刻的观测值y_0, y_1, y_2, \cdots , y_k \\各时刻的过程噪声随机变量Q_1, Q_2, \cdots , Q_k \\各时刻的观测噪声随机变量R_1, R_2, \cdots , R_k \\各时刻的过程噪声随机变量概率密度函数f_{Q_1}(x), f_{Q_2}(x), \cdots , f_{Q_k}(x) \\各时刻的观测噪声随机变量概率密度函数f_{R_1}(x), f_{R_2}(x), \cdots , f_{R_k}(x) \\各时刻的状态量随机变量先验概率密度函数f_{X_0}^-(x), f_{X_1}^-(x), f_{X_2}^-(x), \cdots , f_{X_k}^-(x) \\各时刻的状态量随机变量后验概率密度函数f_{X_0}^+(x), f_{X_1}^+(x), f_{X_2}^+(x), \cdots , f_{X_k}^+(x) \\各时刻状态量随机变量与观测量随机变量的似然概率密度函数f_{Y_1|X_1}(y_1 \
\ x), f_{Y_2|X_2}(y_2 \
\ x), \cdots , f_{Y_k|X_k}(y_k \
\ x) \\(4) 重要假设X_0 分别与 Q_1, Q_2, \cdots , Q_k 相互独立;X_0 分别与 R_1, R_2, \cdots , R_k 相互独立;X_{k-1} 与 Q_k 相互独立;X_{k} 与 R_k 相互独立。(5) 重要定理\star 条件概率里的条件可以作逻辑推导。例如:P(X=1 \
\ Y=2,Z=3)=P(X+Y=3 \
\ Y=2,Z=3)=P(X+Y=3 \
\ Y=2,Z-Y=1)2.4.2 预测步推导已知 0 时刻状态量随机变量 X_0 的后验概率密度函数 f_{X_0}^+(x),状态转移函数 f(x),1 时刻过程噪声随机变量 Q_1 的概率密度函数 f_{Q_1}(x),求解 1 时刻状态量随机变量 X_1 的先验概率密度函数 f_{X_1}^-(x)。类似二维连续型随机变量贝叶斯公式的推导过程,我们从求解 X_1 的先验累积分布函数 F_{X_1}^- 入手。\begin{aligned} F_{X_1}^-(x) & = P(X_1 \le x) \\ & = \sum_{u=-\infty}^xP(X_1=u) \quad \Rightarrow \color{red}{化连续为离散无穷小的累加} \\ & = \sum_{u=-\infty}^x\sum_{v=-\infty}^{+\infty}P(X_1=u \
\ X_0=v)P(X_0=v) \quad \Rightarrow \color{red}{全概率公式} \\ & = \sum_{u=-\infty}^x\sum_{v=-\infty}^{+\infty}P[X_1-f(X_0)=u-f(v) \
\ X_0=v]P(X_0=v) \quad \Rightarrow \color{red}{条件概率里的条件可以作逻辑推导} \\ & = \sum_{u=-\infty}^x\sum_{v=-\infty}^{+\infty}P[Q_1=u-f(v) \
\ X_0=v]P(X_0=v) \quad \Rightarrow \color{red}{状态方程} \\ & = \sum_{u=-\infty}^x\sum_{v=-\infty}^{+\infty}P[Q_1=u-f(v)]P(X_0=v) \quad \Rightarrow \color{red}{X_{k-1}与Q_k相互独立} \\ & = \sum_{u=-\infty}^x\left\{\lim_{\epsilon \to 0}\sum_{v=-\infty}^{+\infty}f_{Q_1}[u-f(v)]·\epsilon · f_{X_0}^+(v)·\epsilon \right\} \quad \Rightarrow \color{red}{类似二维连续型随机变量贝叶斯公式的推导过程,将点概率化为概率密度与无穷小的乘积} \\ & = \sum_{u=-\infty}^x\left\{\lim_{\epsilon \to 0}\int_{-\infty}^{+\infty}f_{Q_1}[u-f(v)]f_{X_0}^+(v)\mathrm{d}v·\epsilon \right\} \quad \Rightarrow \color{red}{积分定义} \\ & = \int_{-\infty}^x \int_{-\infty}^{+\infty}f_{Q_1}[u-f(v)]f_{X_0}^+(v)\mathrm{d}v\mathrm{d}u \quad \Rightarrow \color{red}{积分定义} \\ & = \int_{-\infty}^x \int_{-\infty}^{+\infty}f_{Q_1}[x-f(v)]f_{X_0}^+(v)\mathrm{d}v\mathrm{d}x \quad \Rightarrow \color{red}{替换自变量符号u为x} \end{aligned} \\故,1 时刻状态量随机变量 X_1 的先验概率密度函数为:f_{X_1}^-(x)=\frac{\mathrm{d}F_{X_1}^-(x)}{\mathrm{d}x}=\int_{-\infty}^{+\infty}f_{Q_1}[x-f(v)]f_{X_0}^+(v)\mathrm{d}v \\推导完毕。可以发现,先验概率密度函数本质来源于状态方程。2.4.3 更新步推导已知 1 时刻观测量随机变量 Y_1 的取值 y_1,求解 1 时刻状态量随机变量与观测量随机变量的似然概率密度函数 f_{Y_1|X_1}(y_1 \
\ x),并联合预测步得到的 1 时刻状态量随机变量 X_1 的先验概率密度函数 f_{X_1}^-(x),求解 1 时刻状态量随机变量 X_1 的后验概率密度函数 f_{X_1}^+(x)。首先,求解似然概率密度函数 f_{Y_1|X_1}(y_1 \
\ x):\begin{aligned} f_{Y_1|X_1}(y_1 \
\ x) & =\lim_{\epsilon \to 0}\frac{F_{Y_1
X_1}(y_1+\epsilon \
\ x)-F_{Y_1
X_1}(y_1 \
\ x)}{\epsilon} \quad \Rightarrow \color{red}{导数的定义} \\ & =\lim_{\epsilon \to 0}\frac{P(y_1 \le Y_1 \le y_1 + \epsilon \
\ X_1=x)}{\epsilon} \quad \Rightarrow \color{red}{累积分布函数的性质} \\ & =\lim_{\epsilon \to 0}\frac{P[y_1-h(x) \le Y_1-h(X_1) \le y_1 - h(x) + \epsilon \
\ X_1=x]}{\epsilon} \quad \Rightarrow \color{red}{条件概率里的条件可以作逻辑推导} \\ & =\lim_{\epsilon \to 0}\frac{P[y_1-h(x) \le R_1 \le y_1 - h(x) + \epsilon \
\ X_1=x]}{\epsilon} \quad \Rightarrow \color{red}{观测方程} \\ & =\lim_{\epsilon \to 0}\frac{P[y_1-h(x) \le R_1 \le y_1 - h(x) + \epsilon]}{\epsilon} \quad \Rightarrow \color{red}{X_{k}与R_k相互独立} \\ & =\lim_{\epsilon \to 0}\frac{F_{R_1}[y_1 - h(x) + \epsilon]-F_{R_1}[y_1 - h(x)]}{\epsilon} \quad \Rightarrow \color{red}{累积分布函数的性质} \\ & =f_{R_1}[y_1-h(x)] \quad \Rightarrow \color{red}{导数的定义} \end{aligned} \\可以发现,似然概率密度函数本质来源于观测方程。然后,联合预测步得到的 1 时刻状态量随机变量 X_1 的先验概率密度函数 f_{X_1}^-(x),求解 1 时刻状态量随机变量 X_1 的后验概率密度函数 f_{X_1}^+(x):f_{X_1}^+(x)=\eta_1·f_{Y_1|X_1}(y_1 \
\ x)·f_{X_1}^-(x)=\eta_1·f_{R_1}[y_1-h(x)]·f_{X_1}^-(x) \\其中,归一化常数 \eta_1为:\eta_1=\left[\int_{-\infty}^{+\infty}f_{Y_1|X_1}(y_1 \
\ x)f_{X_1}^-(x)\mathrm{d}x\right]^{-1}=\left\{\int_{-\infty}^{+\infty}f_{R_1}[y_1-h(x)]f_{X_1}^-(x)\mathrm{d}x\right\}^{-1}推导完毕。2.4.4 递推流程由预测步和更新步的推导结果,可得到由 0 时刻状态量随机变量 X_0 的后验概率密度函数 f_{X_0}^+(x) 到 k 时刻状态量随机变量 X_k 的后验概率密度函数 f_{X_k}^+(x) 的递推流程:\begin{aligned} f_{X_0}^+(x) & \stackrel{预测}{\Longrightarrow} f_{X_1}^-(x)=\int_{-\infty}^{+\infty}f_{Q_1}[x-f(v)]f_{X_0}^+(v)\mathrm{d}v \stackrel{观测更新}{\Longrightarrow} f_{X_1}^+(x)=\eta_1·f_{R_1}[y_1-h(x)]·f_{X_1}^-(x) \\ & \stackrel{预测}{\Longrightarrow} f_{X_2}^-(x)=\int_{-\infty}^{+\infty}f_{Q_2}[x-f(v)]f_{X_1}^+(v)\mathrm{d}v \stackrel{观测更新}{\Longrightarrow} f_{X_2}^+(x)=\eta_2·f_{R_2}[y_2-h(x)]·f_{X_2}^-(x) \\ & \cdots \\ & \stackrel{预测}{\Longrightarrow} f_{X_k}^-(x)=\int_{-\infty}^{+\infty}f_{Q_k}[x-f(v)]f_{X_{k-1}}^+(v)\mathrm{d}v \stackrel{观测更新}{\Longrightarrow} f_{X_k}^+(x)=\eta_k·f_{R_k}[y_k-h(x)]·f_{X_k}^-(x) \end{aligned}其中,归一化常数 \eta_k 为:\eta_k=\left\{\int_{-\infty}^{+\infty}f_{R_k}[y_k-h(x)]f_{X_k}^-(x)\mathrm{d}x\right\}^{-1} \\最终,可得到 k 时刻状态量随机变量 X_k 的最优估计 \hat{x}_k:\hat{x}_k=E[f_{X_k}^+(x)]=\int_{-\infty}^{+\infty}xf_{X_k}^+(x)\mathrm{d}x \\2.4.5 完整算法框架(1) 设初值初始 0 时刻状态量随机变量 X_0 的后验概率密度函数:f_{X_0}^+(x) \\(2) 预测步k 时刻状态量随机变量 X_k 的先验概率密度函数:f_{X_k}^-(x)=\int_{-\infty}^{+\infty}f_{Q_k}[x-f(v)]f_{X_{k-1}}^+(v)\mathrm{d}v \\(3) 更新步k 时刻状态量随机变量 X_k 的后验概率密度函数:f_{X_k}^+(x)=\eta_k·f_{R_k}[y_k-h(x)]·f_{X_k}^-(x) \\归一化常数 \eta_k:\eta_k=\left\{\int_{-\infty}^{+\infty}f_{R_k}[y_k-h(x)]f_{X_k}^-(x)\mathrm{d}x\right\}^{-1} \\(4) 求解状态量后验估计k 时刻状态量随机变量 X_k 的后验估计:\hat{x}_k^+=E[f_{X_k}^+(x)]=\int_{-\infty}^{+\infty}xf_{X_k}^+(x)\mathrm{d}x \\2.5 贝叶斯滤波的缺点及解决方法2.5.1 缺点从上文的推导及结论中可以发现,求解预测步中的先验概率密度函数 f_{X_k}^-(x)、更新步中的归一化常数 \eta_k、最终的最优估计 \hat{x}_k 时均涉及到无穷积分,而大多数情况无法得到解析解,使得贝叶斯滤波算法的直接应用十分困难。2.5.2 解决办法为了解决贝叶斯滤波中的无穷积分问题,通常从两个角度出发:(1) 作理想假设假设状态转移函数 f(x) 和观测函数 h(x) 均为线性函数,过程噪声随机变量 Q_k 和 观测噪声随机变量 R_k 均服从均值为 0 的正态分布——卡尔曼滤波(Kalman Filter)假设状态转移函数 f(x) 和(或)观测函数 h(x) 为非线性函数,过程噪声随机变量 Q_k 和 观测噪声随机变量 R_k 均服从均值为 0 的正态分布——扩展卡尔曼滤波(Extended Kalman Filter)和无迹卡尔曼滤波(Unscented Kalman Filter)(2) 化连续为离散将无穷积分转化为数值积分,一般有以下方法:高斯积分(不常用)蒙特卡罗积分(粒子滤波,Particle Filter)直方图滤波针对本节内容中提到的卡尔曼滤波、扩展卡尔曼滤波、无迹卡尔曼滤波、粒子滤波、直方图滤波等常用滤波算法,将在后续文章中进行详细展开讨论。3 参考马同学数学课程百度百科 - 分布函数百度百科 - 随机过程如何从深刻地理解随机过程的含义?b站忠实的王大头《贝叶斯滤波与卡尔曼滤波》系列教学视频你真的搞懂贝叶斯滤波了吗?如果觉得文章对你有所帮助的话,欢迎点赞/评论/收藏/关注,相互交流,共同进步~}
问题太大,简答为一种概率方法!一种用于推断未知参数的概率方法,核心思想是将先验知识与新的数据结合,得到更新后的知识。将参数视为随机变量,则先验概率是指在考虑任何新数据之前,对参数的信念。观察到新数据时,可使用贝叶斯理论更新我们对这些参数的信念。先验概率可以理解为在考虑新的数据之前,对参数的信念。后验概率是指在考虑了新的数据之后,对参数的信念更新后的概率。在贝叶斯推断中,通过将先验概率与似然函数相乘,并进行归一化,来计算后验概率。这个过程可以用贝叶斯公式来表示:$$P(\theta|D) = \frac{P(D|\theta) \cdot P(\theta)}{P(D)}$$其中,$P(\theta|D)$是后验概率,$P(D|\theta)$是似然函数,$P(\theta)$是先验概率,$P(D)$是归一化常数或边缘概率。实例:使用贝叶斯推断来计算一个参数的后验概率。假设有一个硬币,不确定它是正面朝上的概率是多少,先验概率为均匀分布,即正面和反面的概率都是0.5。现在抛硬币10次,其中有7次是正面朝上的。可使用贝叶斯推断来计算对硬币正面朝上的概率的新估计值。首先,需要定义参数,可以将这个参数定义为硬币正面朝上的概率,记为$\theta$。接下来,定义先验概率,可以假设一个均匀分布,即$P(\theta) = 1$,对于所有的$\theta \in [0,1]$。然后,定义似然函数,即已知观察到7个正面和3个反面的数据,使用二项分布来建模:$$ P(D|\theta) = \binom{n}{k} \cdot \theta^k \cdot (1-\theta)^{n-k}$$其中,$n$是观察到的总次数,$k$是正面朝上的次数。现在,将先验概率和似然函数相乘,得到后验概率的未归一化形式:$$P(\theta|D) \propto P(D|\theta) \cdot P(\theta) = \binom{10}{7} \cdot \theta^7 \cdot (1-\theta)^3$$将这个概率分布归一化,得到后验概率的标准形式:$$P(\theta|D) = \frac{\binom{10}{7} \cdot \theta^7 \cdot (1-\theta)^3}{\int_0^1 \binom{10}{7} \cdot \theta^7 \cdot (1-\theta)^3 d\theta}$$计算这个积分,得到归一化常数为$P(D) = \frac{792}{1023}$。因此,后验概率为:$$ P(\theta|D) = \frac{\binom{10}{7} \cdot \theta^7 \cdot (1-\theta)^3}{792/1023} $$使用这个后验概率来估计硬币正面朝上的概率。如上例子中,得到的后验分布的峰值是在$\theta=0.7$处,这意味着对硬币正面朝上的概率的新估计值为0.7。}

我要回帖

更多关于 贝叶斯公式典型例题 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信