随机过程随机过
信号与系统:研究确定信号随着时间、空间的变化
概率论:研究随机信号,但是不随时间、空间变化
随机过程:研究随机的信号随着时间、空间的变化
期末70分梭哈
考试题目不随机,就跟不上这门课的要求。
概率与随机变量回顾
样本空间$\Omega$
性质:
- 非负性:$P(A) \ge 0$
- 规范性:$P(\Omega), P(\emptyset) = 0$
- 可加性:$P(\bigcup\limits_{k = 1}^{\infty}A_k) = \sum\limits_{k=1}^{\infty}P(A_k)$
贝叶斯:
随机变量:
分布函数,概率密度函数
期望,方差,协方差,相关系数
伯努利分布,高斯分布,泊松分布,瑞利分布
伯努利分布的概率密度函数:
当$k=1$时,$P(X=1) = p$
当$k=0$时,$P(X=0) = 1-p$
高斯分布的概率密度函数:
$P(x) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)$
二维高斯分布的概率密度函数:
$P(x,y) = \frac{1}{2\pi\sigma_x\sigma_y\sqrt{1-\rho^2}}\exp\left(-\frac{1}{2(1-\rho^2)}\left[\frac{(x-\mu_x)^2}{\sigma_x^2}-2\rho\frac{(x-\mu_x)(y-\mu_y)}{\sigma_x\sigma_y}+\frac{(y-\mu_y)^2}{\sigma_y^2}\right]\right)$
其中,$\mu_x$和$\mu_y$是均值,$\sigma_x$和$\sigma_y$是标准差,$\rho$是相关系数。
泊松分布的概率密度函数:
$P(k;\lambda) = \frac{\lambda^k}{k!}\exp(-\lambda)$
瑞利分布的概率密度函数:
$P(x;\sigma) = \frac{x}{\sigma^2}\exp\left(-\frac{x^2}{2\sigma^2}\right)$
随机过程的基本概念
定义:
给定概率空间$(\Omega, \mathcal{F}, P)$,定义参数集$T \subset R$,$t \in T$
简记为$X(t)$: $X = \lbrace X(t), t \in T\rbrace$
解释:
- 二元单值函数
- 对每个固定t,$X(t, \omega)$是一个随机变量
- 每个$\omega_0 \in \Omega$, $X(t, \omega_0)$是定义在T上的函数,记为$x(t, \omega_0)$
单样本为随机变量:均值、方差、协方差、有限维联合分布等
随机过程的函数特性:时间的相关性,连续性和离散性,随机过程的导数、微分、积分、卷积、级数展开、微分方程、积分方程等
二重性的联合特征:
分类:
离散时间,离散分布:Bernouli过程
离散时间,连续分布:自回归过程
连续参数离散随机过程:Poission过程
连续参数连续型随机过程:Brown运动
数学特征:
相互独立和不相关是两个概念,无必然因果联系。
根据数字特征分类:
- 独立增量过程
- 平稳过程及二阶矩过程
- 马尔可夫过程
- 更新过程
独立增量过程是一种随机过程,具有以下特性:
零起点:独立增量过程在零时刻(通常表示为$t=0$)的取值为零,即$X(0) = 0$。
独立增量:对于任意时刻$t_1 < t_2 < \cdots < t_n$,随机变量$X(t_2)-X(t_1), X(t_3)-X(t_2), \cdots, X(t_n)-X(t_{n-1})$是相互独立的。
若对一切$0\le s \lt t$,增量$X(t) - X(s)$的分布仅依赖于$t - s$,则称之为平稳增量,具有平稳增量的独立增量过程称为独立平稳增量过程,例如泊松和布朗。
二阶矩过程:$D(X(t))$
宽平稳过程:
宽平稳过程可以用以下简单的数学表达式表示:
均值平稳性:对于宽平稳过程 $X(t)$,其均值满足 $E[X(t)] = \mu$,其中 $\mu$ 是一个常数。
自相关平稳性:宽平稳过程的自相关函数在时间差 $\tau$ 下为常数,可以表示为 $R_X(\tau) = R_X(t,t+\tau) = \text{常数}$,其中 $R_X(\tau)$ 表示宽平稳过程的自相关函数。
严平稳过程(Strict-sense stationary process),也称为严格平稳过程或强平稳过程,是一种具有更强平稳性质的随机过程。它满足以下两个条件:
时移不变性:严平稳过程的统计性质在时间上任意平移保持不变。具体而言,对于任意时间差 $\tau$ 和任意时间点 $t$,随机变量 $X(t)$ 和 $X(t+\tau)$ 的联合分布相同,即联合分布满足 $P(X(t) \in A, X(t+\tau) \in B) = P(X(0) \in A, X(\tau) \in B)$,其中 $A,B$ 是任意集合。
自相关平稳性:严平稳过程的自相关函数只与时间差有关,与参考时刻无关。具体而言,对于任意时间差 $\tau$ 和任意时间点 $t$,自相关函数满足 $R_X(t,t+\tau) = R_X(\tau)$,其中 $R_X(\tau)$ 表示严平稳过程的自相关函数。
马尔可夫过程是一种具有马尔可夫性质的随机过程。它可以用以下公式和概念来定义:
状态空间:马尔可夫过程的状态空间是一个离散集合,表示可能的状态集合。通常用符号 $S$ 表示,$S = \lbraces_1, s_2, \ldots\rbrace$。
马尔可夫性质:马尔可夫过程具有马尔可夫性质,也称为无后效性。即,在给定当前时刻的状态 $X(t)$ 之下,未来的状态 $X(t+\Delta t)$ 只依赖于当前的状态 $X(t)$,与过去的状态 $X(t-1), X(t-2), \ldots$ 无关。
转移概率:转移概率描述了在给定当前状态 $s_i$ 的情况下,马尔可夫过程在下一个时刻转移到状态 $s_j$ 的概率。转移概率通常用符号 $P_{ij}$ 表示,即 $P_{ij} = P(X(t+\Delta t) = s_j \mid X(t) = s_i)$。
通过状态空间和转移概率,可以构建一个马尔可夫过程的状态转移矩阵(Transition Matrix),它描述了从一个状态到另一个状态的转移概率情况。
更新过程:
更新过程可以使用以下公式来描述:
到达时间:假设到达时间的随机变量序列为 $T_1, T_2, T_3, \ldots$,其中 $T_i$ 表示事件 $i$ 的到达时间。
描述参数:更新过程的到达率(或强度)表示单位时间内平均发生事件的次数。通常用符号 $\lambda$ 表示,即 $\lambda = \lim_{t \to \infty} \frac{N(t)}{t}$,其中 $N(t)$ 表示时间 $t$ 之前(包括 $t$)发生的事件次数。
插值函数:更新过程的插值函数(或插值过程)表示给定时间 $t$ 时,最近的到达时间是多久之前。记为 $S(t)$,即 $S(t) = \sup{T_i \leq t}$,表示最近的到达时间小于等于 $t$ 的时间点。
可以定义复随机过程:
复随机过程是一组复数值随机变量的集合 ${X(t), t \in T}$,其中 $X(t)$ 是定义在概率空间 $(\Omega, \mathcal{F}, P)$ 上的复数值随机变量,表示在时间点 $t$ 上的取值。
具体而言,对于每个时间点 $t \in T$,$X(t)$ 是一个复数值随机变量,可以表示为 $X(t) = R(t) + iI(t)$,其中 $R(t)$ 和 $I(t)$ 分别表示实部和虚部。
复随机过程可以通过概率空间 $(\Omega, \mathcal{F}, P)$ 上的复数随机变量以及时间参数 $T$ 来描述,并且在不同时间点上表现出复数值随机变量的随机性质。
数学特征:
均值函数(一阶原点矩):$\mu_X(t) = E[X(t)]$
方差函数:$\text{Var}[X(t)] = E[(X(t) - \mu_X(t))(X(t) - \overline{\mu_X(t)} )]$
自相关函数:$R_X(t_1, t_2) = E[(X(t_1) - \mu_X(t_1))(X(t_2) - \overline{\mu_X(t_2)} )]$
自协方差函数:$\text{Cov}[X(t_1), X(t_2)] = E[(X(t_1) - \mu_X(t_1))(X(t_2) - \overline{\mu_X(t_2)} )]$
均方值函数:$E[|X(t)|^2] = \int_{-\infty}^{\infty} |x|^2 f_X(x,t)dx$
基本研究方法
- 相关方法
- Markov 方法
相关
若随机过程在任意时刻的均值和方差都存在,则称之为二阶矩过程(second order process),即均方可积空间上的随机变量。
均方可积空间是内积空间。相关运算是均方可积的内积运算:
宽平稳(wide-sense stationary):
功率谱密度:
最优线性估计
Markov
有限维联合分布可以由各阶的条件分布表示出来:
无后效性的 markov 过程:
从而所有高阶依赖关系都可以简化为二阶依赖:
相关理论与二阶矩过程——时域分析
自相关函数
由二阶矩过程的定义可知,均方可积空间的自相关函数、自协方差函数、互相关函数、互协方差函数均存在。
均值函数(一阶原点矩):$\mu_X(t) = E[X(t)]$
方差函数:$\text{Var}[X(t)] = E[(X(t) - \mu_X(t))^2]$
自相关函数:$R_X(t_1, t_2) = E[(X(t_1))(X^*(t_2))]$
自协方差函数:$C_X(t_1, t_2) = \text{Cov}[X(t_1), X(t_2)] = E[(X(t_1) - \mu_X(t_1))(X(t_2) - \mu_X(t_2))^*]$
均方值函数:$E[X^2(t)] = \int_{-\infty}^{\infty} x^2 f_X(x,t)dx$
互相关函数和互协方差函数:
- 如果$E[X(s)Y(t)]存在$,记为$R_{XY}(s, t)$
- 如果$\text{cov}(X(s), Y(t))存在$,记为$C_{XY}(s, t)$
不相关:
自相关函数具有共轭对称性:
离散化的自相关矩阵同样是共轭对称的:
自相关矩阵是非负定的:
当 $P(\lambda X = 0) = 1$ 时等号成立。
非负定性是自相关函数的一种特征性质。如果一个二元函数满足非负定性质,则一定可以构造出一个随机过程,使得其自相关函数为给定的二元函数。
自相关矩阵非负定,分解的特征值均非负。其物理意义是信号的能量或者功率。
自相关函数对加法和乘法的封闭性:
仍然是某一随机过程的自相关函数。
证明:取 $Z(t) = \alpha^{1/2} X(t) + \beta^{1/2} Y(t)$。这里 $X(t), Y(t)$是独立的。
也是自相关函数。取 $Z(t) = X(t)Y(t)$。
宽平稳随机过程
宽平稳
对于随机过程 $X(t), t \in T$,若 $\forall t, s\in T$
称随机过程 $X(t)$ 具有宽平稳性。
宽平稳过程的均值是常数,自相关函数与相对时间差有关。故宽平稳过程的自相关函数可以写成一元函数:$R_X(\tau), \tau = t - s$。
严平稳
对于随机过程 $X(t), t \in T$,若 $\forall n, \forall t_1, t_2, \dots, t_n \in T$,$\forall D \in T$,都有
则称随机过程 $X(t), t\in T$具有严平稳性。
在二阶矩存在的条件下,严平稳蕴含宽平稳,而反过来,宽平稳一般无法得到严平稳。
高斯过程的严平稳与宽平稳等价。
联合宽平稳
宽平稳过程的性质
设 $R_X(\tau)$ 为宽平稳过程的自相关函数, $m_X$ 为该过程的均值。
正交增量过程
正交增量过程
对于二阶矩过程 $X(t), t \in \R$,若 $\forall t_1 \lt t_2 \le t_3 \lt t_4$,$t_1, t_2, t_3, t_4 \in \R$,满足
则称 $X(t), t \in \R$ 为正交增量过程。
独立增量过程
对于二阶矩过程 $X(t), t \in \R$,若 $\forall t_1 \lt t_2 \le t_3 \lt t_4$,$t_1, t_2, t_3, t_4 \in \R$,$X(t_4) - X(t_3)$ 和 $X(t_2) - X(t_1)$ 统计独立,则称为独立增量过程。
均值为0的独立增量过程是正交增量过程。
平稳增量过程
对于随机过程 $X(t), t \in \R$,若 $X(t) - X(s)$ 的分布仅仅依赖于 $t - s$,则称为平稳增量过程。
定理:
随机过程 $X(t), t \in [0, \infty]$,满足 $X(0) = 0$,则其为正交增量过程的充要条件为
其中,$F(\cdot)$是单调不减的函数。
随机过程的极限、连续、导数、积分
均方极限
唯一性:若 $X_n \xrightarrow{m.s} X, X_n \xrightarrow{m.s}Y$,则 $E(|X - Y|^2) = 0$.
可加性:
数字特征相同:
如何判定 ${X_n}$ 是否收敛?
Cauchy 准则
洛伊夫准则:
均方连续
二阶矩过程,$t \rightarrow t_0, X(t) \xrightarrow{m.s.} X(t_0)$,则称 $X(t)$ 在 $t_0$ 处连续
定理
以下命题等价:
- $R(t, s)$ 在 $(t_0, t_0)$ 上连续,$\forall t_0 \in T$
- $X(t)$ 在 $T$ 上均方连续
- $R(t, s)$ 在 $T \times T$ 上连续
推论
对于宽平稳过程 $X(t)$,$R(\tau)$ 为自相关函数,以下命题等价:
- $R(\tau)$ 在 $\tau = 0$ 处连续;
- $X(t)$ 在 $T$ 上均方连续;
- $R(\tau)$ 在 T 上连续。
均方导数
若 $\frac{X(t_0 + h) - X(t_0)}{h}\xrightarrow{m.s.}Y(t_0), \forall t_0 \in T, h \rightarrow 0$,则称$\lbrace X(t) \rbrace$ 在均方意义下的导数为 $Y(t)$。
如何判断 $X(t)$ 是否均方可导?
Cauchy 准则
洛伊夫准则
均方导数判定定理
均方导数的性质:
$f(t)$ 为线性函数
- $E(X^\prime(t)) = \frac{\mathrm d }{\mathrm dt} E(X(t))$
- $E(X^\prime(t)\overline{X(s)}) =\frac{\partial }{\partial t}R_x(t, s)$
- $E(X(t)\overline{X^\prime(s)}) =\frac{\partial }{\partial s}R_x(t, s)$
- $E(X^\prime(t)\overline{X^\prime(s)}) =\frac{\partial^2 }{\partial t\partial s}R_x(t, s)$
均方积分
若黎曼和 $\sum\limits_{k=1}^{n}X(v_k)h(v_k)(t_k - t_{k - 1})$ 在 $n \rightarrow \infty, \max\lbrace t_k - t_{k - 1}\rbrace \rightarrow 0$ 时均方收敛,其中 $h(t)$ 为确定的可积函数,则称$\lbrace X(t)\rbrace$ 为均方可积,记为 $\int_{a}^{b}X(t)h(t)\mathrm dt$。
判定定理
均方积分的性质:
- $E\left( \int_{a}^{b}X(t)h(t)\mathrm dt\right) = \int_{a}^{b}E(X(t))h(t)\mathrm dt$
- $E\left( \left(\int_{a}^{b}X(t)h(t)\mathrm dt\right)\left(\int_{a}^{b}X(s)h(s)\mathrm ds\right)^*\right) = \int_{a}^{b}E(X(t))h(t)\mathrm dt$
- 三角不等式:$\sqrt{ E \left(|\int_{a}^{b}X(t)h(t)\mathrm dt|^2\right) } \le \int_{a}^{b}\sqrt{E\left(|X(t) - h(t)|^2\right)}\mathrm dt$
- 均方积分与均方导数:$X(t)$ 在 $[a, b]$ 上均方连续,$Y(t) = \int_{a}^{t}X(s)\mathrm ds$,其中等号代表均方相等,则 $\lbrace Y(t)\rbrace$ 在 $[a, b]$ 可导,并称在均方意义下 $\lbrace Y(t) \rbrace$ 的导数为 $\lbrace X(t) \rbrace$
随机过程的遍历性
统计平均:对样本空间取平均
时间平均:
统计平均和时间平均的关系?
时间平均更容易获得。如果我们可以通过时间平均来获得统计平均?
遍历性
定义-宽平稳过程均值遍历:
a.s. = with probability 1
左边是随机变量,右边是一个确定的数。这样的相等,意味着左边的随机变量的均值确定,方差为0.
定义:宽平稳过程自相关遍历
a.s. = with probability 1
定理:
宽平稳过程 $X(t)$ 满足均值遍历 $\lrArr$
定理:
宽平稳过程具有均值遍历性的充要条件是:
时间比较长的时候相关性消失了,也就是说过了一段时间同一轨道的样本就独立了,等价于多个轨道的样本,时间平均和统计平均就相等了。
2个推论:
- 若实数宽平稳过程的协方差函数满足 $\int_{0}^{+\infty}C_x(\tau)\mathrm d\tau\lt +\infty$,则该过程具有均值遍历性
- 若实数宽平稳过程的协方差函数满足 $C_x(\tau) \rightarrow 0, \tau \rightarrow +\infty$,则该过程具有均值遍历性
随机过程的线性展开
卡胡曼-洛伊夫展开
在平方可积空间上
定义范数
定义内积,正交
在 $L^2[a, b]$ 中一定有一组标准正交基函数 $\phi_1(t), \phi_2(t), \phi_3(t)\dots$ 满足
- $f$ 可以用有限个基函数线性加和来逼近
- $\langle f, \phi_n \rangle$ 表示 $f$ 在 $\phi_n$ 基上的坐标。
周期性宽平稳随机过程可以用傅里叶级数展开
一般的用 KL 展开
随机向量的双正交展开:
零均值的 $n$ 元随机向量 $\mathbf X \in R^n$ 可以如下展开:
基向量选择的是自相关矩阵 $\mathbf R$ 的特征向量。
如果我们用 $\mathbf K$ 个维度来逼近 $\mathbf X$,为了使得误差最小,选取最大的$\mathbf K$个特征值: $\mathbf X =\sum\limits_{k=1}^{K} \alpha_k\mathbf e_k$。这就是主成分分析(PCA)。
谱分析
周期函数的傅里叶级数
帕斯瓦尔定理
自相关函数
功率谱密度
从而有
非周期函数的傅里叶变换
知识
帕斯瓦尔定理
自相关函数
能量谱密度
波赫纳尔——辛钦定理
实过程的 $S(\omega)$ 为偶函数。
离散随机过程的功率谱:
只在整数点 k 采样
周期过程(自相关函数有周期性)的功率谱
例子
白噪声 $E \lbrace X(t) \rbrace = 0$,
- 任意两个不同时刻 $X(t_1), X(t_2)$ 都不相关。
- 在各个频率上都有分量,且强度一致。
高斯白噪声:各时刻服从高斯分布的白噪声
色噪声: $R(\tau)$ 不是冲击函数。
- 当某过程 $R(\tau)$ 比较胖的时候,功率谱比较瘦
- 相隔较长时间 $X(t)$ 与 $X(t + \tau)$ 还相关,说明信号变化慢,对应频域低频多
分量多
- 相隔较长时间 $X(t)$ 与 $X(t + \tau)$ 还相关,说明信号变化慢,对应频域低频多
- 当某过程 $R(\tau)$ 比较瘦时,功率谱比较胖
- 相隔一点时间, $X(t)$ 与 $X(t + \tau)$ 不太相关,说明信号变化快,对应频域高频分量多。
互谱密度
称为互谱密度,不具有功率的含义。
一个宽平稳过程分别通过两个 LTI 系统:
两个过程输入两个系统,输出过程的互谱(互相关函数的傅里叶变换)。怎么求?
(输入为联合宽平稳)
宽平稳过程通过线性系统
总结:
- 输出过程的均值:易求,因为宽平稳过程的均值为常数
- 输出过程的自相关函数:有点麻烦
首先看输出与输入的自相关
因此,输出的自相关,也可以用功率谱求解。
离散时间宽平稳序列
理想白噪声通过低通滤波器:
从自相关函数可看出,相隔 $\frac{n}{2f_c}$ 的两个时刻不相关。因此,以 $2f_c$ 为采样频率的噪声采样数据彼此不相关。
可以证明宽平稳过程功率谱非负:$S_X(f) \ge 0$:
如果 $S_X(f)$ 在某个地方小于0,可以设计对应的滤波器 $H(f)$将这个小于0的区域滤出来,从而 $\int_{-\infty}^{\infty}S_X(f)|H(f)|^2\mathrm df \le 0$,导致矛盾。
线性系统例子:
滑动平均
转化为滤波器:
令
理想的矩形窗
从频域看
是一个低通滤波器。
例子2:MTI 滤波
静止目标反射信号相同,运动目标反射回波不同。因此设计滤波器消去静止目标。称为“对消”。
在频域看:
静止目标,多普勒频率为0,因此频域响应为0;运动目标,多普勒频率不为0,频域响应不为0。因此这是一个高通滤波器。
还可以多次对消:
频率响应:
采样定理
随机过程下的采样定理
$|f| \le f_0$, 当 $f_s \le 2f_0$ 时,均方意义下有
证明:
- 采样定理两边是均方相等。
- 当满足采样定理时,离散点包含全部信息,任意取值点可以恢复。
- 频带边界点
- 当功率谱在 $\pm \omega_0$ 处有 $\delta$ 函数时,以 $f_s = 2f_0$ 无法恢复信号。
- 例如:$X(t) = \cos(\omega_0 t + \phi)$,$\phi$ 为随机相位,在$[0, 2\pi]$内均匀分布。
- $R(\tau) = \frac{1}{2}\cos(\omega_0\tau)$
- $S(\omega) = \delta(\omega - \omega_0) + \delta(\omega + \omega_0)$
- 采样点 $X(kT) = (-1)^kX(0)$,与 $X(0)$ 严重相关。
欠采样
上面的级数为积分的加权求和。 n = 0 时权重为0,对应[-\omega_s/2, \omega_s/2] 内的功率谱。\
n\ne 0 时,权不为0,对应[-\omega_s/2, \omega_s/2]外的频谱,如果在这个区间外功率谱不是0,那 |\varepsilon|^2 将大于0。
$$
带通采样
一般研究实信号 $g(t)$,频谱具有共轭对称性,只需要考虑正半轴的频带就可以了:
希尔伯特变换:
希尔伯特把正频率移相 $-90\degree$,负频率移相 $+90\degree$
时域表示:
滤波器的时域响应为
g(t) 做两次希尔伯特变换,相位转了 $180\degree$:
正交性:
看成$\hat g(t)$ 与 $g(-t)$ 的卷积:
希尔伯特变换与原信号相加得到单边的频谱:
下变频:
实际上是一个旋转矩阵,把单边频信号 $\tilde g(t)$ 顺时针旋转了 $\omega_ct$变成了基带复信号。
与原信号频谱的关系:
调制和解调的流程
- 调制:不需要得到 $\hat g(t)$
- 解调:通过低通滤波代替$\hat g(t)$
随机过程的希尔伯特变换
$X(t)$为实的带通随机过程
通过希尔伯特滤波器后:
互相关:
因此
实的带通随机过程配合虚部的希尔伯特变换,同样也是只有正频率
反之,如果功率谱只有正频率有值,则实部和虚部互为希尔伯特变换,实部和虚部的信息是重复的。
随机信号的下变频:
同样是顺时针旋转了 $2\pi f_c t$ 之后得到了基带信号
研究基带信号的实部、虚部的统计特性
$\tilde{X}(t)$ 还是一个平稳过程
基带信号虚部和实部的互相关
因此同一时刻实部和虚部不相关。
互谱密度
只有当正频谱和负频谱分别跟 $f = \pm f_c$ 对称时,互谱密度恒为0。此时,任意两个时间的虚部和实部信号都是不相关的。
高斯过程
定义
随机向量$X = (X(t_1), \dots, X(t_n))^T$ 服从 $n$ 元高斯分布,称为高斯过程。
均值 $\mu_k$ = $E \lbrace X_k \rbrace$
协方差阵
做特征分解
多元高斯分布
线性变换以消去下标$ij$项:
多元高斯矢量的特征函数
特征函数不要求 $\Sigma$ 可逆。概率密度函数要求 $\Sigma$ 正定,特征值都大于0.
当 $X$ 为高斯矢量时
高斯白噪声的协方差矩阵只有对角元,对角元为方差。
可以用逼近处理 $|\Sigma| = 0$:
然后再讨论 $K \rightarrow \infty$ 的情况。
多元高斯矢量的边缘分布
任取子矢量 $\lbrace K_1, K_2, \dots, K_m \rbrace \subseteq {1, 2, \dots, n}$
观察 $\tilde{ X} = (X_{K_1}, X_{K_2}, \dots, X_{K_m})^T$ 的分布
用置换矩阵 $P$ 将 $\Sigma$ 的第 $K_1, K_2, \dots, K_m$ 行、列移到 $\Sigma$ 的左上角,对应的 $\omega$ 也置换:
置换到左上角后,容易看出子矢量的特征函数可以通过将原矢量其他的$\omega$置零得到,均值就是选择对应的均值,协方差矩阵就是把对应的行列元素抽出来:
利用特征函数求数字特征:
高斯的矢量分布的高阶矩完全由一阶矩 $\mu$ 和二阶矩 $\Sigma$ 决定。例如可以用特征函数推出:
独立性
独立性说的是统计,不相关说的是线性(二阶矩)
一般来说
但是,对于高斯分布而言:
这是因为高斯分布完全由一阶和二阶矩决定。
定理:
$n$ 元向量 $X = \binom{X_1}{X_2}$ 服从 $N(\mu, \Sigma)$,则 $X_1, X_2$ 独立 $\lrArr$ $\Sigma_{12} = 0$
充分性:
必要性:
可见 $X_1, X_2$ 统计独立。
对于高斯过程:
即 $X(t_1), X(t_2), \dots, X(t_n)$ 和 $X(t_1 + \tau), X(t_2 + \tau), \dots, X(t_n + \tau)$ 有相同的 $\mu, \Sigma$ 等价于具有相同的分布函数。
线性变换
定理: $X$ 服从高斯分布,矩阵 $C_{m\times n}$, $Y = CX$,则 $Y$ 服从高斯分布 $N \left(C\mu, C \Sigma C^T \right)$。
高斯过程经过微分,积分,滤波等线性操作,输出还是高斯过程。
有一种重要的线性变换:去相关。
需要
计算协方差
去相关之后方差减小了。可以认为 $X_1 = Y_1 - AX_2$ 中,$- AX_2$是与 $Y$ “独立” 的“噪声项”,这个噪声导致了 $X_1$ 的方差大于去相关之后的 $Y$ 的方差。
去相关与是否是高斯矢量无关。但是对于高斯矢量,去相关之后,两个矢量就独立了,具有重要的意义。
对于一般的二阶矩过程,希望找到一个矩阵 $U$ ,使得 $Y = UX$ 的各个分量不相关:
所以,本质上就是分析了协方差矩阵 $\Sigma$ 的特征值。也就是二阶矩章节讲到的主成分分析:
选取 $\lambda_i$ 大的特征矢量,张成主成分空间。
信号处理中有信号空间(特征值大的)和噪声空间(特征值小的,被噪声掩盖了)。
有时候 $Y$ 的各个分量不相关还不能完全消去元素之间的统计关系。只是线性不相关。不相关的约束实际上很弱。
如果要设计 $U$,使得 $Y = UX$ 的各个分量独立,运算很复杂。
但是,对于高斯矢量而言,不相关就是独立。所以对于高斯过程,主成分分析 $\lrArr$ 独立成分分析。
高斯变量的条件分布
仍是高斯:
实高斯过程的若干性质
实高斯过程完全由均值函数和协方差函数确定。
严平稳等价于宽平稳。
若实高斯过程均方可导,则 $\lbrace X^\prime(t) \rbrace$ 也是高斯过程。
高斯过程通过一般线性系统仍然是高斯过程。
零均值带通高斯过程
此时有
幅度为瑞利分布,相位为均匀分布,相互统计独立:
随机相位正弦波信号叠加零均值带通高斯
结果是幅度为莱斯分布,相位均匀分布,二者统计独立:
高斯过程经过非线性函数
限幅器
服从两点分布
全线性检波(求绝对值)
半波线性检波
平方率检波
基带信号的包络经过平方律检波
高斯——马尔可夫性
马尔可夫特性:
如果一个过程既是高斯的,又是马尔可夫的,会有很好的性质。
对于零均值高斯分布:
正向很好证明,反向证明的关键是计算均值和方差。
从右到左:条件协方差 $E\lbrace (Y_1 - E \lbrace Y_1|Y_2 \rbrace)^2|Y_2\rbrace = \Sigma_{11} - \Sigma_{12}\Sigma_{22}^{-1}\Sigma_{21}$ 跟 $Y_2$ 无关(这并不是说条件协方差和协方差具有相同的意义,只是数值上正好相等)
残差与已有信息正交:
类似于最小二乘估计:
自回归方程:
Brown 运动
从一维随机游走开始:
令 $t = nT$,固定 $t$,令 $n \rightarrow \infty$,由 CLT 可知成为一个高斯分布:
随着时间增加,不确定性越来越大。
标准布朗运动:
(1)$B(t)$ 满足独立增量,平稳增量
(2)$B(t)$ 的每个样本轨道都是连续的
(3)$\forall t, B(t)$ 遵循高斯分布,均值0,方差 $t$
布朗运动是高斯白噪声的积分:
可见布朗运动的不规则。
Markov 过程
Markov 链
一种状态离散、时间离散的随机过程。
Markov 特性
马尔可夫特性的一种表示:
在已知现在的条件下,过去与将来独立。
其他表示:过去用集合事件表示
进一步,过去是一个集合,未来也是一个集合:
但是,变量“现在”必须取值为一个确定的值,不能是一个集合。对现在的状态一定要精确掌握,不能放宽约束。
口号:从小事做起(泊松),从现在做起(马尔可夫)
转移概率
一步转移概率:
状态转移矩阵
观察变量族的联合分布
齐次马尔科夫链的迭代表示
也称为新息过程
一维随机游走
吸收壁
反射壁 - 完全反射壁
成功逃跑
等待服务人数
柯尔莫格洛夫方程
多步转移矩阵概率
或者表示为
由于上面转移阵步数 $p, q$ 的任意性,多步跳变矩阵可以转变为矩阵相乘:
求多步转移矩阵:适用于齐次马尔可夫
齐次马尔可夫链的 $P$ 与时间起点无关
先求 $P^{(n)} = P^n$,再看 $[P^n]_{ij}$ 就是要求的转移概率。
如何求 $P^n$ ?
首先做特征分解 $PU = U\Lambda$
二元通信信道
在 $|1 - \alpha - \beta| < 1$ 的条件下,无穷步跳变后:
各列相等,说明这个马尔可夫链与初始状态无关,历史被淡忘——马尔可夫性。
$1 - \alpha - \beta = -1$ 时,极限不存在
状态分类
可达性:$\exists m, s.t. P_{ij}^{(m)} > 0$
互通性:$\exist m, n, s.t. P_{ij}^{(m)} > 0, P_{ji}^{(n)} > 0$,是等价关系。
不可约(irreducible),不可分
马尔可夫链中每两个状态都是互通的,也叫互通链。
闭集:$\forall i \in C, j\not \in C, i \not \rightarrow j$
不可约的另一定义:除了把整个链作为闭集,不存在取其中一些状态构成其他闭集了。
激励状态
稳定状态(闭集)
一般情况,Markov 链的转移矩阵行列重排后可化为:
对闭集而言,可以在闭集内使用柯尔莫格洛夫方程:
首次达到时间:$T_{ij}(\omega) = \min \lbrace n: X_0(\omega) = i, X_n(\omega) = j, n \ge 1 \rbrace$
首次到达概率
此时有
定义
为迟早到达的概率。
表示永远无法到达的概率。
定理:
考虑 $P_{ij}^{(0)} = \delta_{ij}$,上述可以写成卷积形式:
常返性
常返与非常返
若 $f_{ij} = 1$,称状态 i 为常返态
令 $z = 1$:
常返性判别:
后面会证明,这种返回的次数都是无穷大。
常返的理解:
从判别定理可以看出,在期望意义上,常返态被无限次访问。
推论1:既然常返态被无穷次返回,非常返态被有限次访问,则在有限状态的 Markov 链中一定存在常返态。
反证法:如果全是有限返回次数,那所有态的访问次数加起来还是有限的,但是马尔可夫可以访问无限次,矛盾。所以一定有常返态。
推论1.1:如果非常返态的个数有限,则足够长的时间后,状态一定会到达常返态。
推论1.2:若 j 非常返,则$\forall i$
推论2:若 $i$ 常返,$i \lrarr j$,则 $j$ 也是常返的。
推论3:若 $i$ 为常返,$i \rarr j$,则 $j \rarr i$
正常返与零常返
$f_{ii}^n$ 可以视为首次返回时间 $T_{ii}$ 的概率分布。对于非常返态不能这么看,因为 $f_{ii} < 1$。
对于常返态的 $T_{ii}$,可以计算期望
若均值为无穷大,则称为零常返。
零常返与非常返是有区别的。零常返是可以常返,只是大概率步数很多。
定义返回的速率,可推导
正常返意味着速率为常数,零常返意味着速率为 0。
判定定理:
条件一就是常返的判定定理。条件二比较特殊:
如果是零常返,这个极限就是0。在条件二上,零常返和非常返是一样的。
定理:常返态 $i$,$i \rarr j$,则 $i, j$ 同为正常返或者零常返
补充性质
下面研究常返态 $j$,不可约链
“从常返态触发,返回次数为无穷大”这件事的概率为 1.
“任意状态访问常返态的次数为无穷大”的概率为1.
两边取极限可得 $f_{ij} = 1$
结论3: 从不可约链任何状态出发,迟早访问状态 $j$
结论4:极限概率与初始状态无关。
分类方式
对于每个常返态 i,存在一个 i 可达状态构成的状态集 C 。则这些状态彼此相通,构成一个不可约闭集,都常返
马尔可夫链可以唯一划分为 $C_1, C_2, …, T$,其中 $C_i$ 互为不相交的不可约闭集。T 为非常返态。每个闭集中,常返类型一致,不同闭集不互通。
定理:马尔科夫链若有一个零常返,有无穷多个零常返。
推论:有限状态马尔可夫链的常返态必然为正常返。
马尔可夫链的平稳分布和极限概率
对于不可约链:
极限概率用 $\pi_j$表示
对于非常返和零常返,极限概率都是0。零常返的链一定有无穷个状态。
对于正常返,$\pi_j \gt 0, \sum\limits_{j\in S}^{}\pi_j = 1$
从柯式方程得出:
矩阵形式:
泊松过程
定义
计数过程
在 $[0, t]$ 内发生某类事件的次数记为 $\lbrace N(t), t\ge 0 \rbrace$,则称 $\lbrace N(t) \rbrace$ 为计数过程。
泊松过程
若满足以下条件:
- $N(0) = 0$
- 非负性:$N(t)$ 的取值非负整数;
- 非降性:$N(t)$ 是随时间单调不减的;
- 独立增量性:对于 $0 \le t_1 < t_2 < \ldots < t_n$,$N(t_2) - N(t_1), N(t_3) - N(t_2), \ldots, N(t_n) - N(t_{n-1})$ 是相互独立的随机变量;
- 平稳增量性:对于 $0 \le s < t$,$N(t) - N(s)$ 的分布只与时间间隔 $t-s$ 有关,而与具体的时刻 $s$ 无关。
- $P(N(t + \Delta t) - N(t) = 1) = \lambda\Delta t + o(\Delta t), P(N(t + \Delta t) - N(t) \ge 2) = o(\Delta t)$
则称 $\lbrace N(t), t\ge 0 \rbrace$ 为泊松过程。
性质
泊松的表达式
泊松分布的特征函数
泊松过程的数字特征
泊松与二项分布
泊松分布是二项分布的极限。
泊松脉冲串:
泊松相关问题
事件间隔时间的分布
$S_n$ 表示第 n 件事到达的时刻
$T_n$ 表示相邻两件事发生的间隔
$T_n$ 和 $T_m$ 是独立的。
等待时间的分布
概率密度函数与特征函数互为傅里叶变换
要求 $S_n$ 的概率密度函数,可以看作 $T_n$ 的卷积:
称为 $\Gamma$ 分布,参数 $\lambda, n$。
相邻两次事件之间的计数
两次公交车到来(速度 $\mu$)之间,等车人数(速度 $\lambda$)的计数:
n个事件到达时间的的联合分布
如果是有编号的(不是按顺序到达):
以下分布的极限,就是泊松过程:
总结泊松过程的几种定义
- N(0) = 0,独立增量,平稳增量,$\Delta t$ 内发生一个事件的概率 $\lambda \Delta t$,发生两件事以上的概率小
- 事件时间间隔独立同分布,服从复指数分布,则计数为泊松
- N 个客体随机地分布在 $[0, t]$ 区间上,每个客体的出现时间均匀分布,且相互时间独立,当 $n \rightarrow \infty, t \rightarrow \infty$,极限分布为泊松分布
- 二项分布的极限
顺序统计量
统计量是样本的某个函数 $g(X_1, …, X_n)$。例如:最大值、中值、平均值、样本协方差阵
顺序统计量:根据到达时刻排序。例如 $S_1, S_2, …, S_n$ 就是 $V_1, V_2, …, V_n$ 的顺序统计量
有序的顺序统计量的分布:
非齐次泊松过程
四个条件:
$N(0) = 0$
$N(t)$ 独立增量
$P(N(t + \Delta t) - N(t) = 1) = \lambda(t)\Delta t + o(\Delta t)$
$P(N(t + \Delta t) - N(t) \ge 2) = o(\Delta t)$
定理:
其中,
其意义可以理解为事件的个数。
令 $m(t + t_0) - m(t_0) = \alpha$
则期望和方差
复合泊松
$Y_n$ 随机变量族,$N(t)$ 泊松过程,称$X(t) = \sum_{n = 1}^{N(t)}Y_n$ 为复合泊松。
随机参数泊松
参数 $\lambda$ 是随机变量,PDF为 $f(\lambda)$
- 是平稳增量
- 不是独立增量
母函数:
数据统计的后验分布
过滤的泊松过程
统计一段时间影响的总和
特征函数:
均值:
生灭过程
该过程状态可以用整数序列 $n = 0, 1, 2, 3, …$ 来表示
状态转移只能发生在临近状态之间
在$[t, t + \Delta t)$ 区间内,n状态转移到 $n + 1$ 状态的概率为 $\lambda \Delta t$, 转移到 $n - 1$ 状态的概率为 $\mu \Delta t$。
M/M/1
系统平均顾客人数 $L = \frac{\lambda / \mu}{1 - \lambda / \mu}$
排队平均人数
前面有一个人,等待时间:负指数分布的无记忆性
从而不管你什么时候来,平均等待时间为 $1/\mu$,和一个人被服务的时间是一样的。