信息论基础
离散随机变量的信息度量
称为熵
单位:
- 2 (Bit)
- e (Nat)
- 10 (Hartely)
表示了信息描述的有效性极限
信源编码(Source Coding),通过信息的有效表示,提高通信的有效性。例如: Huffman 编码
离散随机变量的最大熵:$\max_{p_i} H(X) = \log|S|$
前缀码:任何码字都不是其他码字的前缀。前缀码保证了唯一可译码。是二叉树叶子节点。
Kraft不等式
对于信源字符集$\lbrace a_1, \dots, a_m\rbrace$,必满足:
同时,若上式成立,必存在码长分别为$𝑙(𝑎_𝑘)$的前缀码。
最小前缀码的平均码长:
由拉格朗日乘子法
记 $H(X) = -\sum p_i\log p_i$ .一般的,上下界为$H(X) \le \bar L \lt H(X) + 1$.
如果我们将$k$个独立同分布的信源符号 $x_1, \dots, x_k$堪称一个,对整体应用前缀码编码:
直观:对长度为$𝑛$的$M$种信源符号序列,$𝑥_𝑖$出现的次数$≈𝑛𝑝_𝑖$
典型序列应满足上述分布,否则就“小众”“非典型”
典型的个数 # $≈ \frac{𝒏!}{(𝑛𝑝_1) !… (𝑛𝑝_M) !}$
平均每个信源符号可以用 $L = \frac{1}{n}\log\left(\frac{𝒏!}{(𝑛𝑝_1) !… (𝑛𝑝_M) !}\right)$ 个 bit 来表达。
通过 Stirling 公式可以得出 L的上下界。
故
最大熵
离散型随机变量的最大熵为
可以用梯度法直观感受,当所有分量的概率相等时,熵最大。
联合熵
联合概率
联合熵的定义:
条件熵
条件概率
条件熵的定义:
通过相关观测进行无损压缩,若观测到 $Y = \alpha_j$:
于是
链式法则
两个随机变量的联合不确定性=一个随机变量的不确定性+知道这个随机变量后另一个随机变量残余的不确定性
互信息(Mutual Infomation)
互信息的物理意义
第一种理解:
- X的不确定度减去观测Y后X残存的不确定度
- 即:通过观测Y带来的帮助了解X的信息
第二种理解:
- Y的不确定度减去观测X后Y残存的不确定度
- 即:通过观测X带来的帮助了解Y的信息
若$X, Y$相互独立,记为$X\perp Y$,则$I(X;Y) = 0$,$H(X) = H(X|Y)$,$H(Y) = H(Y|X)$。观测一个随机变量完全无助于了解另一个随机变量。
- $H(XY) = H(X) + H(Y)$,总平均码长等于各自平均码长之和。
若$X = Y$,则$I(X;Y) = H(X) = H(Y)$,$H(X|Y) = H(Y|X) = 0$。观测一个随机变量完全了解另一个随机变量。
$H(XY) = H(Y) + H(X|Y) = H(Y)$,只需要编码其中一个即可。
信息传输的基本模型
- 信息通道,简称信道(Channel)对于输入符号有随机扰动,本质上可用一组条件概率表示
- 限于物理条件,信宿只能观测信道输出 $Y$,由此了解其输入 $X$
- 通过观测Y可以获得的关于X的信息量是 $I(X;Y)$
信息传输的优化
目标:最大化发送端 $X$ 和接收方 $Y$ 的互信息
方法:
- 信道是由物理实现所决定的,无法控制
- 但是可以选择X的概率分布
因此有如下优化问题:
定义信道容量 $C = \max_{\sum_i p_i = 1, p_i \ge 0} I(X;Y)$
信道容量的物理意义
- 平均每个信道符号所能传的最大的信息量
- 或:单位时间内信道所传最大的信息量
优化问题的表达式
信道容量不易计算
对称二进制信道(BSC)
- 一种典型信道模型
- 分析信道编码时有很多应用
利用互信息表达式
如果误码率 $\varepsilon = 0.5$,则信道容量为0, 传递不了信息。
如果误码率 $\varepsilon > 0.5$,继续增大差错率,反而可以提高信道容量。
高斯信道
Shannon 公式
连续性随机变量的熵
我们只关心相对不确定性,定义微分熵
微分熵是对连续型变量相对不确定性的一种描述
- 其定义剔除了连续性或“精准要求”带来的困难,保
留了分布函数形状自身的特征 - 它说明用有限字符集合的字符串描述连续分布的随机
变量,则平均字符长度为无穷大 - 为了用有限长字符串描述信源,需要进行有损压缩,
从而带来失真,即原始信源和压缩结果之间的差异 - 失真测度包括:均方误差,绝对值误差,主观误差等
- 对于图像,视频和语音等连续信源的编码等均属于有
损压缩
多元随机变量的熵
联合熵:
条件熵:
互信息:
压缩编码
压缩编码的分类
- 无损压缩
- 输入:数字序列
- 输出:数字序列
- 目的:使得平均长度更小
- 有损压缩
- 输入:模拟信号
- 输出:数字序列
- 目的:实现数字传输
信号压缩编码的步骤:
- 抽样
- 量化
- 压缩编码
抽样
连续时间信源的离散化
离散化的方式:在标准正交基上投影展开
若 $s(t)$ 是时限信号(宽度 $T$),可以用傅里叶展开的系数作为离散化结果:$s(t) = \sum\limits_k a_k e^{2\pi jkt/T}$
若 $s(t)$ 是带限信号(带宽 $W$),可以在频域对 $\hat S(f)$ 做傅里叶展开:
变换回时域时,得到 Nyquist 抽样定理:
频域无混叠等价于时域无畸变
对于带通采样,有无混叠条件:
可以推导得出:
横轴为 $f_H/B$,纵轴为 $f_s$
量化
分层电平: $\lbrace x_k \lt x \le x_{k + 1} \rbrace$
重建/输出电平:$y_k$代表一个量化区间,用以重构信号时使用的电平值
量化函数: $y = Q(x)$, $y_k = Q\lbrace x_k \lt x \le x_{k + 1} \rbrace$
量化间隔: $\Delta_k = x_{k + 1} - x_{k}$
均匀量化 & 非均匀量化
均匀量化只对有界随机变量存在
量化
- 在此只讨论标量的量化
- 量化噪声: $q = x - y = x - Q(x)$
- 量化噪声是一个随机变量
- 方差 $\sigma_q^2 = \int_{-\infty}^{\infty}[x - Q(x)]^2p_x(x)\mathrm dx$
- 方差与输入信号分布有关,不存在普适的最佳量化方案
量化噪声的计算
从较容易的情况着手
- 只考虑电平区间 $[-V,V]$ 之间的信号,并假设量化间隔很小,亦即分层电平很密
- 在实际情况中,信号的分布函数处处可导,此时每个量化区间内信号的条件分布为均匀分布
量化区间内,近似概率密度 $p_x(x) = \frac{P_k}{\Delta_k}$
密集分层的量化噪声近似
若 $\Delta_k = \Delta$,
计算量化结果做无损压缩后的比特数:
由 $\Delta = \sqrt{12\sigma_{qn}^2} = 2\sigma_{qn}\sqrt{3}$,
无损压缩的 bit 数为: $\tilde{R} = h(X) - \frac{1}{2}\log \sigma_{qn}^2 - 1.8$
对于均匀量化:
于是
这里的 $\sigma_{qn}^2$ 是正常量化噪声,仅仅是计算了信号落在 $[-x_{max}, x_{max}]$ 内的情况
如果信号落在 $[-x_{max}, x_{max}]$ 以外,就就近判断至两端的量化区间,产生过载噪声
总噪声等于正常量化噪声加上过载噪声:
如果用 $R$ bit 编码:
定义非过载信号功率:
当 $\int_{-x_{max}}^{x_{max}}p_x(x)\mathrm dx \rightarrow 1$, $SNR_q \approx \frac{\sigma_s^2}{x_{max}^2/(3 \times 2^{2R})} = 3 \times 2^{2R} \times \zeta^2$,这里定义 $\zeta = \frac{\sigma_s}{x_{max}}$ 为量化范围内信号的饱满程度。
对数单位下:
- 多一个 bit,$SNR_q$ 提升 $6.02dB$
- $\zeta$ 要在合理范围,$\zeta$ 过大时过载会严重劣化性能
最优量化
目标:给定量化区间总数,最小化量化噪声
优化问题:
分层电平在重建电平的中点:
重建电平在量化区间的质心:
对于均匀分布,质心即中点(对于可导的概率分布,当分层很密的时候同样成立)
结合
可得均匀分布的最佳量化是区间等分,中点重建
工程用量化
语音信号的量化
$[-V, V]$ 内均匀量化的缺陷:
- 最适合 $[-V, V]$ 之间的有限分布
- 语音信号呈拉普拉斯分布,特点是:
- 信号功率小
- 动态范围大(长拖尾)
- 如果采用均匀量化
- 较大的V:增大[-V,V]内的量化噪声
- 较小的V:增大过载噪声
解决思路1:非均匀量化
语音信号的非均匀量化
均匀量化的问题
- 对具有不同“概率权重”的区间“一视同仁”
- 没有考虑概率密度对于量化噪声的影响
解决方案
- 对于信号经常出现的区域,使用较细的颗粒度进行量化
- 信号经常落入这个区域,减小该区域的量化噪声损失
- 对于信号不经常出现的区域,使用较粗的颗粒度进行量化
- 信号不经常落入这个区域,量化噪声稍大不会影响大局
采用取对数后均匀量化的方法:
语音信号的瞬时压扩:
对数量化
- 正常量化信噪比与信号的分布无关
- 过载导致的噪声与信号的分布有关!
记 $\Delta_k$为对数化之前的量化区间, $\Delta_k^\prime = \Delta$ 为对数化之后的量化区间
实用的对数量化
实际工程中,采用另外两个函数(线性放缩,更容易实现):
- A律(欧洲提出,我国采用)
ITU G.712建议中取A=87.6
小信号时,信噪比增加了24dB
μ律(美国提出)
- ITU G.712建议中取μ=255
- 小信号时,信噪比增加了33.5dB
脉冲编码调制(PCM)
- 语音信号的实际压缩编码方式
- 包括两个主要步骤
- 抽样:$f_s = 8000Hz$
- 量化与编码:使用近似对数压扩,每个抽样量化为8位
- PCM的输出码率为64kbps
该码率与其推导过程十分重要
PCM编码协议
基本思想
- 用13折线近似A律
- 用15折线近似μ律
码字结构:
例:
1250的输出:1 110 0011
接收端解码: 1024 + 128 + 64 + 32 = 1248
数字基带传输
符号映射
符号集合
$M = |\mathcal{A}|$ 为符号集合 $\mathcal{A}$ 的符号数量。
bit 承载量
每个符号最多可对应 $r = \log_2|\mathcal{A}|$ 个 bit,称为集合的 bit 承载量
数字通信的典型符号:
- ASK
- PAM
- PSK
- QAM
邻位最小差错映射:Grey 码
相邻符号对应的 bit 串仅有一位差异
符号周期(Symbol Period)
- 传输一个符号所需的平均时间
- $T_s$
通信速率:
- 符号速率:$R_s = \frac{1}{T_s}$
- Bit 速率: $R_b = R_s \log_2 M = \frac{1}{T_s}\log_2 M$
数字调制
基带调制:将时间上离散的符号,加载到时间上形成连续的波形
通信信号具有带宽受限特性,因为:
- 自然原因:各类通信线路,如双绞线,同轴电缆,射频功放等均对通过的频率有一定限制
- 人为原因:多用户频谱共享通信,如蜂窝无线系统,需约束每路信号的带宽,以免相互干扰
如何产生带限信号?
产生一个信号 $s(t) =\sum\limits_{k=-\infty}^{\infty}a_kg(t- k T_s)$,$g(t) = \frac{\sin 2\pi Wt}{2\pi Wt}$是个带限信号。
让间隔 $T_s$ 的冲击 $a_k\delta(t - kT_s)$ 依次通过冲击响应为 $g(t)$ 的低通滤波器
Nyquist 准则:无ISI条件
符号间串扰(Inter Symbol Interference, ISI)
对 $s(t)$ 采样:
怎么让 ISI 为0?
眼图:观察符号间串扰
眼图(Eye Pattern)是直观察看数字基带传输性能的有效方法,用一个示波器
眼皮的厚度表示 ISI 的失真,眼睛的张开程度表示噪声容限。
消除 ISI 对带限脉冲的要求
时域特征:
从频域提取特征:
Nyquist 准则
将带限脉冲的频谱分别平移 $n/T_s$( $n$ 为任意整数)若其叠加的结果对任意频率恒为定值,则 ISI 为0
通信速率与带宽效率
理解 Nyquist 准则
- 最大符号速率受制于带宽 $R_s = \frac{1}{T_s} \le 2W$
- 低通发送滤波器应该满足残留对称条件
通信速率与带宽效率
- 针对给定形式的低通滤波器,可写出$R_s$与$W$之间的线性函数关系
信号功率与带宽效率
设单个符号的能量为 $E_s$
则信号功率为单位时间内的能量
无冗余编码时,一个比特的能量为$𝐸_𝑏$,则
带宽效率的定义:单位带宽承载的速率
- 为什么不能无限制扩大符号集合?
过大的符号集合对信噪比有更高的要求,噪声容易干扰符号的分辨
升余弦滤波器
升余弦滤波器
由于理想滤波器难以实现,所以常用满足残留对称条件的非理想低通生成基带脉冲,最常用的就是升余弦滤波器
Raised Cosine(要记住)
$\alpha = 2WT_s - 1 \in [0, 1]$ 称为滚降系数,越小坡越陡,越大坡越缓。
时域冲激响应:
升余弦滤波器的性质:
常考性质:
带宽效率
升余弦滤波器的带宽效率
PCM 语言信号速率 64kbps:8 bit 采样,8 bit 量化,8*8 = 64.
例题一:传送一路PCM语音信号
- 若带宽限制为40kHz,采用二元码,则可用滚降系数范围
是多少? - 若采用四元码,最多需要多少带宽?
解:PCM语音信号是64kbps
- 采用二元码,则所需符号速率为 $R_s = R_b = 64kbps$
则 $\frac{\alpha + 1}{2}64 \le 40$, $0\le \alpha \le 0.25$
采用四元码:$R_s = \frac{R_b}{\log_24} = 32kbps$
$W \le R_s = 32kHz$
例题二:若传送一路信号$𝑅_𝑏$ = 112kbps,信道带宽𝑊 = 30𝑘bps,
求𝑀和𝛼
认定 $\log_2M = k$ 为整数,则$k = 2 或 3$。对应可解:
通信信号的功率谱计算
功率谱刻画了随机过程的功率在频域上的分布。
- 对于宽平稳过程(自相关只与时差有关),功率谱易于从 $R(\tau)$ 的傅里叶变换得到,即$S(f) = \mathcal{F}[R(\tau)]$
- 但是,通信信号一般不是宽平稳过程,而是周期平稳过程:$R(t_1, t_2) = R(t_1 + kT_s, t_2 + kT_s)$
定义
则其功率谱
若输入信号的功率谱 $S_{AI}(f)$,输出为$S_A(f)$,则对于宽平稳和周期平稳信号均有卷积关系:
证明可以采用样本统计法:假设符号序列的长度为 $2N - 1$.
功率谱的定义:
可以验证 $S_A(f) = S_{AI}(f)|H(f)|^2$
针对样本统计法,可以算出 $E(|\cdot|^2)$的表达式:
这里$R_a[m]$ 是输入符号的自相关。
先考虑无记忆调制,符号之间相互独立:
其中,$m_a = E[a_n]$,$\sigma_a^2 = E[a_n^2] - m_a^2$
于是,重写累加部分:
从而
此式应用的两个条件:
- 无记忆
- 不同符号波形一致
线谱:可用于定时恢复。方便恢复时钟分量。
任意波形调制
之前将 $a_i$ 映射为 $a_ih(t)$,可以推广:
有时候由于信号功率需要保持稳定(恒包络调制),对不同符号采用不同波形,而不是采用变化幅度的信号。
若任意波形二元调制信号 $s(t) =\sum\limits_{k=-\infty}^{\infty}g_k(t)$
(w. p. = with probability)
分解为直流分量和交流分量:
则
这是一个周期为$𝑇_𝑠$的确定性周期信号,功率谱由傅里叶展开计算
用样本统计法计算 $S_q(f)$:
基带解调
最佳接收用于在给定发送功率下提高信噪比
最佳判决用于在给定信噪比下降低误码率
基带传输的噪声模型
如何选择解调方案?
方案一:直接抽样
在信号的峰值位置 $t = kT_s$ 抽样最好。
但噪声方差满足:
(理想的白噪声信号具有无穷大功率)
真实的噪声环境下,接收信号质量随着噪声信号功率的增加而变差。如果信号的峰值处恰好噪声很大,则产生严重失真。
方案二:能量累积
噪声信号仍为高斯随机变量:
噪声方差:
信噪比:
直接积分不是最好的方案。
方案三:匹配滤波
匹配滤波的基本思想就是对接收值进行加权线性累加,从而最大化抽样时刻信号功率与噪声功率的比值。
相关器为 $g(t)$。假设信号为实信号。复信号有类似结论。
利用 Cauchy-Schwartz 不等式:
等号成立当且仅当 $g(t) = kh(t)$。
若为复信号,则需要
如何把相关器写成滤波器形式?
(滤波=卷积,相关和卷积就是差一个反褶的关系)
考虑因果系统,一般将符号波形的最高点设置为 $t = T_s$:
与相关器比较得到匹配滤波器的表达式:
图中的“开关”是抽样。
匹配滤波的频域解释:
Cauchy-Schwartz
匹配滤波的增益
数字传输的优势:数字传输中,基带脉冲h(t)是给定的,在整个码元周期内可以相干累加,而同时让噪声在整个周期内自我抵消
匹配滤波的信噪比
分子——传送一个符号的能量
分母——噪声谱密度,单位是能量的单位
以上采用的是等效基带模型。采用实际物理波形模型:
两个模型推得的信噪比表达式不同,差异在于等效基带模型使用了匹配滤波器,获得了最优的信噪比:
从实际物理波形模型来看,上式取等的条件应该是基带脉冲采用的是理想低通(Sa 函数),如果用升余弦滤波
但是,在等效基带模型中,我们考虑的是任意脉冲 $h(t)$,并没有要求它的形状,这两个模型在最优信噪比的产生条件上出现了矛盾?
传送一串符号
无 ISI 条件:
从而有根号奈奎斯特条件:
这就要求发送和接受滤波器要满足如下要求:
符号差错模型:
判决与差错
最佳判决
多元符号的最佳判决
$y = a + n$ 的条件分布是
从而得到
选择一个符号,让它到接收符号y距离最小,以此作为判决结果!
双极性码的判决门限:
单极性码的判决门限:
SER & BER
考虑二元符号
发送 A 的出错概率:
发送 -A 的出错概率:
从而平均符号差错概率:
称为符号差错概率(Symbor Error Probability, SEP),其统计结果称为误符号率(Symbol Error Ratio, SER)
由于Q是减函数,所以误符号率随A增大而减小,随噪声标准差增大而增大
误符号率不关心具体的A或标准差,而是由其比值所决定
对于多元而言:
对于任意符号集合,只要某判决门限与符号距离为A,则由于超出该判决门限而差错的条件概率就是:
计算信噪比:
信号平均功率: $S = \frac{1}{M}\sum\limits_{i=1}^{M}|a_i|^2$
信号峰值功率: $S_p = \max_{a_i \in U} |a_i|^2$
噪声功率: $N = \sigma^2$
对于双极性二元符号,平均功率为 $S = A^2$
从而信噪比为
利用等效关系得到误符号率和信噪比的关系
更一般的二元码 SER
更一般的 M 元码 SER
符号集合为 $\lbrace D - (M - 1)A, \dots, D + (M - 1)A \rbrace$
双极性 M 元码的 SER (掌握计算方法)
无论M为奇数还是偶数,结果都是一样的!
单极性 M 元码的 SER (掌握计算方法)
要使得双极性和单极性码的 SER 相同,二者的信噪比的比值为
显然,双极性的性能更好,它对信噪比的要求是单极性的四分之一,更能忍受噪声。
误比特率(Bit Error Rate, BER):
注意这是近似结果,且有成立条件,只对二元码是严格成立的!
- 假设一个符号的错判导致 1bit 的错误,假设成立的条件:
- Grey 码映射
- 信噪比不过于小
各类符号集合的 BER
双极性二元码
单极性二元码
单极性二元码损失了 3 dB.
双极性 M 元码
单极性 M 元码
由于
故可以把 SER 和 BER 用 $E_b/n_0$ 表示:
双极性二元码:
单极性二元码:
双极性 M 元码:
单极性 M 元码:
例子:相移键控 MPSK
- 所有符号的模相同
- 幅角在 $[0, 2\pi]$ 均匀分布
可以用星座图表示:
根据信号的 $I, Q$ 表示
计算 MPSK 的 SER:
考虑星座点 $(A, 0)$
接收信号的分布函数为
变换到极坐标系
误符号率可以表示为
用信噪比表示:
如果 $S/N$ 很大:
利用高信噪比近似:
当 M 比较大时:
换算成 BER, $E_b/n_0$
一个简单的方法:
看起来像是先射箭后画靶。
例子2:正交幅度调制 QAM
信号表示
I,Q 两路的电平集合:
QAM是一种典型的星座图,它分布于复平面的格点上,其符号的实虚部均为奇数(便于分析)
解调过程:
I 路信息提取:乘以同相载波 $\cos\omega_c t$,再低通滤波
Q 路信息提取:乘以同相载波 $-\sin\omega_c t$,再低通滤波
差错分析:
(通过后面的分析可以发现,降低误码率的关键是将符号间的最小距离最大化)
计算各符号的差错概率:
四个角:
$4(L - 2)$ 个边点:
$(L - 2)^2$ 个内点:
计算平均 SEP:
省略了 $Q$ 的高阶量。
计算平均功率:
是同A的LPAM功率的两倍。因为MQAM有两路LPAM
得到 SEP:
得到 BEP:
注意到MQAM可以看成两路正交的MPAM
这个推导方式更简单。
QAM 是在独立解映射条件下最好的方案。但是距离高斯信道容量还有一定距离。要达到更好的信道容量,可以采用联合解映射,将译码过程联合起来。
例子3:频移键控 FSK
一般来说,信号表达式和调制框图的相互反演是比较容易做的
相对于PAM,PSK和QAM,FSK占用更大的频带,
相干解调
Coherent Demodulation
反思FSK非相干解调方式,如果对每个频率的载波进行匹配,则可以提高信噪比
这种方法需要本地子载波
解调器的结构和非相干解调很像
无法用星座图方法表示,但是可以用类似的信号空间表示
若MFSK载频等间隔,则调制阶数约高,占用带宽越大
如果每次可以选择多个载频,甚至控制载频幅度,则可承载的符号量可以获得极大提升。由此便引申出OFDM技术
- 通过调制FSK的每个载波的幅度相位,可以承载更多的信息
星座图没法表述 FSK. 可以使用信号空间方法来表示。
差错分析:
FSK 的判决门限为棱锥形状:
根据对称性,可以只考虑一个符号的差错概率。
考虑 FSK 信号
匹配滤波的输出为
正确判决:信号落在本棱锥中
被判决符号的条件分布为
不满足正确判决条件的概率为
记 $x = \frac{r_1}{\sigma}$
可得 SEP 的表达式
另一种简单估界:
正交 2FSK 信号在最佳接收条件时的错误概率为
随着 M 的增加,MFSK 的差错性能渐优,这是以带宽的占用为代价的。
PAM, QAM, ASK 等技术随着符号个数的增加,差错性能是越来越差。
FDM——Frequency Division Multiplexing
- 先将各路信号调制到不同频段,然后复用整个
通信带宽 - 信道的非线性会在FDM系统中产生交调失真与
高次谐波,引起路际串话,因此,对信道的非
线性失真要求很高。此外,FDM用到的模拟滤
波器设计较为复杂。
OFDM 基本原理
Orthogonal Frequency division multiplexing
- 把一串高速数据流分解为若干速率低得多的子数据流。
- 将每个子数据流放置在对应的子载波上。
- 将多个子载波合成,一起并行传输。
- 优点:频谱利用率高。
正交性的定义:
设相邻子载波的频率间隔为 $1 / T$,$T$ 为 OFDM 符号的持续时间,则
任意一对子载波的内积满足
带宽 $W$ 和 $B$ 的区别:
物理带宽 $W$
信号带宽 $B$:半功率带宽(3dB),等效噪声带宽,谱零点带宽,功率比例带宽,最低功率谱带宽
带通信号的表示方法
同相分量:$x_I(t) = A(t) \cos(\varphi(t))$
正交分量:$x_Q(t) = A(t) \sin(\varphi(t))$
与幅度相位的关系:
带通信号的基带表示的方法
解析信号表示
原始带通信号是解析信号的实部
从带通信号恢复基带信号?
构造解析信号
频谱分析
带通信道
具有实数值的信道冲激响应(CIR) $h(t)$
等效的解析冲激响应 $h_A(t) = h(t) + j\breve{h}(t)$
任意载波频率 $\omega_c$ 的等效基带冲激响应CIR
带通收发信号关系 $y(t) = x(t) * h(t)$,则
$H_A(\omega)$ 只有正半轴部分
基带等效系统
基带时域转移函数 $\frac{1}{2}h_{bb}(t)$
基带频域转移函数 $H(\omega + \omega_c)$
用正交基观点构造了信号波形
投影后的噪声:
等效符号差错模型
差错控制
差错控制的分类:
- 检错重发 (ARQ)
- 前向纠错 (FEC)
前向纠错的分类:
- 线性码,非线性码
- 分组码(重点),卷积码
- 系统码,非系统码
编码增益
给定误比特率的情况下,采用纠错编码后,$E_b/n_0$的减小量称为编码增益。
简单例子:
重复编码
BSC 重传三次:
信道编码:通过合理得增加冗余信息,纠正信道传输中可能出现的错误
- 又称为纠错码(Error Correction Coding)
理想信道编码的局限性:
- 码长无穷大
- 没发现代数结构,复杂度太大
如何实用化:
- 有限长。代价:误码率非零,效率低
- 有代数结构。优点:便于译码
评价标准
- 误比特率:评价可靠性
- 码率:评价有效性
分组码
奇偶监督码
- 检错,而非纠错
- 电路实现简单
漏检概率:
群计数码
- 累计信息码元中1的个数,以二进制形式放在信息码元后面
- 检错能力
- 强于奇偶校验码
- 当{1变0数量=0变1数}时,无法检出
纠错码的直观表示
- 码字
- 对应 $n$ 维空间的点
Hamming 距离:两个码字之间不同码元的个数
Hamming 距离
- $x_m$ 和 $x_m^\prime$ 中不同取值的位置数 $d_H(\mathbf x_m, \mathbf x_m^\prime)$
- 即模2和中1的个数
汉明码重
- 二进制向量 $\mathbf x_m$ 1的个数 $w(\mathbf x_m)$
最小距离
一个分组码中任意两个码字的最小汉明距离 $d_{\text{min}}$
(n,k)纠错码
$S$ 与 $A$ 无关,$A$ 只是无用的陪同(coset)。
陪集首:上述陪集的特征由 $S = EH^T$ 标识,我们称 $E$ 为陪集首。
陪集首一般选择集合中 “1” 最少的元素,这是为了优先标识错误数量较小的差错,这一类差错发生的概率较大。
码重:
001 -> 0,0,0,0,0,1 -> 101
010 -> 0,0,0,0,1,0 -> 011
011 -> 0,0,0,1,0,0 -> 110
100 -> 0,0,1,0,0,0 -> 001
101 -> 0,1,0,0,0,0 -> 010
110 -> 1,0,0,0,0,0 -> 100
111 -> 0,1,0,0,0,1 -> 111
交织器
线性码的改进:
- 上述线性码,均适合于纠正零散错误
- Hamming码对于2个以上的差错就无能为力
- 若差错总是成对出现,则Hamming码基本没用
- 在通信系统中,往往存在不可抗拒的突发错误
例如:无线信道的衰落引起的误码
抗突发误码的方法:交织器
基本原理
- 为了对付突发的信道差错,交织器改变发送码元的时
间顺序 - 将原本相邻的码元在时间上的距离最大化
- 例子:考虑一个(n, k)分组码,其交织后的输出为
将突发误码转换成零星误码
交织器的性能:
宽度
- 就是分组码的码长n
- 决定于所采用的分组码
深度
- 深度m决定了相邻码元交织后的间隔
- m又称交织深度
- 若分组码能纠b个突发错误,则交织后能纠mb个突发错误
解交织:
- 从另一个角度来看,解交织打散了突发误码
- 化整为零后的零散误码,就可以交给解码器对付了
卷积码
输入无限长的激励,则输出信号无限长,
若冲激响应有限,则输出只与某一段输入有关
卷积码的参数 $n, k, N$
约束长度,信息码位,每次输出
使用树状图进行分类讨论
树状图的冗余:
- 树状图具有很多冗余表示
树状图的应用:计算最小码距
- 分组码的最小码距定义为非零码字的最小码重
- 和分组码不同,卷积码没有分组的概念
- 约束长度隐含了某种独立性,可以只考虑 $kN$ 的信息比特编码后的非零码字,也就是考虑 $nN$ 个非零的编码输出位
状态图的应用
- 自由距:无限长信息序列编码后的最小汉明距离
- 自由距不等于最小距
自由距等于寄存器从零状态开始,经过非零状态,然后回到零状态的输出1的个数的最小值
卷积码的译码
维特比译码
网格图
最大似然下的最优译码
- 低复杂度
- 采用最小汉明距离作为代价函数
采用动态规划的卷积码译码成为 viterbi 译码
- viterbi 译码的起始状态是 0 状态
- viterbi 译码没有确定的代价函数,
分组码译码可以知道是否译码错误了。通过校验矩阵来校验就行了。
但是 viterbi 译码并不能肯定译码结果是否正确。
硬判决和软判决
硬判决:任务是检测和矫正误码
软判决:应用于卷积/ Viterbi 译码器,迭代译码
检错重发 ARQ
$P_c = (1 - \varepsilon)^n$ 为正确概率
$P_d$ 检出错误概率
$P_m$ 漏检概率
总分组差错概率
停等ARQ
收到上一个 ACK/NAK 再发送下一个包或者重传上一个包
假设发送方一直传输(一次就能传输成功),吞吐量的上限为
若有完美的差错检出能力 $P_d = 1 - (1 - \varepsilon)^n$
则
返回 N-ARQ
不等 ACK/NAK 返回就传下一个包,若检错则重传从错误开始的所有包