更新时间:2023-01-08 23:35
线性预测(linear prediction)根据随机信号过去的p个已知抽样值序列为Sn-1,Sn-2,…Sn-p,预测现时样值Sn的估计值的方法。预测公式是一个线性方程,所以这种预测称为线性预测。
预测公式中的p称为预测阶数;an-k称为预测系数;真实值与预测值之差en=Sn- ,称为预测误差。预测的目的就是找出一组合适的系数a1a2…ap,使误差en的均方值最小。实际预测过程一般是先把抽样序列按一定的数目组成帧,然后逐帧进行预测,每帧都找出该帧的p个最佳预测系数。预测的好坏(精确度)不是以某一个样值的预测结果来衡量,而是要看帧内各样值预测的总效果。
线性预测是进行语音信号分析最有效和最流行的分析技术之一。线性预测分析的重要性在于:它提供了一组简洁的语音信号模型参数,这一组参数能够较精确地表征语音信号的频谱幅度,而分析它们所需的运算量相对来讲并不大。例如用线性预测原理降低编码数码率的信号编码,它主要用于话音、图像和遥测信号的编码。这种预测编码不是对连续的信号直接抽样后编码,而是把每帧的P个预测系数和各样值预测误差en编码后传输。收信端则利用这些参数来重建信号。在一般情况下它的编码数码率比直接抽样后编码的数码率低得多。将语音的线性预测参数形成模板储存,在语音识别中也可以提高识别率和减少计算时间。此外,这种参数还可以用来实现有效的语音合成。因此,线性预测分析技术已经成为语音信号处理的一个强有力的工具和方法。
其中有:①简单的固定系数预测:预测系数在长时间内不变S②自适应预测:每一帧都重新计算预测系数和预测剩余信号的平均能量等,以便能很好地适应信号的复杂变化;③单级预测:利用信号的短时相关性进行预测;④多级预测:既利用短时相关性又利用前后周期相关性进行预测。
在实际应用中,对预测算法、预测系数的表征、编码型式等都要进行优选。目标是减少运算量和存储量,在精度受限时确保预测稳定,以及减少测算误差、编码误差和传输差错等因素对重建信号的不良影响。随着大规模集成电路与计算技术的发展,线性预测技术将在通信和语音信号处理中发挥更大的作用。
线性预测编码的基础是假设声音信号(浊音)是音管末端的蜂鸣器产生的,偶尔伴随有嘶嘶声与爆破声(齿擦音与爆破音)。尽管这看起来有些原始,但是这种模式实际上非常接近于真实语音产生过程。声带之间的声门产生不同强度(音量)与频率(音调)的声音,喉咙与嘴组成共鸣声道。嘶嘶声与爆破声通过舌头、嘴唇以及喉咙的作用产生出来。
线性预测编码通过估计共振峰、剔除它们在语音信号中的作用、估计保留的蜂鸣音强度与频率来分析语音信号。剔除共振峰的过程称为逆滤波,经过这个过程剩余的信号称为残余信号(en:residue)。
描述峰鸣强度与频率、共鸣峰、残余信号的数字可以保存、发送到其它地方。线性预测编码通过逆向的过程合成语音信号:使用蜂鸣参数与残余信号生成源信号、使用共振峰生成表示声道的滤波器,源信号经过滤波器的处理就得到语音信号。
由于语音信号随着时间变化,这个过程是在一段段的语音信号帧上进行处理的。通常每秒 30 到 50 帧的速度就能对可理解的信号进行很好的压缩。