关键词不能为空

当前您在: 主页 > 英语 >

语音重点总结

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2021-02-13 15:43
tags:

-

2021年2月13日发(作者:aotu)


1


.function of prefilter



suppress the component of input signal which exceed fs/2




prevent aliasing




suppress Interference caused by 50Hz electricity





prefilter


is


band-pass


filter



in


general,low


and


up


cut-off


frequency


are




fH=3400Hz




fL=60



100Hz




2. sampling



transform time continuous signal into a time discrete signal





气流从 喉向上经过口腔或鼻腔后从嘴或鼻孔向外辐射,


期间的传输通道称为

声道



气流流


过声道时犹如通过了 一个具有某种谐振特性的腔体,


放大某些频率,


在频谱上形成相 应位置


的峰起,称为


共振峰




短时自相关函数



长 时自相关函数


可以用来描述语音的


幅度特性


功率谱密度:


1


.


语音中不同频谱分量的平均概率可以用


长时平均谱密度


来表示。


2.


语音波形


高频分量对语 音总能量的贡献很小,但是高频分量带有重要的语音信息,平均功率谱约在


250-50 0Hz


处最大,而高于此频率的功率谱约以每倍频程


6~10d B


下降。


3..


语音信号的短时


频谱并不总是低通特性。辅音有较高的频谱分量,显噪声特性;元音从总体上看是低通的,


显示明显的局部特性。




语音信号具有很强的



时变特性




在有些段落中它具有很强的周期性,有些段落中又具有 噪声特性,而且周期性语音


和噪声语音也在不断变化之中。




语音信号是非平稳的,但具有



准平稳特性




在较短的时间间隔内(一般


20~200ms



,可以认为语音信号的特征基本保持不变。




数字语音信号处理中,通常采取短时分析技术。



元音和辅音的区别


:


1


.< /p>


从功能上来讲,


元音往往能自成音节,


辅 音一般不能独立地构成音节。


2


.在物理属性方面,元音基本上 由乐音构成,辅音则有一定的噪音。


3


.在听觉上,发元音


时,


声带振动,


比较响亮;


发辅音时,


有的声带不振动,


自然不够响亮,


有的声带即使振动,


但由于在声腔中受到某种阻碍,还是不如元音响亮。


4


.在生理属性方面,主要有三个方面


的区别:第一,


发辅音的时候,


发音器官的某一部位形成阻碍, 气流在只有克服阻碍才能发


出来;


发元音的时候,气流通过生门 使声带发生振动,气流在其通道上不受到阻碍,只受到


各种共鸣。第二,发辅音时,因为 要克服某种阻碍,气流就比较强;发元音时,因无需克服


阻碍,气流就比较弱。



决定元音音质的因素


:主要有三个方面的因素 ,一、舌位的高低,二、舌位的前后,三、嘴


唇的圆展。这三个因素的不同组合,便能发 出不同的元音



在求语音信号频谱时,频率越高,


相应的成分越小。


预加重


的目的是提升高频部分,< /p>


使


信号的频谱变得平坦。以便于频谱分析和声道参数分析。



一般在语音信号数字化后,通过


一个一阶数 字滤波器:


H(z)=1-


?


z-1,


?


接近


1


。< /p>



为什么取


10



30ms



因为根据人的发声生理结 构变化的连续性,


在此时间段内,


声带、


声道、口腔的特性几乎不变,语音信号近似平稳。



加窗的作 用


:


得到连续的语音特征



抑制吉尔伯特效应



抑制频谱泄漏



窗口的长度

< p>
N



频率分辨率


?


f=fs/N



?


f



N


的增加而减少,频率分辨率得到提 高,但


时间分辨率降低


(


与窗长成反比


)


。应根据不同的应用场合来选择窗口的长度

< br>N


,应包含


7



基音周期,因此可选择


100



300


点为宜。



时域波形


:幅度-时间图。大致得出音节的起始点、清音和浊音以及浊音的基音频率



频谱特性:


幅度谱图。得出基音周期、共振峰频率及其位置 。



语音信号的时域分析


:


短时能量及短时平均幅度分析


(1.


幅度分析的 依据:


是基于语音信


号幅度随时间变化。


清音段幅度小,


其能量集中于高频段;浊音段幅度较大,其能量集中于


低频段。


2.


短时能量函数和短时平均幅度函数


作用


:


(1)


区分清


/


浊音:


(2)


在信噪比高的情况下,


能进行有声


/


无声判决


(3)


大致能定出浊音变为清音的时刻,或反之


)


短时过零率分析



(


定义:


信号跨越横轴的情况。对于连续信号,观察语音时域 波形通过横轴的情况;对于离散信号,


相邻的采样值具有不同的代数符号,也就是样点改 变符号的次数


。作用


:


1.

< p>
区分清


/


浊音:浊


音平均 过零率低,集中在低频端;清音平均过零率高,集中在高频端。


2.

从背景噪声中找出


是否有语音,以及语音的起点



)



短时相关分析



短时平均幅度差函数



在实际应用中, 短时平均过零率容易受到


A/D


转换是的直流偏移、

< p>
50Hz


交流电源的



扰 以及噪声的影响


.


减少这些干扰可以有两种方法:


一种是采用带通滤波器消除信号中的直


流和


50Hz


低频分量;另一种是用过门限率来修改过零率,减少随机噪声的影响。

< br>


N


?


1


?


k


短时自相关函数的定义


:


R


n


(


k


)


?


x


n


(


m


)


x

< br>n


(


m


?


k


)


0


?


k


?


K



m


?


0


(1)


说明当 时域信号为周期信号时,自相关函数也是周期性函数,两者具有同样的周期。



(2)Rn(k)


为偶函数,



Rn(k)



Rn(



k)


(3)Rn(0)


最大,



Rn(0)


?


|Rn(k)|, Rn(0)=En,


对于确定信号,



Rn(0)


是信号能量;对于随机


信号或周期信号,

< p>


Rn(0)


是平均功率。


< p>
相关函数的作用


:


1.


区 分清


/


浊音


.


浊音语音的自相关函数具有一定的周期性。清音语音


的自相关函数不具有周期性,


类似噪声,


有点如语音信号本身。


2.


估计浊音语音信号的周期,


即估计基音周期。



短时平均幅度差函数的意义


:


短时自相 关函数是语音信号时域分析的重要参量,但由于


乘法运算所需要的时间长。


为了避免乘法,


一个简单的方法就是利用差值,


为此 常常采用另


一种与自相关函数有类似作用的参量,短时平均幅度差函数。



短时平均幅度差函数和自相关函数的关系是:



(


k


)


?


2


?


(


k


)[


R


(


0


)


?


R


(

k


)]


0


.


5


?


(


k


)


?


0


.


6


~


1


.


0


F


n


n


n


浊音是一个准周期信号,


在一帧语音内基音周期近似恒定,

< br>因此,


短时平均幅度差函数在浊


音语音的基音周期上出现 极小值,而在清音语音中没有明显的极小值。



语谱图


:



宽带语谱图



窄时窗,时间分辨率高,频率分辨率低



纵条纹




窄带语谱图



横条纹



窄时窗,时间分辨率低,频率分辨率高



LPC:


提供了预测功能;提供了声道模型和声道模型的参数估计方法;


基本思想:


语音样


本之间存在相关性,一个语音信号 的样本可以用过去若干个样本的线性组合来逼近;



要想使模型 的假定较好的符合语音的实际产生模型主要考虑两个因素:


模型的阶数要与共

< p>
振峰的个数相吻合;声门脉冲形状和口唇辐射影响的补偿。


考虑了上述两个 因素的线性预


测分析,


预测误差序列近似于白噪声序列,


表明由某一短时信号所得到的线性预测系数能较


好的描述产生这段语音 的声道特性。



线性预测阶数


P


的选择


:


P


的选择应 综合考虑谱估计精度、计算量、存储量;原则:保证有


足够的极点来模拟声道的谐振结构


,



kHz


一 个共振峰,每共振峰需要两个极点,外加几个


fs


逼近零点的极 点;


经验公式:



P

< br>?


?


?


分析帧长


N


的选择



1000


N


小,计算量小;


N


大 ,估计谱的精度高


;N


可取


2



3


个基音周期长度;



LPC


谱估计的特点


:在信号能量较大 的区域(谱峰值的地方)



LPC


谱和 信号谱很接近;而


在谱的谷底相差比较大。



倒谱分析:



由卷积信号求得参与卷积 的各个信号的过程称为


解卷过程



< /p>


解卷算法可以分为两大类:第一类


是首先为线性系统


V(Z)


建立一个模型,然后对模型参数


按照某种最 佳准则进行估计,


这种方法称为参数解卷方法。


采用的模型可以 分为全极点模型



AR


模型)和零极点 模型(


ARMA


模型)


,如果采用最小 均方误差准则对


AR


模型进行估


计,就 得到线性预测编码算法


(LPC)



第 二类


算法称为非模型解卷。同态信号处理完成解卷


?

< p>


-


-


-


-


-


-


-


-



本文更新与2021-02-13 15:43,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/651071.html

语音重点总结的相关文章