-
1
.function of
prefilter
:
suppress the
component of input signal which exceed
fs/2
,
prevent
aliasing
;
suppress Interference caused by 50Hz
electricity
。
prefilter
is
band-pass
filter
,
in
general,low
and
up
cut-off
frequency
are
:
fH=3400Hz
,
fL=60
~
100Hz
。
2.
sampling
:
transform time
continuous signal into a time discrete signal
气流从
喉向上经过口腔或鼻腔后从嘴或鼻孔向外辐射,
期间的传输通道称为
声道
。
气流流
过声道时犹如通过了
一个具有某种谐振特性的腔体,
放大某些频率,
在频谱上形成相
应位置
的峰起,称为
共振峰
。
短时自相关函数
和
长
时自相关函数
可以用来描述语音的
幅度特性
功率谱密度:
1
.
语音中不同频谱分量的平均概率可以用
长时平均谱密度
来表示。
2.
语音波形
高频分量对语
音总能量的贡献很小,但是高频分量带有重要的语音信息,平均功率谱约在
250-50
0Hz
处最大,而高于此频率的功率谱约以每倍频程
6~10d
B
下降。
3..
语音信号的短时
频谱并不总是低通特性。辅音有较高的频谱分量,显噪声特性;元音从总体上看是低通的,
p>
显示明显的局部特性。
语音信号具有很强的
“
时变特性
”
在有些段落中它具有很强的周期性,有些段落中又具有
噪声特性,而且周期性语音
和噪声语音也在不断变化之中。
语音信号是非平稳的,但具有
“
p>
准平稳特性
”
在较短的时间间隔内(一般
20~200ms
)
,可以认为语音信号的特征基本保持不变。
数字语音信号处理中,通常采取短时分析技术。
元音和辅音的区别
:
1
.<
/p>
从功能上来讲,
元音往往能自成音节,
辅
音一般不能独立地构成音节。
2
.在物理属性方面,元音基本上
由乐音构成,辅音则有一定的噪音。
3
.在听觉上,发元音
p>
时,
声带振动,
比较响亮;
发辅音时,
有的声带不振动,
自然不够响亮,
有的声带即使振动,
但由于在声腔中受到某种阻碍,还是不如元音响亮。
4
.在生理属性方面,主要有三个方面
的区别:第一,
发辅音的时候,
发音器官的某一部位形成阻碍,
气流在只有克服阻碍才能发
出来;
发元音的时候,气流通过生门
使声带发生振动,气流在其通道上不受到阻碍,只受到
各种共鸣。第二,发辅音时,因为
要克服某种阻碍,气流就比较强;发元音时,因无需克服
阻碍,气流就比较弱。
决定元音音质的因素
:主要有三个方面的因素
,一、舌位的高低,二、舌位的前后,三、嘴
唇的圆展。这三个因素的不同组合,便能发
出不同的元音
在求语音信号频谱时,频率越高,
相应的成分越小。
预加重
的目的是提升高频部分,<
/p>
使
信号的频谱变得平坦。以便于频谱分析和声道参数分析。
一般在语音信号数字化后,通过
一个一阶数
字滤波器:
H(z)=1-
?
z-1,
?
接近
1
。<
/p>
为什么取
10
-
30ms
,
因为根据人的发声生理结
构变化的连续性,
在此时间段内,
声带、
声道、口腔的特性几乎不变,语音信号近似平稳。
加窗的作
用
:
得到连续的语音特征
抑制吉尔伯特效应
抑制频谱泄漏
窗口的长度
N
:
频率分辨率
?
f=fs/N
。
?
f
随
N
的增加而减少,频率分辨率得到提
高,但
时间分辨率降低
(
与窗长成反比
)
。应根据不同的应用场合来选择窗口的长度
< br>N
,应包含
7
个
基音周期,因此可选择
100
~
300
点为宜。
时域波形
:幅度-时间图。大致得出音节的起始点、清音和浊音以及浊音的基音频率
频谱特性:
幅度谱图。得出基音周期、共振峰频率及其位置
。
语音信号的时域分析
:
短时能量及短时平均幅度分析
(1.
幅度分析的
依据:
是基于语音信
号幅度随时间变化。
清音段幅度小,
其能量集中于高频段;浊音段幅度较大,其能量集中于
低频段。
2.
短时能量函数和短时平均幅度函数
作用
:
(1)
区分清
/
浊音:
(2)
在信噪比高的情况下,
能进行有声
/
无声判决
(3)
大致能定出浊音变为清音的时刻,或反之
)
短时过零率分析
(
定义:
信号跨越横轴的情况。对于连续信号,观察语音时域
波形通过横轴的情况;对于离散信号,
相邻的采样值具有不同的代数符号,也就是样点改
变符号的次数
。作用
:
1.
区分清
/
浊音:浊
音平均
过零率低,集中在低频端;清音平均过零率高,集中在高频端。
2.
从背景噪声中找出
是否有语音,以及语音的起点
。
)
短时相关分析
短时平均幅度差函数
在实际应用中,
短时平均过零率容易受到
A/D
转换是的直流偏移、
50Hz
交流电源的
干
扰
以及噪声的影响
.
减少这些干扰可以有两种方法:
一种是采用带通滤波器消除信号中的直
流和
50Hz
低频分量;另一种是用过门限率来修改过零率,减少随机噪声的影响。
< br>
N
?
1
?
k
短时自相关函数的定义
:
p>
R
n
(
k
)
?
x
n
(
m
)
x
< br>n
(
m
?
k
)
0
?
k
?
K
m
p>
?
0
(1)
说明当
时域信号为周期信号时,自相关函数也是周期性函数,两者具有同样的周期。
(2)Rn(k)
为偶函数,
Rn(k)
=
Rn(
-
k)
(3)Rn(0)
最大,
Rn(0)
?
|Rn(k)|,
Rn(0)=En,
对于确定信号,
Rn(0)
是信号能量;对于随机
信号或周期信号,
Rn(0)
是平均功率。
相关函数的作用
:
1.
区
分清
/
浊音
.
浊音语音的自相关函数具有一定的周期性。清音语音
的自相关函数不具有周期性,
类似噪声,
有点如语音信号本身。
2.
估计浊音语音信号的周期,
即估计基音周期。
短时平均幅度差函数的意义
:
短时自相
关函数是语音信号时域分析的重要参量,但由于
乘法运算所需要的时间长。
为了避免乘法,
一个简单的方法就是利用差值,
为此
常常采用另
一种与自相关函数有类似作用的参量,短时平均幅度差函数。
短时平均幅度差函数和自相关函数的关系是:
p>
(
k
)
?
2
?
(
k
)[
R
(
0
)
?
R
(
k
)]
0
.
5
?
(
k
)
?
0
.
6
p>
~
1
.
0
F
n
n
n
浊音是一个准周期信号,
在一帧语音内基音周期近似恒定,
< br>因此,
短时平均幅度差函数在浊
音语音的基音周期上出现
极小值,而在清音语音中没有明显的极小值。
语谱图
:
宽带语谱图
窄时窗,时间分辨率高,频率分辨率低
纵条纹
窄带语谱图
横条纹
窄时窗,时间分辨率低,频率分辨率高
LPC:
提供了预测功能;提供了声道模型和声道模型的参数估计方法;
基本思想:
语音样
本之间存在相关性,一个语音信号
的样本可以用过去若干个样本的线性组合来逼近;
要想使模型
的假定较好的符合语音的实际产生模型主要考虑两个因素:
模型的阶数要与共
振峰的个数相吻合;声门脉冲形状和口唇辐射影响的补偿。
考虑了上述两个
因素的线性预
测分析,
预测误差序列近似于白噪声序列,
表明由某一短时信号所得到的线性预测系数能较
好的描述产生这段语音
的声道特性。
线性预测阶数
P
的选择
:
P
的选择应
综合考虑谱估计精度、计算量、存储量;原则:保证有
足够的极点来模拟声道的谐振结构
,
每
kHz
一
个共振峰,每共振峰需要两个极点,外加几个
fs
逼近零点的极
点;
经验公式:
P
< br>?
?
?
分析帧长
N
的选择
1000
N
小,计算量小;
N
大
,估计谱的精度高
;N
可取
2
~
3
个基音周期长度;
LPC
谱估计的特点
:在信号能量较大
的区域(谱峰值的地方)
,
LPC
谱和
信号谱很接近;而
在谱的谷底相差比较大。
倒谱分析:
由卷积信号求得参与卷积
的各个信号的过程称为
解卷过程
。
<
/p>
解卷算法可以分为两大类:第一类
是首先为线性系统
V(Z)
建立一个模型,然后对模型参数
按照某种最
佳准则进行估计,
这种方法称为参数解卷方法。
采用的模型可以
分为全极点模型
(
AR
模型)和零极点
模型(
ARMA
模型)
,如果采用最小
均方误差准则对
AR
模型进行估
计,就
得到线性预测编码算法
(LPC)
。
第
二类
算法称为非模型解卷。同态信号处理完成解卷
?
-
-
-
-
-
-
-
-
-
上一篇:英语不规则动词及不规则名词复数表
下一篇:SAT 单词必备!