推广 热搜: 论文    自考报名  招生简章  开始    成考分数线  现场确认时间  进行  冲刺阶段 

基于16位单片机的语音电子门锁系统

   日期:2021-07-27     来源:www.dongzhu98.com    作者:未知    浏览:260    评论:0    
核心提示:摘要:介绍使用声纹辨别技术、在凌阳SPCE061A单片机上达成的一种语音电子门锁身份认证系统。

摘要:介绍使用声纹辨别技术、在凌阳SPCE061A单片机上达成的一种语音电子门锁身份认证系统。实验结果表明,系统性能稳定,辨别成效好,可以竞价用。
关键字:声纹辨别 基于周期 线性预测 模式匹配 DTW
生物辨别技术是借助人体生物特点进行身份认证的一种技术,是现在公认的最为便捷与安全的辨别技术。因为每一个人的生物特点具备与别的人不一样的唯一和在肯定时期内不变的稳定性,不容易伪造和假冒,所以借助牲辨别和技术进行身份认证,安全、准确、靠谱。
在生物辨别范围中,声纹辨别,也称为说话人辨别,以其独特的便捷性、经济性和准确性等优势遭到世人瞩目,并且益成为大家平时生活和工作中要紧且常见的安全认证方法。声纹辨别是一种依据说话人语音波形中反映说话生活理和行为特点的语音参数,自动辨别说明人身份的技术。
声纹识技术可分为两类,即说话人辨认和说话人确认。前者用以判断某段语音是若干人中的哪一个所说的,是多选一的问题;而后者用以确认某段语音是若干人中的哪一个所说的,是多选一的问题;而后者用以确认某段语音是不是是指定的某个人所说的,是一对一辨别的问题。从另一方面,声纹辨别又有与文本有关和与文本无关两种,依据特定的任务和应用,应用范围不同。与文本有关的声纹辨别系统需要用户根据规定的内容发音,每一个人的声纹模型逐个被精确地打造,而辨别时也需要按规定的内容发音,因此可以达到较好的辨别成效;而与文本无关的辨别系统则不规定说话人的发音内容,模型打造相对困难,但用户用便捷,应用范围较宽。
本文介绍的语音电子门锁是一种在凌阳16位单片机SPCE061A上达成的与文本有关的说话人确认系统。该系统主要由说话人辨别模块、门锁控制电机与门锁等部分组成。在练习时,说话人的声音通过麦克风进入说话人语音信号采集前端电路,由语音信号处置电路对采集的语音信号进行特点化和语音处置,提取说话人的个性特点参数并进行存储,形成说话人特点参数数据库。在辨别时,将待辨别语音与说话人特点参数数据库进行匹配,通过输出电路控制门锁电机,最后达成对门锁的控制。

1 算法原理

说话人辨别算法原理框图如图1所示。
1.1 预处置
(1)去噪
对麦克风输入的模拟语音信号进行量化和采样,获得数字化的语音信号;再将含噪的语音信号通过去噪处置,得到干净的语音信号后并通过预加重技术滤除低频干扰,特别是50Hz或60Hz的工频干扰,提高语音信号的高频部分,而且它还可以起到消除直流漂移、抑制随机噪声和提高清音部分能量有哪些用途。
(2)端点测试
本系统使用语音信号的短时能量和短时过零率进行端点测试。语音信号的采样频率为8kHz,每帧数据为20ms,共计160个采样点。每隔20ms计算一次短时能量和短时过零率。通过对语音信号的短时能量和短时过零率测试可以剔除掉静默帧、白噪声帧和清音帧,最后保留对求取基音、LPCC等特点参数很有用的浊音信号。
1.2 特点提取
在语音信号预处置后,接着是特点参数的提取。特点提取的任务就是提取语音信号中表征人的基本特点。
1.2.1 特点参数的选取
特点需要可以有效区域分不一样的说话人,且对同一说话人的变化维持相对稳定,同时需要特点参数计算方便,最好有高效迅速算法,以保证辨别的实时性。
说话人特点大体可归为下述几类:
(1)基于发声器官如声门、声道和鼻腔的生理结构而提取的参数。如谱包络、基音、共振峰等。其中基音可以非常不错地刻画说话人的声带特点,在非常大程度上反映了人的个性特点。
(2)基于声道特点模型,通过线性预测试打分析得到的参数。包括线性预测系数(LPC)与由线性预测导出的各种参数,如线性预测倒谱系数(LPCC)、部分有关系数、反射系数、对数面积比、LSP线谱对、线性预测残差等。依据前人的工作成就和实质测试比较,LPCC参数不但能较好地反馈声道的共振峰特质,具备较好地辨别成效,而且可以用比较容易的运算和较快的速度求得。
(3)基于人耳的听觉机理,反映听觉特质,模拟人耳对声音频率感知的特点参数。如美国尔倒谱系数(MFCC)等。MFCC参数与基于线性预测的倒谱剖析相比,突出的优点是不依靠全极点语音产生模型的假定,在与广西无关的说话人辨别系统中MFCC参数可以比LPCC参数更好地提升系统的辨别性能。
除此之外,大家还通过对不同特点参数目的组合来提升实质系统的性能。当各组合参量间有关性不大时,会有较好的成效,由于它们分别反映了语音信号的不同特点。
在计算机平台的仿真实验中,通过各种参数的实质比较,使用MFCC参数比使用LPCC参数有更好的辨别成效。但在SPCE061A平台上做实时处置时,与LPCC系统相比,MFCC系数计算有两个缺点:一是计算时间长;二是精度难以保证。因为MFCC系统的计算需要FFT变换和对数操作,影响了计算的动态范围;要保证系统辨别的实时性,就只有牺牲参数精度。而LPCC参数的计算有递推公式,速度和精度都可以保证,辨别成效也满足实质需要。
本系统使用了基音周期和线性预测倒谱系数(LPCC)一同作为说话人辨别的特点参数。
1.2.2 LPCC参数的提取
基于线性预测试打分析的倒谱参数LPCC可以通过容易的递推公式由线性预测系数求得。递推公式如下:

其中p为LPC模型的阶数,也是模型的极点个数。

(1)LPC模型阶数p的确定
为使模型假定更好地符合语音产生模型,应该使LPC模型的阶数p与共振峰个数相吻合,第二是考虑声门脉冲形状和口唇辐射影响的补偿。一般一对极点对应一个共振峰,10kHz采样的语音信号一般有5个共振峰,取p=10,对于8kHz采样的语音信号可取p=8。除此之外为了弥补鼻音中存在的零点与其他原因引起的偏差,一般在上述阶数的基础上再增加两个极点,即分别是p=12和p10。实验表明,选择LPC剖析阶数p=12,对绝大部分语音信号的声道模型可以足够近似地逼近。P值选得过大虽然可以略微改变逼近成效,但也带来一些负用途,一方面是加强了计算量,另一方面大概增添一些非必须的细则。
(2)线性预测系数的求取
自有关解法主要有杜宾(Durbin)算法、格型(Lattice)算法和舒尔(Schur)算法等几种递推算法。其中在杜宾算法是现在最常见的算法,而且在求取LPC系数时计算量也量小,本系统使用该递推算法。
1.2.3 基音参数的提取
基音估计的办法不少,主要有基于短时自有关函数和基于短时平均幅度差函数(AMDF)等基音估计办法。
(1)基于短时自有关函数的基音估计
短时自有关函数在基音周期的整数倍地方存在较大的峰值,只须找出第一最大峰值的地方就可以估计出基音周期。
(2)基于短时平均幅度差函数(AMDF)的基音估计
基于短时平均幅度差函数(AMDF)在基音周期的整数倍地方存在较大的谷值,找到第一最大谷值的地方就可以估计出基音周期。这种办法的缺点是当语音信号的幅度迅速变化时,AMFD函数的谷值深度会减小,从而影响基音估计的精度。
事实上第一最大峰(谷)值点的地方有时并不可以与基音周期吻合,第一最大峰(谷)值点的地方与短时窗的长度有关且会遭到共振峰的干扰。通常窗长至少应大于两个基音周期,才可能获得较好的估计成效。语音中最长基音周期值约为20ms,本系统在估计基音周期时窗长选择40ms。为了减小共振峰的影响,第一对语音进行频率范围为[60,900]Hz的带通滤波。由于最高基音频率为450Hz,所以将上限频率设为900Hz可以保留语音的1、二次谐波,降低频率为60Hz是为了滤除50Hz的电源干扰。
以上两种办法都是对语音信号本身求相应的函数。本系统使用的基音估计办法是:第一对带通滤波后的短时语音信号进行线性预测,求取预测残差;再对残差信号求自有关函数,找出第一最大峰值点的地方,即得到该段语音的基音估计值。实验表明,通过残差求取的基音轨迹比直接通过语音求取的基音轨迹成效更好,如图2所示。图2中横坐标为语音帧数,纵坐标为8000/f,其中f为基音频率。

[1][2]下一页

 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报