优秀的毕业设计论文网
计算机 JAVA 电子信息 单片机 机械机电 模具 土木工程 建筑结构 论文
热门搜索词:网络 ASP.NET 汽车 电气 数控 PLC

声纹特征提取匹配技术研究

以下是资料介绍,如需要完整的请充值下载.
1.无需注册登录,支付后按照提示操作即可获取该资料.
2.资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用.
  
资料介绍:
研究背景及意义 如今,身份鉴别活动已经应用到人们日常生活的许多方面,且已经被广泛地应用了许多年。例如,在银行存取资金时需要输入银行卡号的密码,在计算机上登陆需要输入口令等等。这些都是传统意义上的身份鉴别方式,主要是依靠持有物和口令来确认身份,但是持有物容易被伪造或丢失,口令则容易被忘记或盗用,与之相比,生物特征具有更好的安全性和可靠性,随时具备,与生俱来。生物特征包括指纹,声纹,人脸,瞳孔识别等等。其中指纹识别[2]技术很常见,并且这种技术已经十分成熟;人脸认证和瞳孔识别技术的数据获取比较困难;而人的声纹声纹特征作为人的基本生理特征,具有得天独厚,不易伪造,不易模仿和不可替代的作用,并且相对来说更容易获取,传统的声纹输入设备如电话、麦克风等都可以作为声纹识别的输入设备,不需要额外的成本。声纹识别的应用领域十分广阔,可以应用在: .??? 说话人核对:在电子商务和电话委托等服务中,以用户的声音作为认证手段实现转帐汇款等;用特定人的声音实现机密场所的出入检查等。 司法取证:判断嫌疑犯的说话声音和犯罪时所记录的声音是否吻合。. 医学应用:如使声纹识别系统只响应患者的命令,从而实现对患者假肢的控制等。 声控电子密码锁:实行执行军事指挥管和飞机驾驶员的口述命令,只有权限许可的操作人员才能进行的高级别操作等。 声纹识别(Voice Print Recognition)又称为说话人识别(Speaker Recognization)。声纹识别就是用待识别声纹信号和预先提取的说话人的声纹特征来确定或鉴别说话人的身份。人类的声纹包含着极其丰富的信息,不仅包含语意内容方面的信息,同时也包含有关说话人身份的个人信息。每个人由于自己独特的声道特J胜和发音特点,使其讲话具有区别于他人的特征,这是声纹识别的基本依据。声纹识别和声纹识别一样,都是通过对采集到的声纹信号进行分析和处理,提取相应的特征或建立相应的模型,然后据此做出判断;但它与声纹识别又有区别,其目的不是识别声纹的内容,而是识别说话人的身份,因此它不注重声纹信号的语义,而是希望从声纹信号中提取个人声纹特征。从这点上说,声纹识别是企求挖掘出包含在声纹信号中的个性因素,而声纹识别是从不同人的词语信号中寻找共同因素。由于以上区别,在处理方法上,说话人识别力图强调不同人之间的差别,而声纹识别力图对不同人说话的差别加以归一化,力争排除由不同说话人引起的差异。 1.2研究现状 对说话人识别的研究始于20世纪30年代。早期的工作主要集中在人耳听辨实验和探讨听音识别的可能性方面。随着研究手段和工具的改进,研究工作逐渐脱离了单纯的人耳听辨。Bell实验室的LGKesta用目视观察语谱图的方法进行识别,提出了“声纹(voice print)”的概念。之后,电子技术和计算机技术的发展,使通过机器自动识别人的声音成为可能。Bell实验室的Pruzan sky提出了基于模式匹配和概率统计方法分析的说话人识别方法,而引起信号处理领域许多学者的注意,形成了说话人识别研究的一个高潮,其间的工作主要集中在各 种识别参数的提取、选择和实验上,并将倒谱和线性预测分析等方法应用于说话人识别。二十世纪七十年代末至今,说话人识别的研究重点转向声纹中说话人个性特征的分离提取、个性特征的增强、对各种反映说话人特征的声学参数的线性或非线性处理以及新的说话人识别模式匹配方法上,如动态时间规整(DT助、主分量分析(PCA)、矢量量化(VQ)、隐马尔可夫模型似MM)、人工神经网络方法(NN)等。由于应用的需求和数字信号处理技术的飞速发展,说话人识别的研究得到了广泛而深入的发展。在国际声学、声纹和信号处理会议(ICAsSP,Internationaleo硫reneeonAeoustic,spee只hand51助alProeessing)论文集中,每年都有关于说话人识别的专题。说话人识别的研究已经逐渐从实验室走向实际应用在国外,如今声纹识别技术已经逐渐投入实际应用,AT&T应用声纹识别技术研究出了智慧卡(smartcard),已经应用于自动提款机。欧洲电信联盟在电信与金融结合领域应用声纹识别技术,于1998年完成了CAVE(CallerVerificationin BankingandTeleeorn-m俪cation)计划,并于同年又启动了pICAssO(pioneering eallAuthentieation允:seeuxeservieeoperation)计划,在电信网上完成了声纹识别。同时摩托罗拉公司和Visa等成立了V-co~erce联盟,希望实现电子交易的自助化,其中通过声音确定说话者身份是该项目的重要组成那个部分。国内对声纹识别的研究主要集中在汉语自然语言处理方面,对声纹识别方面的研究相对要少得多,在中国主要的自然语言研究单位有:中科院声学研究所、北京大学计算语言学研究所、清华大学智能技术与系统国家重点实验室之声纹技术中心、微软研究院自然语言研究小组、IBM中国研究中心自然语言处理小组等单位。 1.3本文章节安排 本文章节安排如下:第一章? 介绍课题的研究背景意义和研究现状第二章? 介绍软件的开发平台和工具第三章? 声纹特征提取匹配基本原理第四章? 具体阐述软件的设计与实现第五章 软件测试 常用的说话人识别方法有模板匹配法、统计建模法、神经网络法及上述方法的相互融合。 一、模板匹配法 在模板匹配法中,最有效的方法是VQ说话人识别方法[31?32]。VQ最初是实现数据压缩、用于声纹编码的一种有效工具。将VQ应用于说话人识别中主要是应用它能将声纹动态聚类的功能,实现非监督学习方法。矢量量化说话人识别的基本思想为:从经验上看,凡是表征同一个说话人的样本,其特征矢量在空间分布应该是相互靠近的,而不同人的特征矢量之间的距离应该大得多。矢量量化具有以下3个要点: ①? 选定某种距离度量作为样本间的相似性度量; ②? 确定某个评价聚类结果的准则函数; ③ 给定某个初始分类,然后用迭代算法找出使准则函数取极值的最好聚类结果。 二、统计模型法 统计模型方法是在给定模型λ,然后用其计算产生一个观测值 的条件概率。该模型为用说话人的训练语料得到的特征矢量估计出的最大后验概率密度函数p(λO),此时的λ即为最优化参数,这样每个说话人训练出一个特有的模型。识别时,给定概率模型(i1,2,...,N,N为说话人个数)后,每一个观测值的条件概率即被确定,当一个序列观测值的条件概率被确定下后,那么最大者就认为是被识别的对象。统计模型识别方法有隐马尔可夫(Hidden Markov Models,HMM)模型和高斯混合模型 (Gaussian Mixture Models,GMM)。 三、人工神经网络(ANN)方法 人工神经网络在一定程度上模拟了生物的感知特性,它是一种分布式并行处理结构的网络模型,具有自组织和自学习能力、较强的复杂分类边界区分能力以及对不完全信息的鲁棒性(Robustness),其性能近似理想的分类器。其缺点是训练时间长,动态时间长、网络规模随说话人数目增加时使训练难度增加。以上三种说话人识别方法可以相互融合,如有人已将HMM、GMM与ANN方法结合起来应用于说话人识别系统。正如说话人特征矢量提取的方法研究一样,说话人识别方法也有在不断完善。