当前位置 —论文—本科论文— 范文

关于数据库论文范文素材,与基于动词相似度的特征分类方法相关本科毕业论文范文

本论文是一篇关于数据库本科毕业论文范文,关于基于动词相似度的特征分类方法相关本科论文范文。免费优秀的关于数据库及特征及说话方面论文范文资料,适合数据库论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

【摘要】本文提出了一种新的说话人特征分类方法,基于计算动词相似度理论,建立距离和趋势的评价模型,通过计算特征向量与k-means算法聚类所得的聚类中心的相似度矩阵,将说话人个性特征从MFCC特征域映射到说话人相似度属性空间中,形成新的特征向量集,这样,每个说话人的特征向量将被聚为在距离和变化趋势上最具相似性的k分类.之后,利用GMM模型在属性空间内进行联合概率分析、匹配,建立新的说话人识别系统.本文采用标准TIMIT语音库与NIST语音库在该识别系统中进行一系列实验,结果表明,该基于新的优化特征分类的识别系统,对比传统的说话人识别系统,在等错误率上有很好的提高.

【关键词】计算动词相似度；特征分类；GMM模型；说话人识别

AFeatureClassificationMethodBasedonVerbSimilarity

JingyunQiu,LinLi

(DepartmentofElectronicEngineering,XiamenUniversity,XiamenFujian361005,China)

Abstract：Anewstrategyoffeatureclassificationmethodforspeakerrecognitionbasedonputationalverbsimilarityispresented.Ontheevaluationmodelwiththesimilarityfunctionofbothdistanceandtrendinmelcepstraldomain,thenewfeaturevectorsetswereassortedafterparingclusteringcenters,whichwereobtainedbyutilizingk-meansalgorithm.Asaresult,thefeaturevectorsofeachspeakerwereclassifiedintokclusters,andthevectorsineachclusterhadthemostsimilarityinbothdistanceandvariationtrend,butseparatedthoseinotherclusters.Moreover,anewspeakerverificationsystemwasestablishedbyusingGMMmodelforanalyzingandmatchingthejointprobabilityinthenewfeatureclassificationspace.TheexperimentswiththestandardTIMITdatabasesandNISTdatabaseswereimplemented,andtheresultsshowedtheproposedalgorithmachievedgoodclassificationperformance.

该文转载于 http://www.sxsky.net/benkelunwen/060276687.html

Keywords：putationalverbsimilarity；featureclassification；GMM；speakerrecognition

1.引言

对于说话人识别系统而言,一个能有效区分说话人的特征提取和分类方法是非常重要的,因而,在语料中找到能够表征说话人的个性特征及其特定的特征映射空间就显得尤为重要.目前,大多数说话人识别系统所采用的特征参数主要有：表征说话人听觉特性的梅尔频率倒谱系数（MelFrequencyCepstrumCoefficient,MFCC）[1]和表征说话人声道信息的线性预测倒谱系数（LinearPredictionCepstrumCoefficient,LPCC）[2],二者都是说话人识别系统中的主流特征分析方法,并应用于模型匹配如隐马尔可夫模型（HMM,HiddenMarkovmodels）[3]、高斯混合模型（GMM,GaussianMixturemodels）[4].

近年来,为了提高说话人识别系统的性能,在MFCC和LPCC的基础上还增加了一些辅助特征参数,如harmonic结构特征[5]、残差相位信息[6]、高阶统计特征等.相对于众多的谱分析方法,MFCC特征参数符合人耳听觉特性,较好的反映说话人的个性特征,但这种传统的MFCC特征参数包含了大量的冗余信息,在噪声环境下识别性能很不稳定.因此,很多人在特征映射空间和分类器上做了很多改进,如,McIntyre[7]提出一种改进的GP（GeicProgramming）多重分类器,能在增加训练说话人的同时减少系统的训练时间并优化系统的性能.TaoBan[8]提出的分类器是通过构造决定函数的最小距离准则,将单分类器转为多重分类器进行分类.在这些方法都一定程度上改善了特征参数的缺点.

在传统的说话人识别系统的识别阶段,多样化的识别模型被广泛的应用于识别系统中,主流的如矢量量化（VQ,VectorQuantization）[9]、高斯混合模型（GMM）、隐马尔可夫模型（HMM）、支持向量机模型（SVM,SupportVectorMachines）[10]、神经网络（NN）[11]以及混合模型等.

本文提出了一种新的说话人特征分类方法.在传统MFCC特征向量的前提下,结合一阶二阶特征形成一个新的MFCC动态加权参数,之后,采用计算动词相似度理论,将新的动态加权MFCC参数集从传统的梅尔倒谱域映射到一个新的空间,称为“相似度属性空间”,主要由梅尔倒谱域中原参数的距离相似度和变化趋势相似度联合确定.这种参数空间映射首先针对单个或多个说话人分析其特征参数（N维）,提取M个共性特征中心作为该说话人属性空间的基坐标（2M

本文的第二部分介绍的是改进算法的核心部分：相似度映射的概念及其应用于说话人识别系统；第三部分是在GMM基础上将核心算法结合动态MFCC特征参数并仿真实验,并对实验结果进行分析.最后是结论.

2.特征参数相似度映射

2.1计算动词相似度定义

计算动词相似度（简称动词相似度）[12][13],是综合考虑频率、距离、趋势、幅值等,作为测量模板特征向量与待测特征向量之间的比较因子,得到一个评估二者相似程度的值,即为相似度.

采用动词相似度的概念,我们可以只考虑能够区分不同说话人的个性特征方面,如频率分布、曲线形状近视程度、二次谱特征等,而忽略掉说话人语音中共性之处,如背景噪音和声道噪声等,最大限度的区分不同说话人,而转换得到的空间,则是后期模型匹配所在的相似度属性空间.

写数据库论文的方法
播放:31874次评论:5644人