首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
张珑  李海峰  马琳  王建华 《声学学报》2014,39(5):639-646
提出一种汉语普通话水平测试中儿化音的自动检测与评价方法。在现有计算机辅助发音评测系统的框架下,深入分析儿化音的发音规律和声学特性,将儿化音的检测与评价转化成典型的分类问题进行处理。经过挑选多个有代表性的声学特征,并尝试多种不同的分类算法,结果表明,集成分类回归树(Boosting CART)强化分类模型,能充分利用儿化音的各种声学特征,分类正确率达到92.41%。通过对声学特征组的进一步分析,发现共振峰、发音置信度、时长是表达儿化音的最重要线索,利用这些线索能有效地实现对儿化音的自动检测与评价。   相似文献   

2.
提出了基于发音特征单个维度的置信度算法,并基于此对发音特征的各个维度展开分析.分析不仅验证了融合的必要性,同时也展示了发音特征各维度之间以及和隐马尔可夫模型之间的大量冗余.为了去除冗余,提出了用子集选择的方法进行优化.对比所有都用的情况,基于发音特征紧凑子集的语音识别置信度估计,在等错率上取得了12.7%的相对下降.把经过优化后的基于发音特征的语音识别置信度估计和基于隐马尔可夫模型的语音识别置信度进行融合,在保持集内识别率不损失的前提下,显著提高了语法外输入测试的拒识性能:在相同参数下,在开发集和测试集上分别取得了34%和35.3%的显著改善.  相似文献   

3.
本文在分析了汉语单音节发音的音节结构的基础上,定义了基于声韵母类的语音识别单元,从声学角度确定了用于汉语全音节识别系统的声学单元,并研究了这些声学单元的检测一致性及基于这些单元的识别系统的鲁棒性。文中还对大量的发音人的声母类发音的长度作了统计,给出了基于本文给出的分割算法和本文定义的声母单元下的声母长度预分类方法。通过在非特定人全音节汉语语音识别系统上的应用表明,本文定义的语音识别单元具有很高的检测一致性,建立在其上的识别,系统也具有很高的鲁棒性;文中给出的预选方法在最好的情况下,可以减少一半以上的运算量,而预选精度几乎达到100%。  相似文献   

4.
李贤  於俊  汪增福 《声学学报》2014,39(4):509-516
面向情感语音转换,该文提出了一种韵律转换方法。该方法包含基频转换和时长转换两个部分,前者选择离散余弦变换(DCT)参数化基频,根据基频的层次结构特点,将基频分解为短语层和音节层两个层次,使用基于混合高斯模型(GMM)的转换方法对两个层次分别进行转换;后者使用基于分类回归树(CART)的方法以声韵母为基本单位对时长进行转换。一个包含三种基本情感的语料库用作训练和测试,客观评测以及主观评测实验结果显示该方法可有效进行情感韵律转换,其中悲伤情感在主观实验中达到了接近100%的正确率。   相似文献   

5.
一种基于音素模型感知度的发音质量评价方法   总被引:1,自引:1,他引:0       下载免费PDF全文
张茹  韩纪庆 《声学学报》2013,38(2):201-207
为了提高发音质量判别精度,提出了一种基于音素模型感知度的发音质量评价方法。它采用不同语音样本集合下样本声学特征的对数后验概率期望差作为音素模型对变异发音的感知度,并以此为基础,生成各音素对应的识别模型候选集。实验表明,所提出的方法使语音识别网络候选音素模型集合尺寸减少约95%;在非母语语音数据库上,该方法评分与人工专家打分相关性为0.828,基于该方法得到的声韵母错误检出率为70.8%,声调错误检出率为42.5%,均优于其它方法。   相似文献   

6.
近红外光谱技术是一种通过分析样本的特征光谱数据,实现定性或定量分析的无损检测方法,特征数据的完整性和代表性决定了所建模型的性能,而现有分析方法只能实现光谱子区间特征筛选,导致分析模型稳定性差、且难以再优化。为实现近红外光谱区间高维数特征提取,有效提高近红外光谱定性分析模型的精度和稳定性,提出一种基于最小绝对收缩和选择算法(LASSO)的光谱特征筛选方法,并以我国特色高值外贸产品云南松茸为分析对象进行聚类应用研究,讨论了该方法对于高维光谱特征筛选的有效性、分析对比了LASSO筛选特征变量及主元分析(PCA)降维算法所建松茸真伪甄别及食用菌分类模型的预测精度及稳定性。通过调研发现,云南产鲜松茸因其独特外形易于分辨,而片状的干松茸失去其独有的外形特征,导致国内干松茸掺假事件屡禁不止。选取云南产松茸、杏鲍菇、老人头、姬松茸四种干样共166样本数据进行分析,采用光谱范围为900~1 700 nm的NIRQuest512型近红外光谱仪获得166×512维原始光谱数据,剔除异常数据后采用标准正态变换对光谱数据进行预处理。在此基础上,利用LASSO筛选出全光谱区间的特征变量,再使用Kennard-Stone法并结合典型线性(KNN)和非线性建模(BP)算法,构建松茸真伪甄别模型和食用菌分类模型,对两种模型进行盲样测试,并分析了LASSO与PCA算法的不同点,最后使用蒙特卡罗方法检测两种模型的稳定性。实验结果表明基于LASSO光谱特征选择的松茸真伪甄别模型和食用菌分类模型预测精度和稳定性均高于PCA方法,其中基于原始光谱数据所建真伪甄别模型的预测准确率为69.57% (BP)和60.87% (KNN),食用菌分类模型准确率为67.39% (BP)和65.22% (KNN),基于LASSO特征筛选的真伪甄别模型预测准确率分别达到100% (BP)和78.26% (KNN),食用菌分类模型预测准确率分别达到89.13% (BP)和80.43% (KNN),对两种模型进行10次蒙特卡罗实验,其结果平均值分别为99.93%和97.22%,由此可知,与PCA等数据降维算法相比,LASSO可实现全光谱区间的光谱特征选择和数据降维,有效地提高了近红外定性分析模型的预测性能,为近红外分析提供了一种新的特征筛选方法。  相似文献   

7.
高光谱与机器学习相结合的大白菜种子品种鉴别研究   总被引:1,自引:0,他引:1  
提出了基于高光谱信息的大白菜种子品种分类识别方法。利用近红外高光谱图像采集系统采集了八种共239个大白菜种子样本;提取15 pixel×15 pixel感兴趣区域平均光谱反射率信息作为样本信息;采用多元散射校正预处理方法对光谱进行消噪;验证了Ada-Boost 算法、极限学习机(extreme learning machine, ELM)、随机森林(random forest, RF)和支持向量机(support vector machine, SVM)四种分类算法的分类判别效果。为了简化输入变量,通过载荷系数分析选取了10个大白菜种子品种分类判别的特征波长。实验结果表明,四种分类算法基于全波段的分类识别对81个预测样本的正确区分率均超过90%,最优的分类判别模型为ELM和RF,识别正确率达到了100%;以10个特征波长的分类判别精度略有下降,但输入变量大幅减少,提高了信息处理效率,其中最优分类判别模型为EW-ELM模型,判别正确率为100%,因此以载荷系数选取的特征波长是有效的。利用高光谱结合机器学习对大白菜种子品种进行快速、无损分类识别是可行的,为大白菜种子批量化在线检测提供了一种新的方法。  相似文献   

8.
随着中药制剂存储时间的延长,其有效成分含量逐渐降低。化学检测手段损耗样品、检测时间长、成本高,利用近红外光谱对不同年份的经典名方安胎丸进行年份鉴别。为探讨这种无损、快速质量控制方式的可行性,采集了三年的105粒样本在1 000~1 799 nm波段近红外光谱吸光度数据,随机选择80个作为训练集, 25个作为测试集。首先采用连续投影算法(SPA),消除原始光谱数据中的冗余信息,对输入全光谱进行优化降维,根据测试集的内部交叉验证均方根误差值,从输入的800个波长中提取出11个特征波长,分别是:(1 692, 1 714, 1 405, 1 001, 1 114, 1 478, 1 514, 1 788, 1 202, 1 014, 1 164) nm;然后建立支持向量机(SVM)分类模型,由于SVM模型中的参数选取对分类正确率影响很大,利用粒子群优化(PSO)算法,对SVM模型中惩罚参数C和核函数参数进行寻优,形成PSOSVM分类模型;最后将SPA降维后的特征波长输入到PSOSVM分类算法中。用Matlab软件进行仿真测试,分别构建SVM, SPA-SVM和本文的SPA-PSOSVM三种方法分类模型,分类测试正确率分别达到了76%, 92%和100%。从仿真结果可以看出, SPA波长优选可有效地降低光谱信息中存在的冗余信息,减少建模所需的时间,结合PSOSVM分类模型降低了模型的复杂度,提高分类精度。结果证实,依照所建立的利用近红外算法,可以准确无损区分中药制剂安胎丸生产的年份,该研究可为中药制剂年份间差异评价提供一种思路。  相似文献   

9.
针对润滑脂分类,提出了基于布谷鸟搜索的红外光谱波段筛选方法,有效剔除了易受噪声等环境影响的红外光谱区域、实现了对庞大光谱数据进行特征选择和降维处理、通过筛选光谱最优波段建立了更加准确高效的润滑脂分类模型。以三类不同稠化剂润滑脂的红外光谱数据为研究对象,采用主成分分析法(PCA),对不同波段的红外光谱数据进行压缩,以提取的红外光谱主要成分作为输入,润滑脂稠化剂类别作为输出,通过布谷鸟搜索法(CS),对主要成分权重和分类核参数进行准确度寻优训练,建立分类识别预测模型。对所建立的模型再进行分类准确性测试,得到模型测试结果准确度,建立红外光谱波段和测试准确度之间的联系,得到润滑脂最优类别识别模型和最优分类波段。对所建立的模型再进行分类准确性测试,结果显示:经过布谷鸟搜索法训练加权后的主要特征呈现明显聚类现象,可以得到分类核,实现对润滑脂种类的准确识别;在搜索过程中提供了区分不同润滑脂的推荐波段和特征峰,使对润滑脂的正确鉴别概率由全波段建立分类模型的94.44%提高到筛选后特征波段建立分类模型的100%,并减少了运算时间、提高了搜索运行效率。  相似文献   

10.
为了实现固态发酵过程状态的快速监测,以饲料蛋白固态发酵为实验对象,开展了基于近红外光谱分析技术的饲料蛋白固态发酵过程状态定性识别研究。首先利用Antaris Ⅱ型傅里叶变换近红外光谱仪采集140个固态发酵物样本的近红外光谱,并采用标准正态变换(SNV)光谱预处理方法对获得的原始光谱进行预处理;其次,采用谱回归判别分析(SRDA)法对预处理后的近红外光谱进行特征提取;最后,采用最近邻(NN)分类算法作为弱分类器建立固态发酵过程状态识别模型,并对测试集样本进行识别。结果显示,与利用主成分分析(PCA)法和线性判别分析(LDA)法提取的光谱特征建立的识别模型结果相比较,SRDA-NN识别模型获得的结果最佳,在测试集中的正确识别率达到94.28%;为了进一步提高识别模型的准确率,将自适应提升法(Adaboost)与SRDA-NN方法结合,提出了Adaboost-SRDA-NN集成学习算法来建立饲料蛋白固态发酵过程状态的在线监测模型。通过Adaboost算法提升后的SRDA-NN模型预测性能得到了进一步增强,Adaboost-SRDA-NN模型在测试集中的正确识别率达到100%。试验结果表明:在近红外光谱定性分析模型校正过程中,SRDA方法能有效地对近红外光谱数据进行特征提取,以实现维数约简;另外,Adaboost算法能很好地提升最终分类模型的预测精度。  相似文献   

11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号