首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
指出汉语单字语音存在一种可截尾特性,并且得到与之相关的三个结论(称为尾音可切除原则):(1)如果适当切除单字部分青尾特征,识别率不会明显下降,甚至有所提高.(2)切尾后识别时间明显缩短,分析和实验结果表明:若采用动态时间规整算法(DTW),识别时间与特征矢量长度的平方成正比关系.(3)实验指出,音尾特征的截除极限为特征矢量总长度的1/3.根据上述原则,从假设一检验的认知理论出发,提出一种汉语连接词的识别算法,并在DTW模型上得以实现.实验测试集包括200个特定人发音样本,其中2字词162个,3字词22个,4字词16个,正识率为91%.该算法对待识词的字数没有限制,井且随待识字数的增加,识别时间只作线性增长.  相似文献   

2.
本文在分析了汉语单音节发音的音节结构的基础上,定义了基于声韵母类的语音识别单元,从声学角度确定了用于汉语全音节识别系统的声学单元,并研究了这些声学单元的检测一致性及基于这些单元的识别系统的鲁棒性。文中还对大量的发音人的声母类发音的长度作了统计,给出了基于本文给出的分割算法和本文定义的声母单元下的声母长度预分类方法。通过在非特定人全音节汉语语音识别系统上的应用表明,本文定义的语音识别单元具有很高的检测一致性,建立在其上的识别,系统也具有很高的鲁棒性;文中给出的预选方法在最好的情况下,可以减少一半以上的运算量,而预选精度几乎达到100%。  相似文献   

3.
张珑  李海峰  马琳  王建华 《声学学报》2014,39(5):639-646
提出一种汉语普通话水平测试中儿化音的自动检测与评价方法。在现有计算机辅助发音评测系统的框架下,深入分析儿化音的发音规律和声学特性,将儿化音的检测与评价转化成典型的分类问题进行处理。经过挑选多个有代表性的声学特征,并尝试多种不同的分类算法,结果表明,集成分类回归树(Boosting CART)强化分类模型,能充分利用儿化音的各种声学特征,分类正确率达到92.41%。通过对声学特征组的进一步分析,发现共振峰、发音置信度、时长是表达儿化音的最重要线索,利用这些线索能有效地实现对儿化音的自动检测与评价。   相似文献   

4.
董滨  赵庆卫  颜永红 《声学学报》2007,32(2):122-128
提出了一种以元音的共振峰模式为特征基于支持向量机算法的分类评估方法,用以对汉语普通话中的韵母发音水平进行客观测试。此算法为每个韵母分别训练全分类模型、子分类模型和评估模型,在两级分类的基础上对发音水平进行测试打分。实验结果表明,全分类模型可以达到90%以上的分类正确率,客观测试与专家主观评估的相似度达到82%,在性能上超过了传统的以倒谱系数为特征的隐含马尔科夫模型方法。  相似文献   

5.
俞铁城 《物理学报》1977,26(5):389-396
本文中提出了一个机器识别语言的模型。根据这个模型,提出一种将图样在时间域上规正的新方法。最后给出一组实验结果,正确识别率超过99%。这表明,该方案能应用于某些自动控制系统中。  相似文献   

6.
校正样本选择以及奇异样本剔除对于近红外光谱定量和定性建模非常重要。现有的识别奇异样本的方法一般都基于数据重心估计,需要一个经验的判断阈值,在很大程度上限制了其识别准确性和实用性。针对现有方法奇异样本识别准确率低的问题,改进了一种现有度量尺度-杠杆值,构造出一种新的基于强影响度的奇异样本识别算法。这种度量尺度在一定程度上减少了对数据重心的依赖,使正常样本更加聚集,拉开了奇异样本与正常样本的距离;同时,为了避免人工根据经验设定阈值的不合理性,引入统计学领域中跳跃度的概念,提出了一种自动阈值设定方法判别奇异样本。为了验证该算法的有效性,利用马氏距离、杠杆值-光谱残差法与该算法分别对200个代表性校正集样本中的异常样品进行剔除,然后通过偏最小二乘法(PLS)对剩余的校正集样本(以烟碱为指标)定量建模,并对60个代表性测试集样本进行预测,以交互验证均方根误差(RMSECV)、相关系数(r)和预测均方根误差(RMSEP)为评价指标比较各算法的优劣。实验对比结果表明,基于强影响度的奇异样本识别算法较现有方法明显提高了奇异样本识别的准确率,具有较低的RMSECV(0.104),RMSEP(0.112)以及较高的R(0.983),提高了模型的稳定性和预测能力。  相似文献   

7.
本文提出一种以声韵分割为基础的汉语无调单音节识别方法。这种方法由于引入声韵分割信息和声韵分段判别,显著改善了单音节的正识率。用三男一女的发音对全部403个汉语无调音节考核结果表明,第一位平均正识率为83.9%,前三位平均正识率为96.0%。  相似文献   

8.
汉语耳语标准频谱的测量与计算   总被引:1,自引:0,他引:1  
孙飞  沈勇  李炬  安康 《声学学报》2010,35(4):477-480
提出了与GB7348-87《耳语标准频谱》不同的汉语耳语功率谱密度级随频率的变化关系。在消声室中测量以提高测量信噪比,使用实时分析仪测量单个人耳语发音的长期声压频谱,并且对每个人的长期声压频谱做自归一化,通过数学方法将多个样本"混录",计算出汉语耳语的功率谱密度级。汉语耳语标准频谱的测量和计算结果可为一切产生、传输、接收和处理汉语耳语信号的系统及电声器件的设计提供依据。   相似文献   

9.
基于发音特征的汉语普通话语音声学建模   总被引:3,自引:0,他引:3  
将表征汉语普通话语音特点的发音特征引入汉语普通话语音识别的声学建模中,根据普通话发音特点,确定了用于区别普通话元音、辅音以及声调信息的9种发音特征,并以此为目标值训练神经网络得到语音信号属于各类发音特征的后验概率,将此概率作为语音识别的输入特征建立声学模型。在汉语普通话非特定人大词表自然口语对话识别系统中进行了实验验证,并与基于频谱特征的声学模型进行了比较,在相同解码速度下,由此方法建立的声学模型汉字错误率相对下降6.8%;将发音特征和频谱特征进行了融合实验,融合以后的识别系统相对基于频谱特征系统的汉字错误率相对下降10.1%。上述结果表明,基于发音特征的声学模型更加有效的实现了对语音特性的表征,通过利用发音特征和频谱特征的互补性,能够进一步实现对语音识别性能的提高。   相似文献   

10.
汉语发音质量评估的实验研究   总被引:2,自引:1,他引:1  
研究了发音评估系统中通用的置信度测度——后验概率算法,针对它存在的不足,提出了两种改进方案。首先,为了降低计算复杂度,传统算法采用了求最大值算法代替求和算法,在被测发音偏离目标音素集的情况下,这会严重降低后验概率的计算精度,本文提出基于扩展的音素混淆网络的后验概率算法。其次,为使置信度能评估不同语音段长的发音质量优劣,传统算法采用了后验概率的段长规整策略,研究分析发现声学似然值与时间的关系更为紧密,所以本文提出了基于声学似然值的时间规整方案。试验结果表明:与传统算法相比,采用改进的置信度算法能使平均打分错误率相对降低35%左右,有效地改善了计算机辅助语言学习系统的性能。   相似文献   

11.
基于CARS和K-S的马拉硫磷农药浓度吸收光谱预测模型研究   总被引:2,自引:0,他引:2  
利用马拉硫磷在紫外/可见光波长范围内的不同浓度梯度的吸光度光谱数据,建立其快速有效的定量预测分析模型。在预测模型的建立过程中,参与建模的波长变量和校正集样本的优劣对定量分析模型的预测能力有着决定性作用。首先对实验样本是否存在异常样本进行检查,然后将200.08~750.04 nm波长范围的光谱数据采用不同预处理方法并建立PLS模型,进而将预处理结果最优(均值中心化)的光谱数据采用竞争性自适应重加权采样(CARS)算法和蒙特卡洛无消息变量消除法(MC-UVE)分别筛选出关键波长变量并建立相应的PLS预测模型,模型结果表明, CARS算法在关键变量筛选的性能上优于MC-UVE算法;再将CARS算法筛选出的18个波长变量(为原来变量数的1.137 8%)结合Kennard-Stone (K-S)算法和蒙特卡洛交叉验证(MCCV)分别优选出的44个建模样本(原来样本数的88%)建立CARS-K-S_s-PLS和CARS-CCV_s-PLS定量预测模型,R■分别为0.998 2和0.998 9, RMSEP分别为0.863 4和1.026 2, RPD分别为24.163 5和20.330 1, CARS-K-S_s-PLS模型略优于CARS-CCV_s-PLS模型。结果表明, CARS算法能够淘汰与样本浓度相关性较弱的变量,同时有效剔除无关光谱信息, K-S算法能帮助选择更优的建模样本集,马拉硫磷农药的紫外/可见光吸收光谱结合CARS算法和K-S算法所建立的CARS-K-S_s-PLS模型能够用来定量预测马拉硫磷农药浓度。研究工作为利用光谱技术快速检测有机磷农药浓度提供一定的理论依据和实验基础,在有机磷农药快速检测领域具有良好的应用前景。  相似文献   

12.
石油作为重要的能源和工业原料,在造福人类社会的同时,其引起的环境污染问题日益严重。因此针对混合油液的快速、准确检测成为鉴别溢油来源和保护生态环境的重要内容。石油类物质一般由具有较强荧光特性的芳香烃成分及其衍生物组成,荧光光谱分析技术以其灵敏度高、分析速度快和受风化影响程度小等优点成为了混合油液检测的重要手段之一,并与二阶校正和三阶校正的各类算法相结合取得了较好的成分鉴别和浓度预测效果。但二阶校正算法普遍存在对噪声的容忍能力弱和对组分数敏感、收敛速度慢等不足,限制了在实际混合油液检测中的应用。针对上述存在的问题,将三维荧光光谱技术和交替加权残差约束四线性分解(AWRCQLD)算法相结合,提出一种用于混合油液检测的新方法。首先以乙醇作为溶剂,将航空煤油和润滑油按不同浓度比配制7个校正样本、4个预测样本和3个空白样本;然后利用FLS920荧光光谱仪采集拟进行成分检测的混合油液在不同实验温度条件下共42个样本的荧光光谱数据,并通过空白扣除的方法消除散射的干扰;再利用核一致诊断法和残差分析法估计出最佳的组分数;最后分别利用AWRCQLD算法、4阶平行因子(4-PARAFAC)算法和二阶校正算法解析样本的荧光光谱数据,做出混合油液样本的定性鉴别和定量预测。研究结果表明,经AWRCQLD算法解析后得到的航空煤油预测样本的回收率为96.7%~102.7%、预测均方根误差为0.015 mg·mL-1;润滑油预测样本的回收率为96.9%~101.7%、预测均方根误差为0.009 mg·mL-1;在不同实验温度条件构建的四维响应数阵能够更为准确地测定出航空煤油和润滑油的组分浓度,其回收率更高和预测均方根误差更小,满足准确定量分析的要求;AWRCQLD算法在航空煤油和润滑油样本的荧光光谱严重重叠的情况下,较之二阶校正算法和4-PARAFAC算法,AWRCQLD算法更能够体现出三阶校正算法所具有的优势,综合预测能力更强,达到了对混合油液进行快速检测的目的。该研究提供了一种不依赖于“物理和化学分离”的快速、准确的对混合油液进行检测的“数学分离”方法,为石油类混合油液检测提供了必要的技术支持。  相似文献   

13.
优质棉种是全面推广棉花精量播种技术的基础。采用近红外高光谱成像技术实现微破损棉种可视化识别,为棉种精选设备的研制奠定理论基础。以未破损和微破损两类棉种各540粒作为样本(其中405粒作为建模集,135粒棉种作为预测集),分批采集874~1 734 nm范围的样本高光谱图像,提取光谱数据并去除首尾两端明显噪声保留955~1 659 nm范围内光谱为棉种样本的光谱。首先使用Kennard-Stone(KS)算法进行样本划分,并通过平滑算法Savitsky-Golay(SG)对光谱进行预处理。采用二阶导数光谱(2nd spectra)方法、连续投影算法(SPA)和主成分载荷(PCA-loading)方法分别选取10,14和11个特征波长。基于全部光谱数据和特征波长建立偏最小二乘判别分析(PLS-DA)模型、K最邻近(KNN)模型和支持向量机(SVM)模型,SPA-PLS-DA模型取得了较好的结果,建模集和预测集的鉴别率分别为91.50%和90.33%。基于SPA-PLS-DA模型分别对未破损样本和微破损样本及其混合样本图像进行识别,取得了较好的识别结果,微破损棉种的识别率达90%以上。结果表明,结合近红外高光谱成像和图像处理技术,能够实现微破损棉种的可视化识别。  相似文献   

14.
关于语言平均频谱的内容和意义,以及语言噪声样本的优越性、它的制备和测量方法,我们已在《用语噪声法研究发音人的音色特征》一文中作了报道。1977—1978年,在进一步提高测量技术的基础上,我们又测量了多种通信条件下的汉语普通话平均频谱,并探讨了时序倒置信号的平均频谱及其听感效果。  相似文献   

15.
随着海洋中石油资源的不断开发,泄漏到海洋环境中的石油也日益增多,它不仅威胁着海洋生态环境,同时也严重影响着人们的身体健康。因此,快速、有效地检测出海洋环境中的石油类污染物对于保护海洋生态环境和人类健康具有重要意义。石油产品中含有大量的多环芳烃,其具有较强的荧光特性。因此,荧光光谱技术成为检测石油类污染物的重要手段之一。利用三维荧光光谱技术结合平行因子分析算法和模式识别方法,对石油类污染物进行表征和分类。首先,以海水和十二烷基硫酸钠(SDS)配制的胶束溶液作为溶剂,分别配制不同浓度的柴油、航空煤油、汽油和润滑油溶液,最终得到80个实验样本;然后,利用FLS920型荧光光谱仪采集实验样本的三维荧光光谱数据,并通过Delaunay三角形内插值法对所获得的三维荧光光谱数据进行去散射处理;其次,利用平行因子分析(PARAFAC)算法分解去散射后的三维荧光光谱数据,通过运用核一致诊断法和残差分析法对组分数进行估计;最后,为了建立稳健的分类模型,利用Kennard-Stone算法将80个实验样本分为60个训练集样本和20个测试集样本,运用K最近邻(KNN)算法、主成分判别分析(PCA-LDA)算法以及偏最小二乘判别分析(PLS-DA)算法分别建立分类模型,并利用灵敏度、特异性和准确率对分类效果进行评估。研究结果表明:三种分类模型对测试集中样本的识别准确率分别为85%, 90%和94%,其中, PLS-DA分类模型对测试集样本的识别准确率最高,具有最佳的分类效果。因此,在利用平行因子分析算法提取石油类污染物荧光光谱数据的基础上,结合模式识别方法可以很好的对不同种类油品进行分类研究。利用三维荧光光谱技术结合平行因子分析算法和模式识别方法快速、有效地检测油类污染物,为石油类污染物的快速检测提供了一种新的研究思路和重要参考。  相似文献   

16.
一种基于音素模型感知度的发音质量评价方法   总被引:1,自引:1,他引:0  
张茹  韩纪庆 《声学学报》2013,38(2):201-207
为了提高发音质量判别精度,提出了一种基于音素模型感知度的发音质量评价方法。它采用不同语音样本集合下样本声学特征的对数后验概率期望差作为音素模型对变异发音的感知度,并以此为基础,生成各音素对应的识别模型候选集。实验表明,所提出的方法使语音识别网络候选音素模型集合尺寸减少约95%;在非母语语音数据库上,该方法评分与人工专家打分相关性为0.828,基于该方法得到的声韵母错误检出率为70.8%,声调错误检出率为42.5%,均优于其它方法。   相似文献   

17.
奶粉的真伪和掺伪近年来受到广泛的关注,研究一种操作便捷,能准确、快速、全面鉴定奶粉品牌并实现奶粉掺假鉴别的新方法对于奶粉的质量控制具有重要的意义。为实现奶粉的真伪鉴别,采集三种品牌奶粉贝因美、飞鹤和雀巢的拉曼光谱,并利用拉曼谱图特征峰结合最近邻算法(nearest neighbor,NN)的模型对三种品牌奶粉进行识别,在10次交叉验证的基础上,平均识别率为99.56%。为实现奶粉的掺伪分析,将飞鹤奶粉与雀巢奶粉按不同质量比(0∶1,1∶3,1∶1,3∶1,1∶0)混合成五种掺伪奶粉,提取掺伪奶粉中的脂肪,采集脂肪样本的拉曼光谱,分别使用拉曼谱图特征峰结最近邻算法的模型和核主成分分析(kernel principal components analysis,KPCA)结合最近邻算法的模型对五种脂肪样本进行识别,10次交叉验证下的平均识别率分别为93.33%和98.89%,平均运算时间分别为0.085和0.104 s。实验证明:特征峰结合NN的算法可以快速实现对奶粉真伪的判别,但此算法不能很好的区分掺伪奶粉;拉曼光谱-KPCA-NN模型可以为奶粉的掺伪检测提供一种简便、准确、快速的方法。  相似文献   

18.
将三维荧光光谱技术、小波压缩和交替惩罚三线性分解算法(APTLD)结合,提出了一种鉴别掺伪芝麻油的新方法。利用荧光光谱仪测量纯芝麻油及掺伪芝麻油样本的三维荧光光谱,通过激发校正和发射校正消除仪器带来的误差,得到样本的真实三维荧光光谱数据;利用小波压缩对处理后的真实数据进行压缩,以减少冗余信息,其中压缩分数和数据恢复分数分别大于94.00%和98.00%;利用APTLD算法对压缩后的数据进行定性及定量分析,得到的回收率为97.0%~99.8%,预测方均根误差不大于0.120。研究结果表明,所提方法能够准确鉴别纯芝麻油及掺伪芝麻油样本,并对其组分含量进行预测。  相似文献   

19.
高光谱图像包含了大量的光谱信息和图像信息,采用高光谱成像技术对牛肉品种进行识别。获取可见-近红外(400~1000 nm)光谱范围内的安格斯牛、利木赞牛、秦川牛、西门塔尔牛、荷斯坦奶牛五个品种共252个牛肉样本的高光谱图像。在ENVI软件中对高光谱图像进行阈值分割并构建掩膜图像,获取样本的感兴趣区域(ROI),并结合伪彩色图对牛肉样本的反射率指数进行可视化表达;采用Kennard-Stone(KS)法对样本集进行划分以提高模型的预测性能;对原始光谱采用卷积平滑(SG)、区域归一化(Area normalize)、基线校正(Baseline)、一阶导数(FD)、标准正态变量变换(SNV)及多元散射校正(MSC)等6种方法进行预处理;采用竞争性自适应重加权算法(CARS)提取特征波长。然后利用颜色矩对不同牛肉样本的颜色特征进行提取;对原始光谱图像进行主成分分析,结合灰度共生矩阵(GLCM)算法,提取主要纹理特征。最后结合偏最小二乘判别(PLS-DA)算法建立牛肉样本基于特征波长、颜色特征以及纹理特征的识别模型。KS法将牛肉样本划分为校正集190个,预测集62个;将未经预处理的光谱数据与经过6种不用预处理的光谱数据进行建模分析,结果发现经FD法处理后的光谱数据所建模型的识别率最高;结合CARS法对经FD法预处理后的光谱数据进行特征波长提取,共提取出22个波长;利用颜色矩和GLCM算法分别提取出每个牛肉样本的9个颜色特征、48个纹理特征。将特征波长数据与颜色、纹理特征信息进行融合建模,结果表明,基于特征光谱+纹理特征的模型识别效果最佳,其校正集与预测集识别率分别为98.42%和93.55%,均高于特征光谱数据模型识别率,说明融合纹理特征后使样本分类信息的表达更加全面;融合颜色特征后模型的校正集识别率均有所增加,但预测集识别率稍逊,颜色特征虽携带了部分有效信息,但这些信息与牛肉样本的相关性不大。因此,寻找与牛肉样本相关性更大的颜色特征是提高模型识别率的重要途径之一。该研究结果为牛肉品种的快速无损识别提供了一定的参考。  相似文献   

20.
多语种情感语音的韵律特征分析和情感识别研究   总被引:2,自引:1,他引:2  
姜晓庆  田岚  崔国辉 《声学学报》2006,31(3):217-221
韵律特征参数的变化是语音信号中情感信息主要体现。为了研究基于少量韵律特征的多语种语音样本情感识别的可行性,以提高情感识别系统对语种信息的鲁棒性,实验选取七种典型的情感状态,对指定句式下同一说话人在汉语、英语、日语多语种语音样本中的基频、能量、时间等韵律参数的动态特性进行统计分析。统计结果表明,不同语种情感语音样本的各种韵律特征参数的变化结构有较好的一致性。在这一结论基础上,利用主元素分析方法(PCA)对多语种混合样本进行了初步的情感识别实验,平均错误率为27.74%,最低识别错误率为11%。可见,通过基本的韵律参数可以实现对几种基本情感忽略语种信息的初步有效识别。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号