首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
连接时序分类准则声学建模方法优化   总被引:2,自引:1,他引:1       下载免费PDF全文
对基于连接时序分类准则(connectionist temporal classification,CTC)的端到端声学建模方法进行研究和优化。研究分析了不同声学特征、建模单元以及神经网络结构对CTC声学模型性能的影响,针对CTC模型中blank符号共享导致的建模缺陷提出了建模单元相关的非共享blank方法进行改进,并引入融合建模单元关联信息的模型初始化方法进一步提高CTC模型的性能。在300小时标准英文数据集Switchboard的实验结果显示,结合非共享blank、时延神经网络以及融合建模单元关联信息的初始化方法,CTC声学模型相对于基线系统在词错误率上取得绝对1.1%的下降,同时在训练速度上取得3.3倍的提高,实验结果证明本文针对端到端声学建模提出的优化方法是有效的。   相似文献   

2.
基于决策树的汉语三音子模型   总被引:8,自引:2,他引:6  
基于决策树理论的上下文相关声学模型在英语语音识别中已经得到了比较深入的研究和应用,但在汉语语音识别中的应用则研究的比较少。本文基于决策树理论建立了汉语语境相关模型-三音于模型,讨论了决策构建模所要解决的几个重要问题:(1)基本建模单元集的选择,(2)音子类别集的设计,(3)评估函数的选择,(4)停止准则的选择,(5)决策树的建立和三音子模型的生成,本文着重分析了两种不同建模单元的性能:对音子类别集的设计提出了一些一般性的准则,并对我们设计的类别集进行了统计分析;分析了三音子模型在语音库的覆盖程度。实验结果表明,基于决策树的三音子声学模型建立的识别系统与双音子声学模型系统比较,误识率下降了24.7%。  相似文献   

3.
提出了一种基于对识别器识别错误的统计分析建立音节混淆字典,并应用该音节混淆字典作为识别器的先验知识来校正结果的识别方法。这种近似的音节混淆字典可以分与语境无关和相关两种情况讨论,作为一种先验知识,它综合地刻画了说话人的发音特征、识别器的识别特征以及二者之间的相对关系。实验中,我们应用语境无关/相关的音节混淆字典于识别带上海口音的普通话识别器,使其音节误识率分别下降15%及20%。在此基础上,本论文结合常规的声学模型参数重估自适应MAP(最大后验概率)算法进一步研究了这种方法应用于语音识别系统的实际效果。结果证明,二者互为补充,更大地提高了识别器的精度。  相似文献   

4.
为了实现工业现场对特种钢材的快速检测与种类识别,采用基于光纤传能的移动式激光诱导击穿光谱(LIBS)样机对14种特种钢材进行光谱数据的采集与分析,采用预选谱线并遍历组合的降维方法与支持向量机(SVM)相结合的算法对特钢材料的光谱进行快速分类。分别将原始光谱数据、归一化处理后的光谱数据、归一化处理+遍历组合优选谱线数据作为SVM分类模型的输入向量,并对比了不同输入向量下模型对特钢识别的准确度。结果表明:在事先选出的51条特征谱线作为输入变量的基础上,归一化光谱数据作为SVM分类模型的输入特征时,识别准确度达到95.71%,明显高于使用原始光谱数据作为输入向量时SVM分类模型的准确度11.43%。进一步地,使用MATLAB程序遍历谱线组合,通过遍历各种谱线组合选出最优的输入谱线组合,当优选6条特定的谱线时,对特钢种类识别的准确度达到100%,且建模速度也有相应提升。可以看出,当预选出大量常见特征数据时,机器自动选取特征与人工挑选谱线相比,具有明显优势,基于此降维方法的SVM算法模型在LIBS快速分类技术中具有很好的工业应用前景。  相似文献   

5.
重音是重要的语调特征,重音合成技术可以提高语音的自然度和表现力。针对重音的局部凸显性,该文提出了声学特征凸显度的表示方法,分析了不同韵律位置(韵律词首、中、尾,韵律短语首、中、尾等)重音音节的声学特征凸显度,发现在韵律单元末(韵律词末音节和韵律短语末韵律词)的重音其基频最大值凸显度要低于非韵律单元末重音,提出了基于声学特征凸显度的非线性的重音声学参数生成算法,解决了传统重音声学参数线性修改算法的修改幅度不足或过大的问题。采用该算法建立了基于隐Markov模型的支持重音合成的语音合成系统。实验表明,该系统可以有效合成带有重音的语音,提高了合成语音的自然度和表现力。  相似文献   

6.
重音是重要的语调特征,重音合成技术可以提高语音的自然度和表现力。针对重音的局部凸显性,该文提出了声学特征凸显度的表示方法,分析了不同韵律位置(韵律词首、中、尾,韵律短语首、中、尾等)重音音节的声学特征凸显度,发现在韵律单元末(韵律词末音节和韵律短语末韵律词)的重音其基频最大值凸显度要低于非韵律单元末重音,提出了基于声学特征凸显度的非线性的重音声学参数生成算法,解决了传统重音声学参数线性修改算法的修改幅度不足或过大的问题。采用该算法建立了基于隐Markov模型的支持重音合成的语音合成系统。实验表明,该系统可以有效合成带有重音的语音,提高了合成语音的自然度和表现力。   相似文献   

7.
汉语连续语音识别中一种新的音节间相关识别单元   总被引:1,自引:0,他引:1  
考虑汉语连续语音中的协同发音现象对语音识别性能的提高是非常重要的。针对汉语语音的特点,提出了一种新的在汉语连续语音识别中考虑音节间协同发音现象,对声学模型进行细化的识别单元。然后基于语音学知识对音节间上下文影响进行分类,实现单元间状态参数的共享,降低了模型的复杂程度,保证了模型的可训练度。这种方法和传统方法的最大不同在于:这种方法完全利用语音学知识进行聚类,而传统方法采用数据驱动的聚类方式。识别实验表明,基于语音学分类的音节间相关识别单元对识别性能有明显的改善,系统的首选误识率降低了17%。  相似文献   

8.
结合卷积神经网络的浅海有源探测信道匹配   总被引:1,自引:1,他引:0       下载免费PDF全文
信道匹配方法在有源探测领域是一种重要的提升检测信噪比的方法。针对非确知海底参数环境下的有源探测信道匹配问题,提出一种结合卷积神经网络进行信道匹配的算法。该算法基于海底参数扰动开展声场仿真生成卷积网络训练数据;首先通过分类网络将信号按照海底底质类型分类,在每个分类区间内采用单独的卷积网络反演海底参数;然后结合声场模型估计信道传递函数,进行信道匹配,从而在非确知环境下抑制多途影响,提升回波检测能力。仿真与实验结果表明,该算法能够在不确知海底环境条件下,有效估计信道传递函数,实现信道最优化匹配,在实验条件下可提高回波检测信噪比4 dB左右。相比传统方法,该算法可以在海底参数不确知条件下对低接收信噪比的信号实现信道匹配,同时不需要高信噪比的实验参考信号,有效提高了信道匹配方法的环境宽容性。   相似文献   

9.
针对电站锅炉炉内三维温度场重建问题,基于声学理论构建数学模型.提出两种基于奇异值分解法(Singular Value Decomposition,SVD)的正则化算法,利用少量声学数据,对炉膛火焰分布的几种典型模型进行仿真重建.采用不同标准差的高斯噪声对两种算法的抗噪声能力进行检验.仿真结果表明,正则化SVD算法可以解决严重不适定的重建问题,重建温度场能够准确反映温度场分布,并且算法具有一定的抗噪声能力.TSVD正则化算法重建速度更快,抗噪声能力更强,适用于燃烧情况复杂的电站锅炉.  相似文献   

10.
发音错误检测与诊断(MDD)任务的专家标注数据稀缺。从添加发音模型更高效地利用有限数据建模发音规律,辅助基于音素识别的MDD的思路出发,提出一种同时融合声学和文本信息,在理论上更完备地建模发音错误产生过程的声学发音模型。基于发音错误产生过程不同部分的声学关联性,该模型通过与音素识别模型共享声学编码器网络参数,以多任务学习方式联合优化,实现辅助建模。并且,提出声学置信度掩蔽-预测训练方式进一步强化两个任务的联系,提高辅助建模效率。实验表明,声学发音模型能够有效建模发音错误规律;利用其辅助音素识别模型建模后,MDD系统在发音错误检测、诊断和音素识别上分别有4.9%,9.5%和14.0%的提升;声学置信度掩蔽-预测训练方法提高了辅助建模效率,掩蔽参数或联合优化参数选择也会影响辅助建模效果。  相似文献   

11.
黄德智  蔡莲红 《声学学报》2006,31(6):542-548
在源滤波器模型的基础上,利用统计学习方法,建立了一种面向声音变换的混合参数化模型。该模型包括浊音声学模型、清音声学模型和韵律补偿模型三部分。基于线性预测分析和mel倒谱分析的浊音声学模型,刻画了说话人声腔的共振特性。基于线性预测分析和噪声源分析的清音声学模型,反映了说话人发清音的特点。基于统计学习方法的韵律补偿模型描述了音高、能量与时长等分布特性。在该混合参数化模型的基础上,提出了一个声音变换算法,并将其应用到汉语音节的变换问题上。实验结果表明,对清浊音和韵律特性分别建模的变换算法能够提高重建语音的清晰度和可懂度,缩小重建语音与目标语音之间的感知距离,使重建语音具有目标说话人的韵律特征.  相似文献   

12.
近红外光谱药品鉴别作为识别假冒伪劣药品的一种有效技术手段,已被广泛应用到各大医疗行业和药品监督管理机构,并结合模式识别建模方法在基层药品打假中得到较好的推广。由于传统建模方法很难满足药品鉴别中大规模、多分类、快速建模等问题,因此采用一种基于波形叠加极限学习机(SWELM(CS))分类方法对光谱数据进行鉴别。通过选用极限学习机(ELM)作为光谱药品分类器,使得分类模型具有快速学习能力以及对训练样本不敏感的特点;由于极限学习机的连接权值和隐层神经元阈值是随机生成导致网络稳定性差,因此结合布谷鸟搜索算法优化分类模型参数;采用反双曲线正弦函数与Morlet小波函数叠加的激励函数代替ELM原有的单一激励函数改善了分类模型的收敛速度和稳健性。通过上述改进方法使得SWELM(CS)具有对训练样本不敏感性,布谷鸟参数优化的分类稳定性、波形叠加函数的强收敛性与信号特征提取能力。该方法为核函数提供的信号特征提取及拟合的思想,可推广到其他学习算法中以获取更高的分类准确度及稳定性。该实验选定西安杨森制药厂生产的249个近红外光谱药品样本作为研究的主要对象,重点研究光谱药品的二分类和多分类实验,实验证明SWELM(CS)分类器相比BP神经网络、标准ELM以及粒子群优化ELM等传统分类器算法具有更高的分类准确度、分类稳定性及更小的训练样本敏感性。  相似文献   

13.
随着近年来光谱探测仪器灵敏度、精确度和易用度的不断提升,光谱技术已经深入到各行各业的物质成分的鉴定与分析中。对于空间目标的光谱观测是传统光学观测的重要拓展之一,因其具有的非接触、无损伤等优点而备受关注,然而由于观测条件所限,空间目标的光谱数据量极小,通过传统方法对其进行分类分析达不到较好效果,必须探求提高分类精度的方法。首先,通过1.2 m空间目标光学望远镜上搭载的光谱相机终端获取空间目标高光谱图像;再通过天文学测光IRAF方法,提取空间目标的一维光谱数据;为对空间目标光谱进行分类,提出一种结合多种深度学习方法解决小样本数据量的空间目标分类问题。该方法应用密度聚类方法将空间目标粗糙分类,一维生成对抗网络方法增加空间目标数据,一维卷积神经网络方法将空间目标精细分类,三者组合进而达到较好的实验效果,整体精度约为79.1%(基于密度聚类、过采样、一维卷积神经网络方法组合、基于K-means、一维生成对抗网络、一维卷积神经网络方法组合和基于K-means、过采样、一维卷积神经网络方法组合的整体精度分别约为78.4%,77.9%和77.2%)。粗糙分类模型中,密度聚类方法比K-means方法整体精度平均高出约为0.67%;数据增广模型中,一维生成对抗网络方法比过采样方法整体精度平均高出约为1.52%;精细分类模型中,一维卷积神经网络方法二层网络比三层网络整体精度平均仅高出约为0.003%,但是运算时间更长。四种组合方法精度均高于单一方法。实验结果表明本文提出的组合方法在小样本空间目标类别未知情况下,可实现细分类且精度较高,为实现空间目标极小数据量下的图谱一体化分析,提供一定参考价值。  相似文献   

14.
声学温度场检测技术通过多路径声波传播时间数据,反演被测区域的温度分布。提供了一种高精度的三维复杂温度场的声学测量方法。首先从射线声学角度给出了三维非均匀温度场中声波传播路径的数学模型。在此基础上,将三维温度场的重建问题转化为声波传播路径的求解和温度场的反演问题,建立了基于多项式修正径向基函数(RBF-PR)和改进的Tikhonov正则化三维温度场重建算法。采用两种典型的炉膛三维温度场模型,在信噪比SNR=35 dB下进行了数值模拟,分析了声波传播路径在非均匀温度场中的弯曲特性、算法的重建质量和抗噪性,同时进行了实际炉膛内二维温度场的重建。结果表明了提出的考虑声线弯曲的温度场重建算法具有精度高,抗噪性强、适用性好的特点,为实现高精度的复杂温度场的声学测量提供了有效方法。   相似文献   

15.
大量废弃的塑料制品给生态环境造成严重破坏,当务之急是要对塑料进行分类回收。传统的分类方法普遍存在成本高,效率低,操作复杂等问题,不能满足工业生产的需要。激光诱导击穿光谱技术由于具备简单灵活,快速灵敏等优点,在物质鉴别领域有广泛应用。采用激光诱导击穿光谱技术结合主成分分析(PCA)和支持向量机(SVM)算法对20种塑料进行分类识别研究。由于目前有关塑料分类识别速率的研究报道较少,该实验在保证识别准确率的前提下,进一步研究和分析实验过程耗费的时间,满足工业生产中快速分类的要求。每种塑料采集100组光谱数据,随机选取50组数据作为训练集建立模型,余下50组作为测试集测试模型的分类识别效果,所以训练集和测试集各有1 000组光谱数据。将训练集的数据不加处理地输入SVM中进行训练,并采用5折交叉验证建立最佳模型,此时测试集的识别准确率为99.90%,建模时间为1小时58分41.13秒,预测时间为11.96 s。由此可见,单纯使用SVM算法可以得到很高的准确率,但是需要耗费大量时间。为了提高实验效率,引入主成分分析算法,将原来的高维数据变换成低维数据,并用降维后的数据训练模型。针对不同的主成分个数,均采用随机训练十次再取平均值的方法获得相关数值。实验表明,当选取主成分个数为13时,得到相应的识别准确率为99.80%,而PCA处理时间为1.44 s,建模时间为12.16 s,预测时间仅为0.02 s。虽然PCA算法结合SVM算法在对20种塑料进行分类识别时准确率有轻微下降,但是大大减少了模型训练的时间,实验效率得到很大程度的提高。结果表明,结合两种算法辅助激光诱导击穿光谱可以对塑料进行快速准确的分类识别。  相似文献   

16.
分别基于近红外和电子鼻融合数据、近红外数据以及电子鼻数据建立判别烟叶清香型、中间香型和浓香型三种香型风格的定性判别模型,结果表明虽然三种模型的建模准确率差异不大,都超过了89.00%,但基于融合数据建立的模型对中间香型和浓香型的预报准确率分别为82.67%和80.00%,比仅仅利用近红外数据建立模型的72.41%和73.33,也比仅仅基于电子鼻数据建立模型的68.97%和53.33%都有明显的提高。融合后预报准确率提高的可能原因是:电子鼻风味分析仪对于影响中间香型和浓香型的烟叶致香成分感应更加灵敏,捕获的信息也更多,这些新的信息可以作为NIR数据信息的有利补充,可用于建立烟叶香型分类判别准确率更高的模型。同时本研究还基于相同的融合数据,对比不同数据挖掘算法建模和预报结果差异性。实验结果表明:人工神经网络的建模结果高于支持向量机建模,人工神经网络模型的预报结果准确率只有65.00%,远低于支持向量机模型的预报结果的83.75%。这也验证了支持向量机算法可以在建模过程中减少过拟合。该研究可以为快速鉴别烟叶香型风格提供支撑,而且随着研究的深入可以争取为烟草系统的专业评吸人员提供辅助的鉴别方法。  相似文献   

17.
快速准确识别病原菌在防止传染病的传播、帮助对抗抗菌素耐药性和改善病人预后方面起着关键作用。拉曼光谱结合机器学习算法能够简单快捷地对病原菌进行无标记检测。然而,病原菌种类和表型繁多,并且深度学习需要依赖大量样本训练,而收集大批量病原菌拉曼光谱劳神费力,且易受荧光等因素影响。针对上述问题,提出一种基于WGAN-GP数据增强方法和ResNet结合的病原菌拉曼光谱检测模型。采用五种常见眼科病原菌的拉曼光谱。将采集到的原始数据归一化作为ResNet和传统卷积神经网络(1D-CNN)的输入,将经过SG滤波、 airPLS基线校正、 PCA降维等预处理后的数据作为K近邻(KNN)的输入,对比分析发现ResNet模型效果最优,其分类精度可达96%;搭建Wasserstein生成式对抗网络加梯度惩罚模型(WGAN-GP),生成大量与真实数据相似的高分辨率光谱数据。同时与偏移法、深度卷积生成式对抗神经网络(DCGAN)2种数据增强方法进行比对,证明WGAN-GP的可靠性;为验证生成数据可以丰富数据多样性,进而提高分类精度,将扩充后的数据集重新放入ResNet进行训练,最终WGAN-GP结合ResNet的分...  相似文献   

18.
快速、有效地识别饮用水中污染物类别对于降低突发饮用水污染事件影响十分重要。目前基于紫外-可见光光谱法的饮用水污染物判别模型大多使用主成分分析(PCA)进行特征提取,然而,对于光谱相似度较高的有机污染物,仅从数据驱动的角度提取其方差最大的方向作为特征进行识别效果往往不佳。针对有机污染物光谱数据多重共线性以及谱峰重叠干扰的问题,开展了基于连续投影算法(SPA)和多分类支持向量机(M-SVM)的紫外-可见光光谱饮用水有机污染物判别方法研究。首先,使用紫外光谱仪测量苯酚、对苯二酚、间苯二酚和间苯二胺的原始光谱数据并进行预处理,在对四种污染物进行了波长与浓度的相关关系对比分析后,发现苯酚和间苯二酚、对苯二酚和间苯二胺的谱峰重叠较为严重;特征提取时,引入SPA筛选有机污染物紫外-可见光光谱数据的特征波长组合,并对不同波长个数时的光谱吸光度进行多元线性回归分析,选取对应最小预测标准偏差的参数及波段组合作为最优参数组合;基于最优特征波长组合,构建基于多分类SVM的饮用水有机污染物分类识别模型;最后,对比分析了全光谱、 PCA及SPA特征提取后的光谱数据在不同分类方法及不同污染物浓度下的分类效果,进一步说明了SPA的适用性和稳定性。实验结果表明, SPA作为一种提取光谱数据原始特征波段的方法,可以有效的对有机污染物的紫外-可见光光谱进行特征提取,提升不同物质之间的差异,在一定程度上消除多重共线性和谱峰重叠干扰,从而提高分类模型的准确率。该方法对于解决饮用水中谱峰重叠的污染物类型判别问题具有参考价值。  相似文献   

19.
近红外光谱是热门的食品检测方法之一,对于这种高维光谱数据的分析常常需采用数据降维算法提取其中的特征,然而绝大多数算法都只能针对单个数据集进行分析。虽然已有基于对比学习的对比主成分分析成功应用于不同水果表面农残的近红外光谱检测中,但是该方法只能以线性的方式组合原有特征,特征提取效果存在局限性,并且需要调节对比参数来控制背景集影响,需要消耗更大的时间成本。cVAE(contrastive variational autoencoder)是一种基于对比学习和变分自编码器的改进算法,被用于图像去噪和RNA序列分析中,它仍然具备分析多个数据集的特点,同时因为组合了神经网络的概率生成模型而具备了提取非线性隐含特征的能力。将cVAE算法应用于近红外光谱分析,建立了准确的近红外光谱数据降维模型。在实际验证中,使用cVAE算法对购买的不同品牌和批次纯牛奶中掺假三聚氰胺进行检测。结果表明,使用VAE算法只能区分出不同品牌和批次的纯牛奶,而其中是否掺假三聚氰胺这一重要信息无法表现出来;而使用cVAE算法进行数据分析时,由于添加了背景数据集分离了无关变量,能够清晰的将有无掺假三聚氰胺的样本分类。这说明了,cVAE不仅具备了cPCA(contrastive principle component analysis)在近红外光谱数据降维中的优势,而且具备提取非线性特征的能力,同时不需要调节可变参数,能够更方便地建立近红外光谱降维模型。  相似文献   

20.
为提高利用红外光谱数据鉴别中药材产地的预测模型效果,应该选用合适的数据预处理方法和合适的算法。针对具有3 448个特征(波长551~3 998 nm)的658条红外光谱中药材数据,借助于支持向量机(SVM)算法,研究了10种基于样本预处理方法(不做预处理、最大最小归一化、标准化、中心化、移动平均平滑、 SG平滑滤波、多元散射校正、正则化、一阶导数和二阶导数法)与5种基于特征波长预处理方法(不做预处理、中心化、最大最小归一化、标准化和正则化)的组合(共50种)对产地模型预测精度和稳定性的影响。结果表明:合适的数据预处理对提高模型精度是必要的;标准化和最大最小正则化方法光谱的预处理建模效果较好,其预测系数值约85%;基于特征的预处理对模型预测效果改进小。只做光谱预处理或基于特征预处理的预测稳定性值近似相等(两类方式的决定系数平均值都近64%);基于样本+特征的组合预处理方法中,二阶导数+标准化处理和二阶导数+正则化组合处理方法的模型预测效果好,其决定系数R2达到近94%;而中心化+正则化组合处理达不到直接采用原始数据(不做数据预处理)的建模效果,该方法预测效果最差。该...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号