排序方式: 共有12条查询结果,搜索用时 46 毫秒
1.
2.
基于Teager能量算子(TEO)基频的应力影响下的变异语音分类 总被引:4,自引:1,他引:3
变异语音识别是一项极具挑战意义的研究课题,一种解决方法是在前端对语音进行变异分类,然后根据不同变异情况采用相关的处理算法。在各种语音变异中,说话人在战斗机、航天飞机座舱等环境中,身体受到应力(重力)影响时的情况更具有特殊性。其所引起的发音变异有别于因心理的、感知的或生理的因素所引起的变异,目前国内外还鲜见有关应力影响不变异语音分类问题的专门研究。木文从对应力影响下的几种基于基频的语音特征的分析出发,提出了对应力影响下的变异语音和正常语音进行分类的方法。对航空模拟飞行器中采集的小词表实验样本,特定人平均分类正确率达到了93.3%,多说话人分类上确率达到了85.8%。 相似文献
3.
基于音节Lattice的汉语语音检索技术及其索引去冗余方法 总被引:4,自引:0,他引:4
针对网络中越来越多的语音数据,人们迫切地需要基于语义内容的快速、准确的语音检索技术.本文在基于音节Lattice的汉语语音检索研究中,针对传统的向量空间模型检索方法的不足,提出了一种基于词检出实现的语音榆索方法.并针对Lattice索引存在的信息冗余问题,提出了一种基于音节后验概率直方图的索引去冗余方法.实验结果表明,本文的检索方法在性能上明显优于向量空间模型方法;而提出的索引去冗余方法达到了大规模缩减索引尺寸加快检索速度的目的. 相似文献
4.
基于分段的实时声频检索方法 总被引:1,自引:0,他引:1
提出了基于分段的实时声频检索方法,并讨论了在实时检索中的控制策略。该方法将检索目标划分为片段序列,并使用检索窗控制参与检索的片段。在多目标检索中,利用声频的类别信息加快检索速度。实验证明检索方法的速度快、可控性好、实时性强,具有良好的缺失鲁棒性(Robustness),查全率和查准率分别达到100%和99.7%;将声频分类可有效提高多目标检索的速度,声频分类方法的平均正确率为95.7%。解决了声频检索中检索反应滞后时间长、检索速度随检索目标长度增加呈线性下降等问题。 相似文献
5.
基于听觉特性的音频水印能量估计及自适应嵌入算法研究 总被引:9,自引:0,他引:9
基于水印能量对提高水印鲁棒性的重要作用,提出了音频水印载体可以嵌入最大水印能量的估计方法。该方法利用了听觉掩蔽特性及MPEG-2听觉模型,计算音频载体在变换域下每帧数据可以嵌入的水印能量,进而估计整体水印能量,并将能量估计方法应用在自适应水印嵌入算法的模型构造上。实验结果验证了水印鲁棒性随嵌入能量的增加而提高;所提出的自适应水印嵌入模型,能根据音频载体自身的特点动态调整水印嵌入强度,在保证听觉质量的同时,提高了水印嵌入量。克服了通过重复实验判断水印嵌入能量方法的复杂性,以及在嵌入相同能量情况下,采用固定水印嵌入强度系数导致的噪声过大等缺点。 相似文献
6.
分析了由于说话人受到重力加速度变化而产生的变异语音(应力影响下的变异语音)的特点,把变异语音分成主体部分和变异部分两方面进行研究,提出一种动态时间规正与差别子空间相结合的孤立词语音识别方法。该方法构造差别子空间去除变异部分的影响,利用语音的主体部分进行识别,采用动态时间规正技术对语音特征矢量进行长度对齐,并提出了相应的判别标准。实验结果表明,本方法对应力影响下的变异语音具有良好识别效果,对15个词的小词表,系统平均识别率达到98.3%,与正常语音的识别率基本相当。克服了话者在应力影响下由于心理紧张和生理情况的变化,语音发生严重变异,导致常规语音识别系统性能急剧下降的缺点。 相似文献
7.
8.
9.
10.