排序方式: 共有22条查询结果,搜索用时 15 毫秒
11.
提出了一种采用扩展型双线性变换将耳语音转换为正常语音的方法。根据耳语音在不同频段的共振峰偏移程度不同,将耳语音的频谱进行分段处理,在此基础上建立耳语音转换为正常语音的转换函数。由于耳语音在各频段相对于正常语音非线性偏移,在双线性变换函数中引入扩展因子,使其对频谱的非线性偏移与对共振峰带宽的压缩更加符合耳语音转换为正常语音的实际转换需求,有效减小了转换语音与正常语音的谱失真距离。实验结果表明,本文的转换语音在音质和可懂度上均得到了有效提高。 相似文献
12.
14.
15.
提出一种声带动力学模型参数反演方法,从发声机理角度对声带病变嗓音进行有效区分。依据声带生理组织和伯努利定律构建声带动力学模型,确定模型优化参数向量,耦合声门气流获取模型声门波;利用迭代自适应逆滤波算法获得实际嗓音声门波作为目标声门波;采用遗传优化算法提出通过匹配目标和模型声门波特征参数实现模型参数反演。实验结果表明,表征声门波的各时频域参数匹配相对误差不超过2%;依据反演所获模型参数提出去除声门下压影响的平均归一化缩放系数,克服声带非对称性特征在区分病变嗓音方面的不足,实现病理嗓音的全面有效区分。 相似文献
16.
提出了一种采用感知语谱结构边界参数(PSSB)的语音端点检测算法,用于在低信噪比环境下的语音信号预处理。在对含噪语音进行基于听觉感知特性的语音增强之后,针对语音信号的连续分布特性与残留噪声的随机分布特性之间的不同点,对增强后语音的时-频语谱进行二维增强,从而进一步突出连续分布的纯净语音的语谱结构。通过对增强后语音语谱结构的二维边界检测,提出PSSB参数,并用于端点检测。实验结果表明,在白噪声-10 dB到10 dB的各种信噪比环境下,采用PSSB参数的端点检测算法,相对于其它端点检测算法,更有效地检测出语音的端点。在-10 dB的极低信噪比下,提出的方法仍然有75.2%的正确率。采用PSSB参数的端点检测算法,更适合于低信噪比白噪声环境下的语音端点检测。 相似文献
17.
基于修正Mel域掩蔽模型和无语音概率的耳语音增强 总被引:1,自引:0,他引:1
提出了一种基于修正Mel域听觉掩蔽模型和无语音概率的耳语音增强方法。该方法根据耳语音的发音特点对Mel频率进行修正,对每一帧耳语音信号进行Mel域频带滤波,同时通过无语音概率(SAP)动态地确定每个频带的听觉掩蔽阈值,对不同的听觉掩蔽阈值自适应地调整谱减系数来进行耳语音增强。对增强后的耳语音进行客观和主观测试,结果表明,该方法与其它谱减法相比,能将残留噪声和背景噪声控制在人耳掩蔽阈值下,取得更小的语音失真,主观听觉也得到了很大的改善。 相似文献
18.
提出一种非线性动力学建模仿真发声系统,分类息肉和麻痹喉声源的方法,为声带疾病分类时参数选择提供了依据。首先介绍息肉和麻痹声带力学模型,耦合声门气流产生喉声源,求取喉声源频率(基频)、基频微扰;提出用庞加莱截面,分岔图对模型振动进行非线性分析;改变声带病理参数及声门下压,分析频率参数和混沌参数李雅普诺夫指数的变化。仿真实验结果表明,声带麻痹减小了发声基频,且只在一定压力范围内出现混沌振荡;息肉声带的混沌则分布在整个压力范围内。根据最大李雅普诺夫指数随声门下压变化的差异性分布,有助于识别并分类声带息肉和声带麻痹。 相似文献
19.
针对低信噪比说话人识别中缺失数据特征方法鲁棒性下降的问题,提出了一种采用感知听觉场景分析的缺失数据特征提取方法。首先求取语音的缺失数据特征谱,并由语音的感知特性求出感知特性的语音含量。含噪语音经过感知特性的语音增强和对其语谱的二维增强后求解出语音的分布,联合感知特性语音含量和缺失强度参数提取出感知听觉因子。再结合缺失数据特征谱把特征的提取过程分解为不同听觉场景进行区分地分析和处理,以增强说话人识别系统的鲁棒性能。实验结果表明,在-10 dB到10 dB的低信噪比环境下,对于4种不同的噪声,提出的方法比5种对比方法的鲁棒性均有提高,平均识别率分别提高26.0%,19.6%,12.7%,4.6%和6.5%。论文提出的方法,是一种在时-频域中寻找语音鲁棒特征的方法,更适合于低信噪比环境下的说话人识别。 相似文献
20.
古筝是一种古老的中国传统民族乐器,为一弦一音的弹拨乐器.情感作为古筝演奏中的重要表达成分,受到各种演奏技法的影响.本文分析了各种不同演奏技法所产生的声音信号的频谱以及声谱图特点,并提出了一种基于声谱图有限局部峰值的乐曲信息主干提取方法.乐曲信息主干提取分为时域提取与频域提取两个步骤.首先,义甲触弦瞬间,会出现短暂的非谐波性质的碰撞声,与后续琴弦稳定振动期间的声谱图横条纹形成对比,通过对声谱图进行时域一阶差分,并根据设定阈值二值化,能够准确获得各音符的触弦时间点;其次,在每一音符时间范围内,对声谱图进频域一阶差分,获取各帧频域峰值位置,并对各峰值根据幅值进行排序后保留有限个峰值坐标,同时根据前后音符对比,去除因前一音符声音的延续造成的对后一音符声谱图的影响.通过乐曲声谱图主干提取,能够有效地体现出组成乐曲的各音符的主要信息,为进一步深入分析古筝曲的情绪提供基础. 相似文献