首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于声带振动模型和声门波的嘶音研究   总被引:1,自引:0,他引:1  
本文根据嘶音的主要病理表现为声带的病变、声门波反映了声带的运动状态,提出基于非对称四质量块声带振动模型及声门波分析一合成的嘶音研究方法。将嘶音信号波形与其声门波、声带振动模型联系起来,通过对正常语音和嘶哑病人术前术后语音信号的声门波和声带振动模型特征参数的研究,给出了常态语音和嘶音的声门波周期性、声带两侧参数对称性等参数的对比结果,分析了模型参数与嘶音生理与病理因素之间的关系。实验表明,基于声门波和声带振动模型的嘶音研究可以揭示嘶音的声学特征参数与病理因素的关系,为实现喉科疾病无接触诊断以及嘶音音质的改善提供理论和实验依据。  相似文献   

2.
根据语音的发音模型,对实际语音信号进行预测分析,并通过逆滤波获取准确的声门体速度波形。利用声带的质量块模型,对声门波进行拟合,获取表征发音者的声带质量块模型特征参数,用于嘶哑语音的分析与诊断.实验结果表明,该分析诊断系统可以提供很有实用价值的拟合数据,还为更深入地研究语音产生机理提供可行的分析方法.  相似文献   

3.
首次建立了光声门图数学模型。以相乘同态信号模型和对声带振动的研究结果为基础,提出、研究并实现了光声门图信号数字处理。仪器使用结果表明,光声门图技术对喉科学、艺术嗓音、语言学、语音声学及语言信号数字处理等领域具有广泛和重要的应用价值。  相似文献   

4.
嗓音的测试与处理系统   总被引:2,自引:0,他引:2       下载免费PDF全文
本文介绍了一种无侵入、直接、客观、定量地反映发声过程中声带振动特性及噪音嘶哑程度的自动测试与处理系统。该系统具有多路生理信号检测,电声门图参数提取,谐波噪声比分析,扰动分析,频谱分析,语谱图分析等多种信息处理功能。实验 临床使用结果表明,本系统在正常与病变发声检查、艺术噪音测试等方面具有重要应用价值。  相似文献   

5.
建立蝙蝠发声组织模型对超声机理研究及在智能设备的应用具有重要意义。根据蝙蝠喉部发声组织结构特点,通过有限元方法构建了蝙蝠的3种不同发声组织模型,分析了尺寸、材料力学参数、组织结构和张力4个因素对发声组织特征频率的影响。结果表明,如果用人类声带,按比例缩小构建蝙蝠喉部组织模型,蝙蝠无法发出超声波。构建组织结构含甲状软骨和声带的半鼓状模型和只含声带的条状模型,两种模型的特征频率相近且在合理的参数域内均无法达到超声范围。而含膜条状模型的特征频率可以通过张力进行超声频率的调节,这与文献的实验结果一致。因此,可基于含膜条状模型对蝙蝠喉管发声组织进行建模及其发声机理研究。  相似文献   

6.
本文介绍了一种无侵入、直接、客观、定量地反映发声过程中声带振动特性及嗓音嘶哑程度的自动测试与处理系统.该系统具有多路生理信号检测,电声门图参数提取,诣波噪声比分析,扰动分析,频谱分析,语话图分析等多种信息处理功能.实验与临床使用结果表明,本系统在正常与病变发声检查、艺术嗓音测试等方面具有重要应用价值.  相似文献   

7.
提出一种声带动力学模型参数反演方法,从发声机理角度对声带病变嗓音进行有效区分。依据声带生理组织和伯努利定律构建声带动力学模型,确定模型优化参数向量,耦合声门气流获取模型声门波;利用迭代自适应逆滤波算法获得实际嗓音声门波作为目标声门波;采用遗传优化算法提出通过匹配目标和模型声门波特征参数实现模型参数反演。实验结果表明,表征声门波的各时频域参数匹配相对误差不超过2%;依据反演所获模型参数提出去除声门下压影响的平均归一化缩放系数,克服声带非对称性特征在区分病变嗓音方面的不足,实现病理嗓音的全面有效区分。   相似文献   

8.
提出一种非线性动力学建模仿真发声系统,分类息肉和麻痹喉声源的方法,为声带疾病分类时参数选择提供了依据。首先介绍息肉和麻痹声带力学模型,耦合声门气流产生喉声源,求取喉声源频率(基频)、基频微扰;提出用庞加莱截面,分岔图对模型振动进行非线性分析;改变声带病理参数及声门下压,分析频率参数和混沌参数李雅普诺夫指数的变化。仿真实验结果表明,声带麻痹减小了发声基频,且只在一定压力范围内出现混沌振荡;息肉声带的混沌则分布在整个压力范围内。根据最大李雅普诺夫指数随声门下压变化的差异性分布,有助于识别并分类声带息肉和声带麻痹。  相似文献   

9.
提出一种非线性动力学建模仿真发声系统,分类息肉和麻痹喉声源的方法,为声带疾病分类时参数选择提供了依据。首先介绍息肉和麻痹声带力学模型,耦合声门气流产生喉声源,求取喉声源频率(基频)、基频微扰;提出用庞加莱截面,分岔图对模型振动进行非线性分析;改变声带病理参数及声门下压,分析频率参数和混沌参数李雅普诺夫指数的变化。仿真实验结果表明,声带麻痹减小了发声基频,且只在一定压力范围内出现混沌振荡;息肉声带的混沌则分布在整个压力范围内。根据最大李雅普诺夫指数随声门下压变化的差异性分布,有助于识别并分类声带息肉和声带麻痹。   相似文献   

10.
王世谦 《应用声学》1989,8(3):43-47,42
现代言语声学理论与实验已大体上说明了正常(normal)语音产生的原理。这指的是,我们对语音产生(除神经外的)的生理过程、声道内(以下在许多词组中声与音二字沿习惯用,具有同意;除声明外,声源均指经喉部声带调制气流转化成声的声源;“声道”包括声带;“声道内”指声门以上,不包括声带)声源和声道滤波的物理过程已基本搞清。但是对噪声在不同声区时的声源情况还了解较少;声源与声门上/下的作用还颇待研究;对于控制嗓声系统各部统  相似文献   

11.
语音带宽扩展是为了提高语音质量,利用语音低频和高频之间的相关性重构语音高频的一种技术。高斯混合模型法是语音带宽技术中被广泛应用的一种方法,但是,该方法的映射函数是分段线性函数,且没有考虑语音前后帧的相关信息。因此,提出了一种基于条件受限玻尔兹曼机的方法。该方法利用条件受限玻尔兹曼机提取了语音信号的帧间信息,同时将语音低频、高频特征参数映射为高阶统计特性,深层发掘和模拟了语音低频和高频之间的非线性关系。客观和主观对比测试结果都表明,该方法性能优于传统的高斯混合模型方法。   相似文献   

12.
提出了一种融合梅尔谱增强与特征解耦的噪声鲁棒语音转换模型,即MENR-VC模型。该模型采用3个编码器提取语音内容、基频和说话人身份矢量特征,并引入互信息作为相关性度量指标,通过最小化互信息进行矢量特征解耦,实现对说话人身份的转换。为了改善含噪语音的频谱质量,模型使用深度复数循环卷积网络对含噪梅尔谱进行增强,并将其作为说话人编码器的输入;同时,在训练过程中,引入梅尔谱增强损失函数对模型整体损失函数进行了改进。仿真实验结果表明,与同类最优的噪声鲁棒语音转换方法相比,所提模型得到的转换语音在语音自然度和说话人相似度的平均意见得分方面,分别提高了0.12和0.07。解决了语音转换模型在使用含噪语音进行训练时,会导致深度神经网络训练过程难以收敛,转换语音质量大幅下降的问题。  相似文献   

13.
示波器广泛应用于大学物理实验教学中,相较于传统的模拟示波器,数字示波器将输入模拟信号转换为数字信号进行显示。设计了一个新的使用数字示波器进行人声音识别的综合性实验。实验中把压电陶瓷片贴于测试者的喉部靠近声带处,声带的振动转换为电信号后,使用数字示波器解析测试者的声音特征。在此基础上建立了含多个测试者的语音样本数据库,通过对于测试者声音频率的比对实现了对特定测试者的语音识别。该实验拓宽了示波器的实验教学内容,取得了良好的教学效果。  相似文献   

14.
提出了一种文本无关说话人识别的全特征矢量集模型及互信息评估方法,该模型通过对一组说话人语音数据在特征空间进行聚类而形成,全面地反映了说话人语音的个性特征。对于说话人语音的似然度计算与判决,则提出了一种互信息评估方法,该算法综合分析距离空间和信息空间的似然度,并运用最大互信息判决准则进行识别判决。实验分析了线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)两种情况下应用全特征矢量集模型和互信息评估算法的说话人识别性能,并与高斯混合模型进行了比较。结果表明:全特征矢量集模型和互信息评估算法能够充分反映说话人语音特征,并能够有效评估说话人语音特征相似程度,具有很好的识别性能,是有效的。  相似文献   

15.
正弦语音模型是一种新的语音信号处理模型。为考察这一模型的效果,我们在微机上实现了一个基于该模型的语音分析/合成系统。本文介绍该系统的基本原理,并通过比较输入、输出系统的语音波形形状及对音节/sα/的非正式辨听,对这种分析/合成方法进行非正式评价。结果表明,该方法失真较小。  相似文献   

16.
提出了一种基于极大似然的噪声对数功率谱估计方法,采用高斯混合模型对每一个频带上的功率谱包络构建统计模型,将时序包络划分为语音和非语音类,它们分别对应于高斯混合模型的两个高斯分量,描述语音和非语音的统计分布,其中非语音高斯分量的均值即为噪声功率谱的最优估计.采用序贯学习的方法,在极大似然准则下逐帧更新模型参数,并逐帧给出噪声功率谱的最优估计值。此外,由于序贯更新过程中语音信号长时缺失,容易导致模型失稳,提出了一种在线的最小描述长度准则(MDL)来判断语音信号是否长时缺失,从而保证了模型的稳定性.实验表明,算法性能整体优于经典的MS和IMCRA算法。   相似文献   

17.
现阶段用于语音转换的深度学习方法多是通过使用大量的训练数据来生成高质量的语音。本文提出了一种基于平均模型和误差削减网络的语音转换框架,可用于有限数量的训练数据。首先,基于CBHG网络的平均模型使用排除源说话人和目标说话人的多说话人语音数据进行训练;然后,在有限数量的目标语音数据下对平均模型执行自适应训练;最后,提出一种误差削减网络,可以进一步改善转换后语音的质量。实验表明,所提出的语音转换框架可以灵活地处理有限的训练数据,并且在客观和主观评估方面均优于传统框架。  相似文献   

18.
黄德智  蔡莲红 《声学学报》2006,31(6):542-548
在源滤波器模型的基础上,利用统计学习方法,建立了一种面向声音变换的混合参数化模型。该模型包括浊音声学模型、清音声学模型和韵律补偿模型三部分。基于线性预测分析和mel倒谱分析的浊音声学模型,刻画了说话人声腔的共振特性。基于线性预测分析和噪声源分析的清音声学模型,反映了说话人发清音的特点。基于统计学习方法的韵律补偿模型描述了音高、能量与时长等分布特性。在该混合参数化模型的基础上,提出了一个声音变换算法,并将其应用到汉语音节的变换问题上。实验结果表明,对清浊音和韵律特性分别建模的变换算法能够提高重建语音的清晰度和可懂度,缩小重建语音与目标语音之间的感知距离,使重建语音具有目标说话人的韵律特征.  相似文献   

19.
张玉梅  胡小俊  吴晓军  白树林  路纲 《物理学报》2015,64(20):200507-200507
对给定的英语音素、单词和语句进行了采集并完成预处理. 分别应用互信息法和Cao 氏法确定了实际采集的语音信号序列的延迟时间和嵌入维数, 以完成语音序列的相空间重构. 通过计算实际采集的语音信号序列的最大Lyapunov指数, 完成了语音信号的混沌特性识别, 判定其具有混沌特性. 引入Volterra级数, 提出了一种具有显式结构的语音信号非线性预测模型. 为克服最小均方误差算法在Volterra模型系数更新时固有的缺点, 在最小二乘法基础上, 应用基于后验误差假设的可变收敛因子技术, 构建了一种基于Davidon-Fletcher-Powell算法的二阶Volterra 模型(DFPSOVF), 并将其应用于具有混沌特性的语音信号序列预测. 仿真结果表明: DFPSOVF非线性预测模型对于单帧和多帧语音信号均具有更好的预测精度, 优于线性预测模型, 并且能够很好地反映语音序列变化的趋势和规律, 完全可以满足语音预测的要求; 可以根据语音信号序列的嵌入维数选取预测模型的记忆长度. 所提出模型可以为语音信号重构和压缩编码开辟一条新途径, 以改善语音信号处理方法的复杂度和处理效果.  相似文献   

20.
为了从带噪信号中得到纯净的语音信号,提出了一种采用性别相关模型的单通道语音增强算法。具体而言,在训练阶段,分别训练了与性别相关的深度神经网络-非负矩阵分解模型用于估计非负矩阵分解中的权重参数;在测试阶段,提出了一种基于非负矩阵分解和组稀疏惩罚的算法用于判断测试语音中说话人的性别信息,然后再采用对应的模型估计权重,并结合已训练好的字典进行语音增强。实验结果表明所提算法在噪声抑制量及语音质量上,均优于一些基于非负矩阵分解的算法和基于深度神经网络的算法。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号